std::mbsrtowcs

< cpp‎ | string‎ | multibyte

定义于头文件 `<cwchar>`
std::size_t mbsrtowcs( wchar_t* dst, const char** src, std::size_t len, std::mbstate_t* ps );

转换始于 *ps 所描述的转换状态，来自首元素为 *src 所指向的数组的空终止多字节字符序列，到其宽字符表示。若 dst 非空，则存储转换后的字符于 dst 所指向的 wchar_t 数组的相继元素。不写入多于 len 个宽字符到目标数组。

如同以调用 std::mbrtowc 转换每个多字节字符。若满足下列条件则转换终止：

转换并存储了多字节空字符。设置 *src 为空指针并令 *ps 表示初始迁移状态。
遇到任何非法多字节字符（按照当前 C 本地环境）。设置 *src 指向首个未转换的多字节字符的起始。
将存储的下个宽字符将超出 len 。设置 *src 指向首个未转换的多字节字符的起始。若 dst 为空指针则不检查此条件。

参数

dst	-	指向将存储结果的宽字符数组的指针
src	-	指向空终止多字节字符串首元素的指针
len	-	dst 所指向的字符数组中可用的宽字符数
ps	-	指向转换状态对象的指针

返回值

成功时返回写入字符数组的宽字符数，排除终止的 L'\0' 。若 dst 为空指针，则返回给定无限定长度则本会写入的宽字符数。

转换错误时（若遇到非法多字节字符）返回 static_cast<std::size_t>(-1) ，存储 EILSEQ 于 errno ，并令 *ps 留在未指定状态。

注解

此函数移动 src 指针指向被转换的多字节字符串结尾。若 dst 为空指针则这不发生。

示例

运行此代码

#include <iostream>
#include <vector>
#include <clocale>
#include <cwchar>
 
void print_as_wide(const char* mbstr)
{
    std::mbstate_t state = std::mbstate_t();
    std::size_t len = 1 + std::mbsrtowcs(NULL, &mbstr, 0, &state);
    std::vector<wchar_t> wstr(len);
    std::mbsrtowcs(&wstr[0], &mbstr, wstr.size(), &state);
    std::wcout << "Wide string: " << &wstr[0] << '\n'
               << "The length, including '\\0': " << wstr.size() << '\n';
}
 
int main()
{
    std::setlocale(LC_ALL, "en_US.utf8");
    const char* mbstr = u8"z\u00df\u6c34\U0001f34c"; // 或 u8"zß水🍌"
    print_as_wide(mbstr);
}

输出：

Wide string: zß水🍌
The length, including '\0': 5

参阅

mbrtowc	给定状态，转换下个多字节字符为宽字符 (函数)
wcsrtombs	给定状态，转换宽字符串为窄多字节字符串 (函数)
do_in [虚]	从 externT 转换字符串为 internT ，如在从文件读取时 (`std::codecvt<InternT,ExternT,State>` 的虚受保护成员函数)

语言
标准库头文件
自立与有宿主实现
具名要求
语言支持库
概念库 (C++20)
诊断库
工具库
字符串库
容器库
迭代器库
范围库 (C++20)
算法库
数值库
本地化库
输入/输出库
文件系统库 (C++17)
正则表达式库 (C++11)
原子操作库 (C++11)
线程支持库 (C++11)
技术规范

空终止字符串
字节字符串
多字节字符串
宽字符串
类
basic_string
basic_string_view (C++17)
char_traits