ISO 2022-JP (JIS) 文本编解码器
JIS 编解码器提供 ISO 2022-JP 的转换。
UNICODEMAP_JP
环境变量可用于微调 JIS、Shift-JIS 和 EUC-JP 编解码器。映射名称与日本 XML 工作组的 Mapper 相同,因为它命名并解释了所有广泛使用的映射。以下是简要描述,由 Kurusugawa Serika 编写
- "unicode-0.9" 或 "unicode-0201" 用于 Unicode 风格。这假定 JISX0201 用于 0x00-0x7f。(0.9 是 jisx02xx 映射的版本,用于 Unicode 1.1。)
- "unicode-ascii" 此假定 0x00-0x7f 为 US-ASCII;一些字符(JISX0208 0x2140 和 JISX0212 0x2237)与 Unicode 1.1 不同,以避免冲突。
- "open-19970715-0201"(为方便起见为 "open-0201")或 "jisx0221-1995" 用于 JISX0221-JISX0201 风格。JIS 已将 Unicode 的版本化为 JIS X 0221,但某些字符(0x5c、0x7e、0x2140、0x216f、0x2131)与 Unicode 1.1 不同。当 0x5c 被视为 YEN SIGN 时使用。
- "open-19970715-ascii"(为方便起见为 "open-ascii")用于 JISX0221-ASCII 风格。当 0x5c 被视为 REVERSE SOLIDUS 时使用。
- "open-19970715-ms"(为方便起见为 "open-ms")或 "cp932" 用于 Microsoft Windows 风格。Windows Code Page 932。一些字符(0x2140、0x2141、0x2142、0x215d、0x2171、0x2172)与 Unicode 1.1 不同。
- "jdk1.1.7" 用于 Sun 的 JDK 风格。与 Unicode 1.1 相同,但 JIS 0x2140 映射为 UFF3C。可以使用 ASCII 或 JISX0201 适用于 0x00-0x7f。
此外,还支持 "nec-vdc"、"ibm-vdc" 和 "udc" 扩展。
例如,如果您想要使用 Unicode 风格的转换,但需要使用 NEC 的扩展,请将 UNICODEMAP_JP
设置为 unicode-0.9, nec-vdc
。(您可能需要在 shell 命令中引用它。)
这里的大部分代码都是由 Kurusugawa Serika(又名 Takagi Junji)编写的,并已在 Qt 中发布,Qt 团队得到了作者的许可和感谢。
© 2024 Qt 公司 Ltd. 此处包含的文档贡献是其各自的版权拥有者的版权。此处提供的文档是根据自由软件基金会发布的 GNU 通用文档许可证版本 1.3 的条款许可的。Qt 及其相应标志是芬兰和/或其他国家的 Qt 公司的商标。所有其他商标归其各自的所有者所有。