双字节字符集主要包含中文,日文和韩文.它由前导字节(Lead Byte) 和尾部字节(Trail Byte)构成, 由于一个字符采用了两个字节, 在软件的 国际化方面又增加了一些麻烦,比如在显示上, 光标的位置不能位于汉字 之间, 删除和移动时必须是整字操作等,在输入上, 一般需要预编辑服务器 才能输入汉字. 下表列出了中日韩语言编码的有关信息:
| 语言 | 字符集 | 代码页 | 前导字节范围 | 尾部字节范围 |
| 简体中文 | GB2312-1980 | CP936 | 0xA1-0xF7 | 0xA1-0xFE |
| GBK | 无 | 0x81-0xFE | 0x40-0x7E, 0x80-0xFE | |
| 中文繁体 | BIG-5 | CP950 | 0x81-0xFE | 0x40-0x7E, 0xA1-0xFE |
| 日文 | Shift-JIS | CP932 | 0x81-0x9F, 0xE0-0xFC | 0x40-0xFC(0x7F除外) |
| 韩文 | KSC-5601-1987 | CP949 | 0x81-0xFE | 0x41-0x5A,0x61-0x7A,0x81-0xFE |
| KSC-5601-1992 | CP1361 | 0x84-0xD3 0xD8 0xD90-0xDE 0xE0-0xF9 0x41,0xFE | 0x41-0x7E 0x81-0xFE 0x31-0x7E |
本文介绍了双字节字符集的基本概念及其在中日韩语言中的应用。详细列出了简体中文(GB2312-1980、GBK)、繁体中文(BIG-5)、日文(Shift-JIS)及韩文(KSC-5601-1987、KSC-5601-1992)的编码标准、代码页、前导字节和尾部字节范围。

8174

被折叠的 条评论
为什么被折叠?



