字符编码

最新推荐文章于 2025-06-04 09:11:55 发布

原创最新推荐文章于 2025-06-04 09:11:55 发布 · 925 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#byte #语言 #服务器

收录于

本文介绍了双字节字符集的基本概念及其在中日韩语言中的应用。详细列出了简体中文（GB2312-1980、GBK）、繁体中文（BIG-5）、日文（Shift-JIS）及韩文（KSC-5601-1987、KSC-5601-1992）的编码标准、代码页、前导字节和尾部字节范围。

双字节字符集主要包含中文，日文和韩文．它由前导字节（Lead Byte）和尾部字节（Trail Byte）构成，由于一个字符采用了两个字节，在软件的国际化方面又增加了一些麻烦，比如在显示上，光标的位置不能位于汉字之间，删除和移动时必须是整字操作等，在输入上，一般需要预编辑服务器才能输入汉字．下表列出了中日韩语言编码的有关信息：

语言	字符集	代码页	前导字节范围	尾部字节范围
简体中文	GB2312-1980	CP936	0xA1-0xF7	0xA1-0xFE
简体中文	GBK	无	0x81-0xFE	0x40-0x7E， 0x80-0xFE
中文繁体	BIG-5	CP950	0x81-0xFE	0x40-0x7E， 0xA1-0xFE
日文	Shift-JIS	CP932	0x81-0x9F， 0xE0-0xFC	0x40-0xFC（0x7F除外）
韩文	KSC-5601-1987	CP949	0x81-0xFE	0x41-0x5A，0x61-0x7A，0x81-0xFE
韩文	KSC-5601-1992	CP1361	0x84-0xD3 0xD8 0xD90-0xDE 0xE0-0xF9 0x41，0xFE	0x41-0x7E 0x81-0xFE 0x31-0x7E