字符编码
计算机中储存的信息都是用二进制数表示的 而在屏幕上看到的数字 英文 标点符号 汉字等字符是二进制数转换之后的结果
按照某种规则将字符存储到计算机中的操作称为编码
反之 将存储在计算机中的二进制数按照某种规则解析显示出来的操作称为解码
例如 按照A规则存储 同样按照A规则解析 那么就能显示正确的文本符号
反之 按照A规则存储 再按照B规则解析 就会导致乱码现象
字符编码(Character Encoding): 一套自然语言的字符与二进制数之间的对应规则
字符集
字符集(Charset):也叫编码表 是一个系统支持的所有字符的集合
包括各国家文字 标点符号 图形符号 数字等
计算机要准确存储和识别各种字符集符号需要进行字符编码 一套字符集必然至少有一套字符编码
常见字符集有ASCII字符集 GBK字符集 Unicode字符集等

如上图 当指定了编码 它所对应的字符集自然就指定了 所以编码才是最终要关心的
编码及对应字符集:
一、ASCII字符集
ASCII(American Standard Code for Information Interchange 美国信息交换标准代码)是基于拉丁字母的一套电脑编码

本文详细介绍了字符编码的概念和重要性,从ASCII字符集到ISO-8859-1字符集,再到GB字符集(GB2312、GBK、GB18030)以及Unicode字符集。重点讨论了这些字符集的特点和用途,特别强调了Unicode的UTF-8编码在互联网应用中的广泛使用。

9418

被折叠的 条评论
为什么被折叠?



