很多资料太啰嗦了,总结下重点
unicode gb2312只是显示字符-内存字节转换关系(字库)--决定什么样子的字的编码是怎么(0-0x0000 等)
utf-8 ucs-2 是编码方式(怎么样的字节怎么编码优化)
ucs-2将所有字符以2字节存放(unicode的原始方式),这样单个西文也要2字节
utf-8 是变长的,西文1字节够了
本文解析了unicode、gb2312、utf-8及ucs-2等编码方式的区别。unicode和gb2312主要涉及字符的显示与内存字节转换,而utf-8和ucs-2则关注于如何优化字节编码。ucs-2使用固定的2字节来存储所有字符,即使是英文字符也不例外;utf-8则是变长编码,英文字符仅占用1字节。
很多资料太啰嗦了,总结下重点
unicode gb2312只是显示字符-内存字节转换关系(字库)--决定什么样子的字的编码是怎么(0-0x0000 等)
utf-8 ucs-2 是编码方式(怎么样的字节怎么编码优化)
ucs-2将所有字符以2字节存放(unicode的原始方式),这样单个西文也要2字节
utf-8 是变长的,西文1字节够了
774

被折叠的 条评论
为什么被折叠?
