UTF-8编码

一、介绍UTF-8

UTF-8(Unicode Transformation Format - 8-bit)是一种可变长度的字符编码,用于表示Unicode字符集中的字符。它使用1到4个字节来编码不同的字符。

  • 1字节‌:用于编码ASCII字符(0x00 - 0x7F),与ASCII编码完全兼容,只需要1个字节。

  • 2字节‌:带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要二个字节编码,使用了2个字节编码。

  • 3字节‌:用于编码基本多文种平面(BMP)中的字符,包括大部分常用汉字,使用了3个字节编码。

  • 4字节‌:用于编码Unicode辅助平面的字符,如一些罕见字符或表情符号,使用了4个字节编码。

UTF-8有四种编码组成,UTF8-1、UTF8-2、UTF8-3、UTF8-4

UTF8, 16进制编码表

UTF8-1

0x00-0x7F

UTF8-2

0xC2-0xDF 0x80-0xBF

UTF8-3

0xE0 0xA0-0xBF 0x80-0xBF

0xE1-0xEC 0x80-0xBF 0x80-0xBF

0xED 0x80-0x9F 0x80-0xBF

0xEE-0xEF 0x80-0xBF 0x80-0xBF

UTF8-4

0xF0 0x90-0xBF 0x80-0xBF 0x80-0xBF

0xF1-0xF3 0x80-0xBF 0x80-0xBF 0x80-0xBF

0xF4 0x80-0x8F 0x80-0xBF 0x80-0xBF

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值