首页 > 关于字符编码的问题

关于字符编码的问题

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

这是阮大大的博客中的一文,文中讲到
已知"严"的unicode是4E25(100111000100101),根据上表,可以发现4E25处在第三行的范围内(0000 0800-0000 FFFF)这是怎么对应出来的?有点蒙


800<4E25<FFFF


utf_8使用不等宽长度存储unicode编码

长度在7位内的使用一个字节,对应第一行

长度在8位到11位的使用二个字节,对应第二行

长度在11位到16位的使用三个字节,对应第三行

长度在16位到32位的使用四个字节,对应第四行

严字的unicode长度在11位到16位之间,所以在第三行。

【热门文章】
【热门文章】