心要让你听见 下载 盘:UTF-8, UTF-16, UTF-16LE, UTF-16BE的区别
来源:百度文库 编辑:偶看新闻 时间:2024/05/03 04:54:12
首先, 我们说的unicode, 其实就是utf-16, 但最通用的却是utf-8,
原因: 我猜大概是英文占的比例比较大, 这样utf-8的存储优势比较明显, 因为utf-16是固定16位的(双字节), 而utf-8则是看情况而定, 即可变长度, 常规的128个ASCII只需要8位(单字节), 而汉字需要24位
UTF-16, UTF-16LE, UTF-16BE, 及其区别BOM
同样都是unicode, 为什么要搞3种这么麻烦?
先说UTF-16BE (big endian), 比较好理解的, 俗称大头
比如说char 'a', ascii为
0x61, 那么它的utf-8, 则为 [0x61], 但utf-16是16位的, 所以为[0x00, 0x61]
再说UTF-16LE(little endian), 俗称小头, 这个是比较常用的
还是char 'a', 它的代码却反过来: [0x61, 0x00], 据说是为了提高速度而迎合CPU的胃口, CPU就是这到倒着吃数据的, 这里面有汇编的知识, 不多说
然后说UTF-16, 要从代码里自动判断一个文件到底是UTF-16LE还是BE, 对于单纯的英文字符来说还比较好办, 但要有特殊字符,图形符号, 汉字, 法文, 俄语, 火星语之类的话, 相信各位都很头痛吧, 所以, unicode组织引入了BOM的概念, 即byteorder mark, 顾名思义, 就是表名这个文件到底是LE还是BE的,
其方法就是, 在UTF-16文件的头2个字节里做个标记: LE [0xFF, 0xFE], BE [0xFE, 0xFF]
原因: 我猜大概是英文占的比例比较大, 这样utf-8的存储优势比较明显, 因为utf-16是固定16位的(双字节), 而utf-8则是看情况而定, 即可变长度, 常规的128个ASCII只需要8位(单字节), 而汉字需要24位
UTF-16, UTF-16LE, UTF-16BE, 及其区别BOM
同样都是unicode, 为什么要搞3种这么麻烦?
先说UTF-16BE (big endian), 比较好理解的, 俗称大头
比如说char 'a', ascii为
0x61, 那么它的utf-8, 则为 [0x61], 但utf-16是16位的, 所以为[0x00, 0x61]
再说UTF-16LE(little endian), 俗称小头, 这个是比较常用的
还是char 'a', 它的代码却反过来: [0x61, 0x00], 据说是为了提高速度而迎合CPU的胃口, CPU就是这到倒着吃数据的, 这里面有汇编的知识, 不多说
然后说UTF-16, 要从代码里自动判断一个文件到底是UTF-16LE还是BE, 对于单纯的英文字符来说还比较好办, 但要有特殊字符,图形符号, 汉字, 法文, 俄语, 火星语之类的话, 相信各位都很头痛吧, 所以, unicode组织引入了BOM的概念, 即byteorder mark, 顾名思义, 就是表名这个文件到底是LE还是BE的,
其方法就是, 在UTF-16文件的头2个字节里做个标记: LE [0xFF, 0xFE], BE [0xFE, 0xFF]
asp如何实现utf-8 utf-16 相互转换
UTF-8编码是怎么回事?
utf-8是什么意思
Unicode(utf-8) 是什么意思?
请详细说明UTF-8和UTF-16之间的区别和联系?
String 转换成 UTF-8
ANSI Unicode UTF-8 代表什么
Gb2312编码转换到Utf-8编码
如何把 gb2312 转为 utf-8
如何将UTF-8转换为ASCI?
utf-8转简体的软件
百度搜索代码是否支持UTF-8?
浏览器无法显示Unicode(UTF-8)编码
请教关于UTF-8编码问题~~~
关于utf-8编码的问题
什么是Unicode big endian和UTF-8?
什么是Unicode big endian和UTF-8?
ASP里UTF-8编码的问题
utf-8和gb2312有什么不一样,什么时候用utf-8,又什么时候用gb2312???急
什么是数据的UTF格式?
如何让服务器同时支持utf-8 与 gb2312
utf-8,gb2312以及UBB有关系么
有没有批量转换文件为UTF-8的软件?
ie乱码无法设置为unicode(utf-8)