心要让你听见下载盘:UTF-8, UTF-16, UTF-16LE, UTF-16BE的区别

来源：百度文库编辑：偶看新闻时间：2024/04/20 06:05:33

首先, 我们说的unicode, 其实就是utf-16, 但最通用的却是utf-8,
原因: 我猜大概是英文占的比例比较大, 这样utf-8的存储优势比较明显, 因为utf-16是固定16位的(双字节), 而utf-8则是看情况而定, 即可变长度, 常规的128个ASCII只需要8位(单字节), 而汉字需要24位

UTF-16, UTF-16LE, UTF-16BE, 及其区别BOM
同样都是unicode, 为什么要搞3种这么麻烦?
先说UTF-16BE (big endian), 比较好理解的, 俗称大头
比如说char 'a', ascii为
0x61, 那么它的utf-8, 则为 [0x61], 但utf-16是16位的, 所以为[0x00, 0x61]
再说UTF-16LE(little endian), 俗称小头, 这个是比较常用的
还是char 'a', 它的代码却反过来: [0x61, 0x00], 据说是为了提高速度而迎合CPU的胃口, CPU就是这到倒着吃数据的, 这里面有汇编的知识, 不多说
然后说UTF-16, 要从代码里自动判断一个文件到底是UTF-16LE还是BE, 对于单纯的英文字符来说还比较好办, 但要有特殊字符,图形符号, 汉字, 法文, 俄语, 火星语之类的话, 相信各位都很头痛吧, 所以, unicode组织引入了BOM的概念, 即byteorder mark, 顾名思义, 就是表名这个文件到底是LE还是BE的,
其方法就是, 在UTF-16文件的头2个字节里做个标记: LE [0xFF, 0xFE], BE [0xFE, 0xFF]

asp如何实现utf-8 utf-16 相互转换 UTF-8编码是怎么回事？ utf-8是什么意思 Unicode(utf-8) 是什么意思？请详细说明UTF-8和UTF-16之间的区别和联系？ String 转换成 UTF-8 ANSI Unicode UTF-8 代表什么 Gb2312编码转换到Utf-8编码如何把 gb2312 转为 utf-8 如何将UTF-8转换为ASCI？ utf-8转简体的软件百度搜索代码是否支持UTF-8？浏览器无法显示Unicode(UTF-8)编码请教关于UTF-8编码问题~~~ 关于utf-8编码的问题什么是Unicode big endian和UTF-8？什么是Unicode big endian和UTF-8？ ASP里UTF-8编码的问题 utf-8和gb2312有什么不一样,什么时候用utf-8,又什么时候用gb2312???急什么是数据的UTF格式? 如何让服务器同时支持utf-8 与 gb2312 utf-8，gb2312以及UBB有关系么有没有批量转换文件为UTF-8的软件？ ie乱码无法设置为unicode(utf-8)

心要让你听见 下载 盘:UTF-8, UTF-16, UTF-16LE, UTF-16BE的区别

心要让你听见下载盘:UTF-8, UTF-16, UTF-16LE, UTF-16BE的区别