一把香烧成莲花香图解:ASCII、ANSI、UNICODE及UTF-8编码
来源:百度文库 编辑:偶看新闻 时间:2024/05/03 10:32:15
ASCII、ANSI、UNICODE及UTF-8编码
今天用notepad.exe另存文本文件的时候,发现下面的编码中,有个ANSI编码,文章题目中的几个编码在解决B/S程序乱码问题的时候,基本都了解了,但ANSI是什么东东?原来......1. ASCII和Ansi编码
字符内码(charcter code)指的是用来代表字符的内码.读者在输入和存储文档时都要使用内码,内码分为
单字节内码 -- Single-Byte character sets (SBCS),可以支持256个字符编码.
双字节内码 -- Double-Byte character sets)(DBCS),可以支持65000个字符编码.
前者即为ASCII编码,后者对应ANSI.
至于简体中文编码GB2312,实际上它是ANSI的一个代码页936
2. Unicode
如上,ANSI有很多代码页,使用不同代码页的内码无法在其他代码也正常显示,这就是为什么日文版/繁体中文版游戏无法在简体中文平台直接显示的原因.
Unicode也是一种字符编码方法,不过它是由国际组织设计,可以容纳全世界所有语言文字的编码方案.它是一种2字节编码,能够提供65536个字符,这个数字是不够表示所有的字符的(汉语就有55000多字符),所以,通过一个代理对的机制来实现附加的917476个字符表示,以达到所有字符都具有唯一编码.
3.Unicode和BigEndianUnicode
这两者只是存储顺序不同,如"A"的unicode编码为65 00
其BigEndianUnicode编码为00 65
4. UTF-8
这是为传输而设计的编码,其系列还有UTF-7和UTF-16
其中UTF-16和Unicode编码大致一样, UTF-8就是以8位为单元对Unicode进行编码。从Unicode到UTF-8的编码方式如下:
Unicode编码(16进制) UTF-8 字节流(二进制)
0000 - 007F 0xxxxxxx
0080 - 07FF 110xxxxx 10xxxxxx
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx
例如“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,所以肯定要用3字节模板了:1110xxxx10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 110001 001001,用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。
什么是Unicode、非Unicode、Ascii
unicode如何转换成ANSI?
ANSI Unicode UTF-8 代表什么
影音传送带 ANSI版 与 UNICODE版 区别
什么是ASCII码和Unicode码?
有关“ASCII”和“UNICODE”的详细知识?
Unicode和ASCII一样的意思吗
文本格式ANSI,Unicode等有什么区别
ANSI 和unicode 的区别和联系是什么?
ANSI 字符和ASCII码有什么关系
从unicode拆分转成ascii的计算过程
什么是ansi字符,unicode字符?还有其它字符,详细一点解释一下~
文本文档的编码ANSI,UTF-8,UNICODE各表示什么意思啊
急需可以把txt文档的可编辑ANSI文字转换成Unicode的繁体文字
如何批量实现txt文档由Unicode向ANSI的编码方式转换
TXT<ANSI>和TXT<UNICODE>格式有什莫不同
什么是ANSI
什么是ANSI
ANSI是什么
Unicode是什么???
big5 unicode
什么是Unicode
Unicode 是什么???
unicode问题