天津网站建设招标,百度灰色关键词技术,建一家公司需要多少钱,python网站开发集成环境一、为什么乱码#xff1f;
所有的乱码实质上都是因为字符集选择错误造成的。
流在读取时#xff0c;编码使用不当也会乱码。
二、什么是字符集#xff1f;
字符是各种文字和符号的统称#xff0c;包括各个国家的文字#xff0c;标点符号#xff0c;表情等等。字符集…一、为什么乱码
所有的乱码实质上都是因为字符集选择错误造成的。
流在读取时编码使用不当也会乱码。
二、什么是字符集
字符是各种文字和符号的统称包括各个国家的文字标点符号表情等等。字符集就是一系列字符的集合。字符集的种类较多每个字符集所表示的字符范围通常不同比如有些字符集无法表示汉字。计算机只能存储二进制的数据。
三、有哪些字符集
常见的字符集由ASCII、GBK、UTF-8、GB2312等等。
不同字符集的区别在于
字符范围不同编码方式不同
1.ASCII
ASCII (American Standard Code for Information Interchange美国信息交换标 准代码) 是一套主要用于现代美国英语的字符集这也是 ASCII 字符集的局限性所 在。
为什么ASCII字符集没有考虑到中文等其它字符呢因为计算机是美国人发明的当时计算机还处于雏形时代在其他国家还没有大规模的使用所以美国发明ASCII字符集时没有考虑兼容其他国家的语言。
ASCII码至今为止共定义了128个字符其中有33个控制字符回车删除等无法显示。
一个ASCII码长度为一个字节也就是8个bit比如a对应的ASCII码为01100001,最高位0仅仅作为校验位其他七位由0和1组成因此ASCII字符集可以定义128个字符。
由于ASCII码可以表示的字符实在太少了人们对其进行了扩展得到了ASCII 扩展字符集 。ASCII 扩展字符集使用 8 位bits表示一个字符所以ASCII扩展字符集可以定义 2562^8个字符。