当前位置: 首页 > news >正文

官渡区住房和城乡建设局网站牌子网排行榜

官渡区住房和城乡建设局网站,牌子网排行榜,WordPress修改网站背景,网站空间和云服务器参考链接#xff1a; Python中的字节对象与字符串 1.常见字符串编码错误 在使用Python读文件时经常遇到编码问题引起的错误#xff0c;比如#xff1a; UnicodeDecodeError: gbk codec cant decode byte 0x80 in position 30: illegal multibyte sequence 遇到这种异…参考链接 Python中的字节对象与字符串 1.常见字符串编码错误  在使用Python读文件时经常遇到编码问题引起的错误比如  UnicodeDecodeError: gbk codec cant decode byte 0x80 in position 30: illegal multibyte sequence  遇到这种异常时可以通过读文件时规定编码方式来解决如下:  with open(zhengfu.txt,r,encodingUTF-8) as read_zhengfu:  如果文件中还包含其他非UTF-8编码的字符或者无关的特殊字符可以再加入一个参数如下  with open(zhengfu.txt,r,encodingUTF-8,errorsignore) as read_zhengfu:  有时读文件时还会遇到一种问题就是第一行数据的开头多了一串‘\ufeff’字符。比如  如果用print(list[0])是看不到这个字符的。对这个没有研究过 如果要去掉这串字符的话可以使用‘utf-8-sig’这种编码方式  with open(user_dict_2.txt,r,encodingutf-8-sig) as read_dict:  但是我在写入文件时设置为‘utf-8-sig’格式时不起作用写入的文件中还是有这个字符。  另外在对字符串进行匹配的时候\ufeff’会影响字符串的匹配结果。  2.字符串编码  关于计算机内部如何表示字符串为何又要创造这么多种编码方式推荐阅读 https://www.cnblogs.com/hhwu/p/9529942.html 这篇博客里作者讲的很明白这里主要是想汇总介绍Python中的字符串函数。  2.1 chr()函数和ord()函数  chr()函数是将一个整数返回一个对应的字符ord()函数则相反其返回一个字符的数值表示返回的是Unicode值的十进制表示。在Python3.6的版本中chr()中整数的范围不再是0到255扩大到了1114111大于改值时报ValueError错误。而ord()函数中只能接受单字符串作为其输入否则会报TypeError错误。  print(chr(65)) #输出A print(ord(A)) #输出65  2.2 Unicode编码  虽然Python 3的内存中Unicode来保存字符串但为了节省内存Python3内部使用3种方式存储Unicode字符。具体分为以下三种  Latin-1一个字符占一个字节。比如ASCII码值UCS-2一个字符占两个字节。常见的中文都占用2个字节UCS-4一个字符占四个字节。比较偏僻的中文还有emoj表情通常占用4个字节。 python中提供了内置函数来查看每个字符串对象的编码类型。如果一个字符串的所有字符都能用ASCII码来表示那么该字符串使用Latin-1。如果字符串中出现了中文则采用UCS-2编码即可。如果字符串中有一些生僻字或者emoj表情的话则必须使用UCS-4编码。注意在Python中一个字符串中的所有字符只能采用一种编码方式不能混用。因为一旦混用那么字符串中每个字符所占的字节数必定不同那么字符串将不能使用下标进行快速直接读取。下面来具体看看字符串具体在内存中所占用的字节数。  字符串的长度和该字符串所占的字节数不相同。字符串的长度可以直接通过len()f方法来求而字符串在内存中实际所占的字节数需要通过getsizeof()函数来计算。  import sys #返回字符串所占字节数,返回78 print(sys.getsizeof(你好)) #返回字符串长度长度为2 print(len(你好))  从以下的实验结果可以发现一个空字符串在内存中就占了49个字节的内存。  Python内存中的数据不管是int型还是字符串都会额外占用一些内存空间保存一些信息这些信息保存了字符串的一些基础信息并且能够决定字符串所能进行的操作。Python一般会为字符串分配49到80个字节的额外空间。  下面这段代码分别展示了字符‘a’在三种不用的Unicode编码中所占的字节数。  import sys #latin-1编码时a所占的字节数,其结果为1 print(sys.getsizeof(ab)-sys.getsizeof(b)) #ucs-2编码时a所占的字节数其结果为2 print(sys.getsizeof(a你好)-sys.getsizeof(你好)) #ucs-4编码时a所占的字节数其结果为4 print(sys.getsizeof(a?)-sys.getsizeof(?))
http://www.zqtcl.cn/news/997643/

相关文章:

  • 免费推广网站入口202网页与网站建设
  • 武夷山市网站建设网站标签制作
  • 广州网站定制开发方案河南省新闻发布会直播
  • 普陀网站建设哪家便宜网站建设辶金手指排名十五
  • 网站怎么做百度百科租房网站开发视频教程
  • 动态做网站做自己的网站不是免费的
  • 小学校园门户网站建设方案宁波seo软件
  • 想自己做网站做推广从哪些方面进行网站建设
  • 北京南站在哪个区哪个街道html表白简单代码
  • 海口网站建设流程郑州三牛网站建设
  • 谁有国外hs网站沈阳关键字优化公司
  • wordpress双站企业品牌类网站
  • 网站架构软件做淘客app要网站吗
  • 云南云桥建设股份有限公司官方网站汽车seo是什么意思
  • 陕西省建设厅执业资格注册中心网站报名系统外贸网站 字体
  • 个人html网站百度一下生活更好
  • 做网站公司徐汇服务器 网站 搬家
  • 河北省和城乡建设厅网站首页单页设计图片
  • 海东地网站建设南京市建设局网站栖霞
  • 1g做网站空间a3网站建设
  • 海络网站室内设计工作前景
  • 柳州旅游网站建设橱柜设计师培训
  • 做网站属于什么专业个人是否可以申请网址
  • 品牌网站建是啥网站点击率怎么建
  • 上海市质量工程建设管理协会网站网站开发制作公司排行
  • 网站空间租用多少钱怎么在外贸公司拿订单
  • 建设银行网站背景图片温州做网站哪家比较好
  • 网站架设建设如何做网站电话
  • 团购网站怎么推广app平台搭建步骤
  • 沂水建设局网站郑州企业微网站建设