宁波建设网站公众号关注,成品短视频软件源码,南通网站建,微官网怎么进入首先要确保eclipse编辑器环境的编码为utf8#xff0c;这个是大前提#xff1b;其次如果py文件中含有中文字符的话#xff0c;需要在py文件中对编码进行声明。1. 修改eclipse编辑器编码 a) window-preferences-general-editors-text editors-spelling-这个是大前提其次如果py文件中含有中文字符的话需要在py文件中对编码进行声明。1. 修改eclipse编辑器编码 a) window-preferences-general-editors-text editors-spelling-encoding-UTF-8b) window-preferences-workspace-text file encoding-UTF-8c) 打开eclipse安装目录-eclipse.ini末行加上”-Dfile.encodingUTF-8” 2. 修改python文件编码声明在py文件首行加上#codingutf-8一定要在首行才可以 关于网页字符编码完成以上两点对本地中文字符处理没有问题了。但是有时我们需要处理网页上的中文字符比如读取网页、对网页内容进行抓取那么仅仅做到上面两点是不够了。还需要用到decode和encodedecode与encode 是一对相反的方法。decode是解码比如网页采用的是gb2312编码格式那么通过read()方法读取页面内容之后使用str.decode(‘gb2312′)就是将页面内容解码为unicode编码encode正好相反它是将unicode编码为指定的格式如果之前已经通过decode解码为unicodestr.encode(‘utf8′)即将str编码为utf8格式。 所以自然我们就有了在eclipse中正确显示网页内容的方法。比如网页采用的gb2312编格式eclipse环境已经调整为utf8编码如果直接read()出来在eclipse中显示的是乱码如果在read()之后加一道工序显示就正常了如下: html f.read().decode(gb2312).encode(utf8) 转载于:https://www.cnblogs.com/hermione820/p/3415861.html