小米的企业网站建设思路,宁波网站建设网络推广,大连企业网站排名,网站三要素博主之前在项目中发现Python的词云库wordcloud显示的都是方框#xff0c;别担心#xff0c;我有一个妙招让你的中文词云变得美观又清晰#xff01;
问题
wordcloud是一个基于python的词云生成库#xff0c;它可以让你用简单的代码创建出各种形状和颜色的词云图像。
word…博主之前在项目中发现Python的词云库wordcloud显示的都是方框别担心我有一个妙招让你的中文词云变得美观又清晰
问题
wordcloud是一个基于python的词云生成库它可以让你用简单的代码创建出各种形状和颜色的词云图像。
wordcloud的github地址https://github.com/amueller/word_cloud
wordcloud默认是不支持中文显示的。
首先我们安装wordcloud
pip install wordcloud当做好数据预处理操作画词云图时
wc WordCloud(collocationsFalse, width1400, height1400, margin2).generate(text.lower())当数据中有中文数据画图会出现以下情况 这是因为使用的字体不能支持中文
解决方案
解决方法是使用一个能够支持中文的字体。wordcloud有个专门设置字体的参数
font_path : string #字体路径需要展现什么字体就把该字体路径后缀名写上如font_path 黑体.ttf
我们把font_path属性加上再用纯中文的数据集测试。下面的代码是在Windows下安装的jupyterbook测试。
解决代码
# 源数据太长只截取了一小段
st Silent Angel期待您的光临共赏美好的声音Silent Angel期待您的光临共赏美好的声音这只HD650在1k的失真左声道是右声道的6倍左右也超出官方规格参数范围0.05%看来是坏了达音科 17周年 倒是数据最好看而且便宜bosebeatsapple的消費者根本不知道有曲線的存在不错的数据我觉得任何人都可以明确分别高端耳机之间的区别不用出声都可以毕竟佩戴感不一样这还没法做到盲听听出区别是一方面听出高低的层次要求就更高了。有没有人能从10条电源线里听出最贵的是哪条二级银耳朵对号入座下一般来说所谓“发烧友”起步应该是铜耳朵这个级别达不到的话就别在HIFI上浪费钱了入门级产品玩玩就可以了。我觉得器材到一定级别搭配好了达到听出来线材区别是一件非常容易的事情。不知老大是哪个级别的自我定位一下算个铜耳朵吧不是还要能分辩水电火电和核电的吗。 能分辨这个的是什么耳朵看了下最多到一级银耳朵顶天了。但 mp3 和无损不一定能听出来。银耳飘过。。。
st jb.lcut(st)
st /.join(st)
wordcloud WordCloud(collocationsFalse,font_pathmsyh.ttc, width1400, height1400, margin2).generate(st)
# 显示图片
plt.imshow(wordcloud)
plt.axis(off)
plt.show()完美解决 使用其他中文字体
github有个Adobe开源的支持中文的字体库 https://github.com/adobe-fonts
如果想显示其他中文字体可以去字体库中下载font_path属性后填为本地保存地址绝对路径即可具体代码例如下
font rC:\Windows\Fonts\simfang.ttf
wc WordCloud(collocationsFalse, font_pathfont, width1400, height1400, margin2).generate(text.lower())包含词云图的成熟项目
博主目前也整理了很多前期做过的毕设项目如果不想自己动手简单下载配置环境修改的同学可以看下。
手把手教你电影数据分析与可视化系统
手把手教你基于Django的新闻文本分类可视化系统