网络小说网站建设,如何做阿语垂直网站,重庆口碑最好的装修公司,价格低性价比高的手机一、简单介绍一下
词云图是文本挖掘中用来表征词频的数据可视化图像#xff0c;通过它可以很直观地展现文本数据中地高频词#xff0c;让读者能够从大量文本数据中快速抓住重点。如下图#xff1a; wordcloud则是一个非常优秀的词云展示python库#xff0c;它支持自定义词…一、简单介绍一下
词云图是文本挖掘中用来表征词频的数据可视化图像通过它可以很直观地展现文本数据中地高频词让读者能够从大量文本数据中快速抓住重点。如下图 wordcloud则是一个非常优秀的词云展示python库它支持自定义词云图的大小、颜色、字体等甚至可以通过蒙版图片设置词云图的形状。因此我们可以借助wordcloud轻松生成精美的词云图。
二、安装只需一行命令
pip install wordcloud
三、从一个简单例子开始
from wordcloud import WordCloudtext 微信公众号愤怒的it男wc WordCloud(font_pathFZYTK.TTF, repeatTrue)
wc.generate(text)
wc.to_file(wordcloud.png)
这里通过WordCloud类设置字体为方正姚体背景颜色为白色文本可以重复显示。生成WordCloud对象后使用generate()方法将“微信公众号愤怒的it男”生成词云图。最后使用to_file()方法生成图片文件。 四、细说wordcloud
WordCloud作为wordcloud库最核心的类其主要参数及说明如下 这里以wordcloud库官方文档的constitution.txt文件作为数据覆盖WordCloud类的各种参数设置用法绘制出一张精美的词云图。 首先读入constitution.txt数据并将数据清洗成空格分隔的长字符串。
import rewith open(constitution.txt) as c:text .join([word.group().lower() for word in re.finditer([a-zA-Z], c.read())])print(text[:500]) 然后在默认参数设置下使用WordCloud对象的generate()和to_file()方法生成一张简单的词云图。
from wordcloud import WordCloud
import rewith open(constitution.txt) as c:text .join([word.group().lower() for word in re.finditer([a-zA-Z], c.read())])wc WordCloud()
wc.generate(text)wc.to_file(wordcloud.png) 以上词云图是在默认参数下生成的简单粗糙不好看。接下来我们将对WordCloud的各种参数调整设置不断地对以上词云图进行升级改造。
1、设置图片属性
设置图片宽为600高为300放大1.5倍色彩空间为RGBA背景颜色为None。
from wordcloud import WordCloud
import rewith open(constitution.txt) as c:text .join([word.group().lower() for word in re.finditer([a-zA-Z], c.read())])wc WordCloud(width600,height300,scale1.5,modeRGBA,background_colorNone,)
wc.generate(text)wc.to_file(wordcloud.png) 2、设置文字布局
设置水平比例为1即全部为水平文字最多只显示100个词停用词使用自带的词典中文需要传入自定义的相关一致性为0.3文字布局为非随机不允许重复词。
from wordcloud import WordCloud
import rewith open(constitution.txt) as c:text .join([word.group().lower() for word in re.finditer([a-zA-Z], c.read())])wc WordCloud(width600,height300,scale1.5,modeRGBA,background_colorNone,prefer_horizontal1,max_words400,stopwordsNone,relative_scaling0.3,random_state4,repeatFalse,)
wc.generate(text)wc.to_file(wordcloud.png) 3、设置字体属性
设置字体为‘JOKERMAN.TTF’最小字号为2最大字号为150。
from wordcloud import WordCloud
import rewith open(constitution.txt) as c:text .join([word.group().lower() for word in re.finditer([a-zA-Z], c.read())])wc WordCloud(width600,height300,scale1.5,modeRGBA,background_colorNone,prefer_horizontal1,max_words400,stopwordsNone,relative_scaling0.3,random_state4,repeatFalse,font_pathJOKERMAN.TTF,min_font_size2,max_font_size150,)
wc.generate(text)wc.to_file(wordcloud.png) 4、设置蒙版 设置微信公众号【愤怒的it男】头像的黑白图片为蒙版图片。
from PIL import Image
from wordcloud import WordCloud
import numpy as np
import remask_picture np.array(Image.open(angry_it_man_mask.png))with open(constitution.txt) as c:text .join([word.group().lower() for word in re.finditer([a-zA-Z], c.read())])wc WordCloud(width600,height300,scale1.5,modeRGBA,background_colorNone,prefer_horizontal1,max_words400,stopwordsNone,relative_scaling0.3,random_state4,repeatFalse,font_pathJOKERMAN.TTF,min_font_size2,max_font_size150,maskmask_picture,)
wc.generate(text)wc.to_file(wordcloud.png) 如果你对Python感兴趣想要学习python这里给大家分享一份Python全套学习资料都是我自己学习时整理的希望可以帮到你一起加油
有需要的小伙伴可以V扫描下方二维码免费领取
1️⃣零基础入门
① 学习路线
对于从来没有接触过Python的同学我们帮你准备了详细的学习成长路线图。可以说是最科学最系统的学习路线你可以按照上面的知识点去找对应的学习资源保证自己学得较为全面。
② 路线对应学习视频
还有很多适合0基础入门的学习视频有了这些视频轻轻松松上手Python~
③练习题
每节视频课后都有对应的练习题哦可以检验学习成果哈哈
2️⃣国内外Python书籍、文档
① 文档和书籍资料 3️⃣Python工具包项目源码合集
①Python工具包
学习Python常用的开发软件都在这里了每个都有详细的安装教程保证你可以安装成功哦
②Python实战案例
光学理论是没用的要学会跟着一起敲代码动手实操才能将自己的所学运用到实际当中去这时候可以搞点实战案例来学习。100实战案例源码等你来拿
③Python小游戏源码
如果觉得上面的实战案例有点枯燥可以试试自己用Python编写小游戏让你的学习过程中增添一点趣味
4️⃣Python面试题
我们学会了Python之后有了技能就可以出去找工作啦下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂并且有阿里大佬给出了权威的解答刷完这一套面试资料相信大家都能找到满意的工作。
上述所有资料 ⚡️ 朋友们如果有需要的可以扫描下方二维码免费领取