当前位置: 首页 > news >正文

小企业网站建设建议做室内设计特别好的网站

小企业网站建设建议,做室内设计特别好的网站,上海网站设计大连,郑州seo管理系统运营1.前言本篇文章主要介绍python爬虫及对爬取的数据进行可视化分析#xff0c;本次介绍所用的网站是(https://www.duanwenxue.com/jingdian/zheli/)2.数据爬取2.1定位到爬取数据打开我们要爬取的网页#xff0c;右键选择检查#xff0c;在窗口中单击左上角箭头#xff0c;即可…1.前言本篇文章主要介绍python爬虫及对爬取的数据进行可视化分析本次介绍所用的网站是(https://www.duanwenxue.com/jingdian/zheli/)2.数据爬取2.1定位到爬取数据打开我们要爬取的网页右键选择检查在窗口中单击左上角箭头即可查看我们需要爬取的内容2.2爬虫实现方法我们要爬取一个网页首先我们需要向网页发送一个请求,然后用get方法抓取数据(例如我要爬取https://www.duanwenxue.com/jingdian/zheli/的内容)import requestsurl https://www.duanwenxue.com/article/5034441.htmldoc requests.get(url)print(doc.text)1234通过这个方法获得数据是整个网页的源码接下来我们接下来要从源码中找到并提取数据。Beautiful Soup 是 python 的一个库其最主要的功能是从网页中抓取数据。(例如我要获得https://www.duanwenxue.com/article/5035160.html的散文)import requestsfrom bs4 import BeautifulSoupurlhttps://www.duanwenxue.com/article/5034441.htmlhtmlrequests.get(url)html.encodinggbkdocBeautifulSoup(html.text,lxml)adoc.find(span,{id:audio-span})cdoc.find(div,{id:shangDiv})a.decompose() # 删除无用信息c.decompose()contdoc.find(div,{class:article-content}).findAll(p)contentfor i in cont:print(i.text)1234567891011121314输出结果人生实在当下生活唯有形态在奋斗。——余昌开当下就是人生实现梦想奋斗时。——余昌开人务必从今开始努力奋斗实现人生的理想。——余昌开人活着最务实的形态是现在正在奋斗人生美好的进行中。——余昌开版权作品未经《短文学》书面授权严禁转载违者将被追究法律责任。3.数据可视化分析数据可视化是数据分析很重要的一部分将数据进行可视化,更直观的呈现使数据更加客观、更具说服力。matplotlib是用来创建图表的工具包之一是一个Python 2D绘图库它可以在各种平台上以各种硬拷贝格式和交互式环境生成出具有出版品质的图形。3.1将短文学网的各类文章做一个统计柱形图plt.rcParams[font.sans-serif][SimHei]plt.figure(figsize(10,10))plt.xticks(rotation45)plt.title(各类文章数目)# 标题plt.xlabel(文章类型)#横坐标名字plt.ylabel(数量)#纵坐标名字plt.bar(x, y)for x,y in zip(x,y): plt.text(x,y,{f}.format(fy),hacenter,vabottom)plt.show()12345678910结果饼状图plt.figure(figsize(30, 30)) #设置大小plt.pie(y,labels x, autopct%1.1f%%)plt.axis(equal)plt.show()1234结果通过对柱形图和饼状图的观察可以发现在短文学中“散文随笔”“心情随笔”“散文诗”“散文文字”“经典语录”类的文学作品占大部分(82%)而其他类型的作品占小部分(18%)。3.2对某一类文章进行分析我们选择对励志文章的标题进行分析通过标题的重点词汇生成词云反映出这类文章的大致内容趋向于哪一方面。代码如下stopwords{你,我,的,自己}# 去掉无用的词word_cutjieba.cut(word_content)word_cut_join .join(word_cut)#把分词用空格连起来#生成词云wcWordCloud( font_pathsimsun.ttc,#设置字体 max_words100,#词云显示的最大词数 # maskmask_img,#设置背景图片 stopwordsstopwords, background_colorwhite#背景颜色 ).generate(word_cut_join)plt.imshow(wc)plt.axis(off)#去掉坐标轴plt.savefig(title.jpg)plt.show()12345678910111213141516结果可以看到多次出现的大学有 “河南”,“科技”,“大学”,“农学院”。以上便是本文全部内容代码只包含主要部分关于数据可视化还有其他几种方法具体可查看python使用Matplotlib画图。文章来源: blog.csdn.net作者Tbaodeng_T版权归原作者所有如需转载请联系作者。原文链接blog.csdn.net/Tbaodeng/article/details/111825063
http://www.zqtcl.cn/news/88613/

相关文章:

  • 手机网站建设文章哪里有男男做受网站
  • 企业网站能自己建设吗wordpress 文章列表 分页
  • 泉州营销型网站设计济南设计网站的公司
  • 长沙制作网站公司wordpress手机调度插件
  • 辽宁奔之流建设工程有限公司网站想做外贸生意如何起步
  • 震天建设集团网站企业网站建设教学
  • 百度网站排名优化软件建设厅网站上的信息采集表
  • 网站建设 环保素材华龙网重庆
  • 美食网站建设的内容分析小型的企业网站
  • 设计比较好的电商网站望野是什么意思
  • 河南城市建设招标类网站网站导航栏是什么
  • 贸易公司网站模板升级网站
  • 微信视频网站怎么做的好处忘记了wordpress
  • 水墨网站模板优未网络科技秦皇岛有限公司
  • 做网站界面一般用什么来做开源网站下载
  • 广东手机网站建设承德平台
  • OA 公司网站 铁道建设报哪些网站是用vue做的
  • 淘宝一个关键词要刷多久江西seo推广方案
  • php网站开发专业背景帝国cms源码
  • 电子商务网站建设与管理 技能实训重庆娱乐公司
  • 在线做图表的网站精准客户营销
  • 烟台公司做网站wordpress help主题
  • 提交网站地图保定网站制作策划
  • 网站建设的单可以刷吗班级网站模板
  • 网站建设惠州中国十大网站建设公司排名
  • 自己做网站要不要租服务器淄博网站建设电话
  • 宁波网站建设制作外贸营销主题怎么写
  • 龙华网站建设设计安徽省建设厅网站人员管理
  • 上海欣扬集团 网站建设内江市建设培训中心网站
  • .net建网站的优势优化大师官方