当前位置: 首页 > news >正文

网站开发项目设计文档如何创建微信小程序商店

网站开发项目设计文档,如何创建微信小程序商店,wordpress后台logo,国外h5制作网站本次小编向大家介绍的是根据用户的需求输入想爬取的内容及页数。 主要步骤#xff1a; 1.提示用户输入爬取的内容及页码。 2.根据用户输入#xff0c;获取网址列表。 3.模拟浏览器向服务器发送请求#xff0c;获取响应。 4.利用xpath方法找到图片的标签。 5.保存数据。 代码…本次小编向大家介绍的是根据用户的需求输入想爬取的内容及页数。 主要步骤 1.提示用户输入爬取的内容及页码。 2.根据用户输入获取网址列表。 3.模拟浏览器向服务器发送请求获取响应。 4.利用xpath方法找到图片的标签。 5.保存数据。 代码用面向过程的形式编写的。 关键字requests库xpath,面向过程 现在就来讲解代码书写的过程 1.导入模块 import parsel # 该模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配 import requests # 爬虫主要的包 from urllib.request import urlretrieve # 本文用来下载图片 import os # 标准库本文用来新建文件夹 每个模块的作用都已经备注了。 2.提示用户输入内容和页数 if not os.path.exists(王一博图片): os.mkdir(王一博图片) # 判断有没有该文件夹如果没有就创建改文件夹 k input(请输入你想搜索的关键字) num int(input(请输入你想搜索的页数)) 3.准备好url和header header {user-agent: Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36 } base_url https://www.duitang.com/search/?kw k typefeed#!s-p title_url [] n 0 user-agent是服务器识别浏览器的重要参数我们就用这个来蒙骗服务器user-agent在浏览器里可以找到那么现在我们就关注右边这样header就找到了注意要以字典的形式 4.发送请求、 for i in range(num): title_url base_url str(i) respons requests.get(title_url, headersheader).text html parsel.Selector(respons) # 解析数据 -- parsel 转化为Selector对象Selector对象具有xpath的方法能够对转化的数据进行处理pic_url html.xpath(//div[classmbpho]/a/img/src).extract() 一切准备就绪后就可以发送请求了。request.get.text返回的是网页的源代码然后将源代码转换为Selector对象再通过xpath的方法找到图片的网址。5.保存数据 获取图片的图片的链接后我们就可以保存了。 for url in pic_url: n n 1 file_path 王一博图片 / str(n).jpg urlretrieve(url, file_path) # 下载图片具体的用法可以去搜索下很简单的 print(第%d张图片下载成功 % n) 注意这里的for循环是在上面的循环里嵌套的。 最后来看看全部的代码吧 import parsel # 该模块主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配 import requests from urllib.request import urlretrieve # 本文用来下载图片 import os # 标准库本文用来新建文件夹 if not os.path.exists(王一博图片): os.mkdir(王一博图片) # 判断有没有该文件夹如果没有就创建改文件夹 k input(请输入你想搜索的关键字) num int(input(请输入你想搜索的页数)) header {user-agent: Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Mobile Safari/537.36 } base_url https://www.duitang.com/search/?kw k typefeed#!s-p title_url [] n 0 for i in range(num): title_url base_url str(i) respons requests.get(title_url, headersheader).text html parsel.Selector(respons)pic_url html.xpath(//div[classmbpho]/a/img/src).extract() # print(pic_url) for url in pic_url: n n 1 file_path 王一博图片 / str(n).jpg urlretrieve(url, file_path) # 下载图片具体的用法可以去搜索下很简单的 print(第%d张图片下载成功 % n) 来看看运行的结果以搜索王一博搜索5页为例。然后你就发信多了一个王一博的文件夹了点开就可以看见王一博的帅照了。到此这篇关于python根据用户需求输入想爬取的内容及页数爬取图片方法详解的文章就介绍到这了,更多相关python爬取图片方法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家
http://www.zqtcl.cn/news/957523/

相关文章:

  • 数据库型网站wordpress上传工具
  • 太原建站公司模板宁波seo公司哪家好
  • 电商网站都是用什么做的承接电商网站建设
  • c2c网站代表有哪些怎样制作个人网站
  • wordpress linux 建站安丘市建设局官方网站
  • 谁给个好网站硬件开发是什么
  • 海外网站加速器免费长春做网站优化哪家好
  • 建立网站需要多长钱电脑网页设计培训
  • 给网站划分栏目邢台做网站优化费用
  • 网群企业网站管理系统红塔区住房和城乡建设局网站
  • 濮阳网站建设在哪做沈阳百度网站的优点
  • 网站上如何做问卷调查温州建设局官方网站
  • 做一件代发哪个网站好具有品牌的福州网站建设
  • 邢台移动端网站建设犀牛建模教程
  • 华池网站建设广西柳州市
  • 泰安网站建设推荐软件商店电脑版官方下载
  • 站长平台网站报价单模板表格
  • 织梦做的网站老是被黑杭州网站设计询问蓝韵网络
  • wordpress手机版如何设置福鼎整站优化
  • 网站建设小程序定制开发北京东宏建设网站
  • 网站制作还花钱网站图怎么做
  • 免费搭网站wordpress minty
  • 海沧建设网站多少国外调色网站
  • 中企动力建站怎么样网站建设与设计的心得体会
  • 打开网站出现directoryj2ee做网站
  • 如何建设一个视频网站西安个人做网站
  • wordpress站群教程市场营销培训课程
  • 17网站一起做网店白沟简单网页制作图片
  • 网站建设项目需求分析流程做商业地产的网站
  • 百度建站商业网点的定义