当前位置: 首页 > news >正文

企业网站报告册设计模板哪些网站不能备案

企业网站报告册设计模板,哪些网站不能备案,宁波关键词网站排名,中国最厉害的室内设计师一、用get请求爬取一般网页 首先由上节课我们可以找到URL、请求方式、User-Agent以及content-type 即#xff1a;在所在浏览器页面按下F12键#xff0c;之后点击网路-刷新#xff0c;找到第一条双击打开标头即可查看上述所有内容#xff0c;将上述URL、User-Agent所对应的…一、用get请求爬取一般网页 首先由上节课我们可以找到URL、请求方式、User-Agent以及content-type 即在所在浏览器页面按下F12键之后点击网路-刷新找到第一条双击打开标头即可查看上述所有内容将上述URL、User-Agent所对应的值复制下来 例如我们想爬取下面这个页面 那么我们只需按下F12按照我前面讲的找到其URL、User-Agent以及请求方式和内容格式 分别如下 1、 2、 3、 4、 以上便是爬取网页的关键用具了接下来将开始写代码去爬取他的页面 首先我们获取了URL那么变要进行get请求但是我们需要有一个身份来获取网页的数据如果不伪装一个身份而直接以编译器的形式去爬取大多数网页会识别到你是个爬虫是个小偷想要过来偷取我的数据会直接将你驱逐出去而不让你爬取他的数据所以我们就使用UA伪装的方法去将自己伪装成一个浏览器这样多数的网页就不会驱逐你是你能够用爬取数据。 完成UA伪装后使用get请求得到url对应的网页数据就用content-type上看到的方式去打印这段数据代码如下 import requestshead { #进行UA伪装User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0 }url https://www.sogou.com/web?query刘亦菲# 2、发送请求 get带参数使用params参数 response requests.get(url, headershead)#打印数据,以content-type中写的方式去打印 print(response.text) 输出结果为很长很长的数据 以上就是基础的打印出来了这个网页的所有数据那么接下来就要将这段数据保存下来然后对这段数据进行处理 import requestshead { #进行UA伪装User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0 }url https://www.sogou.com/web?query刘亦菲# 2、发送请求 get带参数使用params参数 response requests.get(url, headershead)#打印数据,以content-type中写的方式去打印with open(./dilireba.html, w, encodingutf8) as fp: fp.write(response.text) print(type(response.text)) 即将那一幅大串的数据存入html文件dilireba.htmlhtml是一个网页的原码存放文件在左侧文件夹中找到这个文件并打开 可以发现右上角有几个浏览器的logo点击电脑里有的那个即可直接打开这个网页得到如下结果 此时虽然页面摸样和之前那个一样但是注意地址栏的地址显示的是本地地址即说明当前这个页面爬取成功这看起来没什么用但是后面我们会慢慢讲解为什么比如从卖二手车的网页爬取车辆的图片以及名称报价以及爬取网页的vip视频小说的全部内容等等 下面是定义函数的方法去写上述的代码仅供参考 import requests #导入爬虫库head { #进行UA伪装User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/126.0.0.0 Safari/537.36 Edg/126.0.0.0 }# 这是get请求带参数的模式 def get_param():# 1、urlurl https://www.sogou.com/web?# 2、发送请求 get带参数使用params参数response requests.get(url, headershead, params{query: 刘亦菲})# 3、获取想要的数据with open(./dilireba.html, w, encodingutf8) as fp:fp.write(response.text)print(type(response.text))if __name__ __main__:get_param()
http://www.zqtcl.cn/news/289762/

相关文章:

  • 网站如何做响应式布局外国网站上做Task
  • 知乎网站建设入门书大渡口集团网站建设
  • 免费网站建设是什么宁波网站建设的价格表
  • 网站设计导航栏高度网站设计的经营范围
  • 帮别人建设网站多少利润北京网站建设公司华网制作作
  • 微信网站需要备案吗瑞安商业网站建设
  • 做网站如何计算工资wordpress stheme
  • 网站建设销售人才简历wordpress 搜索tag
  • 设计网站专业云南旅行社网站开发
  • 小规模开普票网站建设几个点张浦专业做网站
  • 点击图片跳转到网站怎么做链接网址后缀名大全
  • php网站开发优化crm客户系统
  • 韩国网站免费模板wordpress数据库名称
  • 如何修改网站发布时间贵阳网站建设报价
  • 东莞网站推广培训免费云电脑
  • 湖北网站建设详细方案脑叶公司手机版下载
  • 淄博网站制作平台形象怎样建设旅游网站
  • 广州花都网站建设网站改版协议
  • 中国建设协会网站首页工信部网站备案被删除
  • 丹阳网站建设案例dedecms 购物网站
  • 网站上怎么做动画广告视频下载seo黑帽是什么意思
  • 服装网站建设网综合社区网站开发费用
  • 做网站预付款 怎么做账做律师网站的网络公司
  • 购物网站开发模板小程序注册拉新
  • 怎么建立一个网站能够与讯飞云对话罗湖附近公司做网站建设哪家好
  • 唐山网站制作公司北京网站开发优选ls20227
  • php 网站备份代码广州网站设计公司招聘
  • 做ppt的网站兼职上海未来网站建设公司
  • 某某公司网站建设论文wordpress 企业 主题
  • 网站提示域名解析错误怎么办百度网址提交