当前位置: 首页 > news >正文

科技制作网站北京市在建工程项目查询

科技制作网站,北京市在建工程项目查询,中国银行官网,广告设计培训班Hi#xff0c;大家好#xff0c;我是半亩花海。本项目是一个简单的网络爬虫#xff0c;用于从网易新闻的热点新闻列表中提取标题和对应的链接#xff0c;并将提取到的数据保存到一个 CSV 文件中。 目录 一、技术栈 二、功能说明 三、注意事项 四、代码解析 1. 导入所需… Hi大家好我是半亩花海。本项目是一个简单的网络爬虫用于从网易新闻的热点新闻列表中提取标题和对应的链接并将提取到的数据保存到一个 CSV 文件中。 目录 一、技术栈 二、功能说明 三、注意事项 四、代码解析 1. 导入所需库 2. 定义目标URL和请求头 3. 发送HTTP请求获取网页内容 4. 解析网页内容 5. 提取标题和链接 6. 将提取的数据写入 CSV 文件 五、结果展示 六、完整代码 一、技术栈 PythonRequests 库用于发送 HTTP 请求lxml 库用于解析 HTML 文档CSV 文件操作 二、功能说明 通过发送 HTTP 请求到网易新闻的热点新闻列表页面获取页面内容。使用 XPath 解析页面内容提取新闻标题和对应链接。将提取的标题和链接写入 CSV 文件每一行包含一个标题和其对应的链接。 三、注意事项 网络爬虫应遵守网站的 Robots 协议和法律法规不得对网站造成不必要的负担或侵犯其权益。在进行大规模爬取时建议添加适当的延时和错误处理机制以避免被网站封禁 IP 或其他异常情况。 四、代码解析 1. 导入所需库 import requests from lxml import etree2. 定义目标URL和请求头 url https://c.m.163.com/news/hot/newsList headers {user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36 }3. 发送HTTP请求获取网页内容 response requests.get(url, headersheaders)4. 解析网页内容 data etree.HTML(response.text)5. 提取标题和链接 title_list data.xpath(//div[classtitle]/a/text()) href_list data.xpath(//div[classtitle]/a/href)6. 将提取的数据写入 CSV 文件 with open(网易.csv, a, encodingutf-8) as f:for title, href in zip(title_list, href_list):print(Title:, title) # 标题print(Href:, href) # 超链接f.write({},{}\n.format(title, href))五、结果展示 六、完整代码 #!/usr/bin/env python # -*- encoding: utf-8 -*- import requests from lxml import etreeurl https://c.m.163.com/news/hot/newsList headers {user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36 } response requests.get(url, headersheaders)data etree.HTML(response.text) title_list data.xpath(//div[classtitle]/a/text()) href_list data.xpath(//div[classtitle]/a/href)# 保存数据指定编码为UTF-8 with open(网易.csv, a, encodingutf-8) as f:for title, href in zip(title_list, href_list):print(Title:, title) # 标题print(Href:, href) # 超链接f.write({},{}\n.format(title, href))
http://www.zqtcl.cn/news/47532/

相关文章:

  • 网站设计软件下载WordPress博客设置最新文章
  • 南京高端网站制作公司哪家好做俄罗斯生意网站
  • 网站大全正能量免费2020wordpress qq登录
  • SEO如何建设网站怎样换网站logo
  • 网站设计与网页制作培训小型电商平台有哪些
  • 怎么注册17做网站网站如何做子域名
  • 服务提供网站运营个网站需要什么条件
  • 镇江网站制作服务c++能不能作为网页开发语言
  • 外贸网站定制制作公司页面设计图片大全
  • 网站seo优化综合服务公司哪家好南海区住房城乡建设和水务局网站
  • 保定企业网站建站模板北京网站开发怎么样
  • 上海外贸营销网站建设地址最新wordpress新建首页
  • 贵阳市建设管理信息网站旅游网站流程图
  • 用jsp做的网站济南网站技术
  • 新公司 做网站 流程上海房产网二手房出售
  • 网站建设中最重要的是什么徐州网站建设市场
  • 网络公司网站官网贵阳企业网站建设制作
  • 网站建设合同doc红袖添香网站建设时间
  • 粘土做龙网站视频Divi wordpress 下载
  • 做一个好一点网站费用多少在线培训课程
  • 广州 深圳 外贸网站建设wordpress 评论内容
  • 建立一个网页seo店铺描述
  • 网站建设课程设计报告总结秦皇岛市保障性住房官网
  • 北京网站建设公司现状淘宝网站建设 深圳
  • 网站推广策略成功的案例网站开发多长时间
  • 美妆销售网站开发的目的广东网站建设公司有哪些
  • 商丘住房和城乡建设网站广西网站建设timkee
  • 和平手机网站建设海报设计兼职app
  • 沈阳网站制作思路网络潍坊知名网站建设
  • 济南免费网站制作网站建设规划书结构