当前位置: 首页 > news >正文

怎么用ftp修改网站北京的做网站公司

怎么用ftp修改网站,北京的做网站公司,小型手机网站建设多少钱,高毅资产网站谁做的首先#xff0c;在网页中按下F12键#xff0c;查看定位网页元素#xff1a; 然后在kimi中输入提示词#xff1a; 你是一个Python编程专家#xff0c;要完成一个爬取网页内容的Python脚本#xff0c;具体步骤如下#xff1a; 在F盘新建一个Excel文件#xff1a;提示词…首先在网页中按下F12键查看定位网页元素 然后在kimi中输入提示词 你是一个Python编程专家要完成一个爬取网页内容的Python脚本具体步骤如下 在F盘新建一个Excel文件提示词.xlsx 打开网页https://lobehub.com/zh/assistants 定位classlayoutkit-flexbox css-15l7r2q acss-vjqh32的div标签 定位div标签里面所有的a标签 提取a标签的href属性值前面加上”https://lobehub.com/zh”,构造成一个URL 解析这个URL的源代码 在源代码中定位classacss-1ce01rv的h1标签提取其文本内容作为提示词标题写入”提示词.xlsx”这个Excel文件的第1列列的标头为提示词标题 在源代码中定位classlayoutkit-flexbox css-o3n4io acss-pl6lf1的h2标签提取其文本内容作为提示词简介写入”提示词.xlsx”这个Excel文件的第2列列的标头为提示词简介 在源代码中定位classacss-7ksih7的div标签提取其全部文本内容作为提示词内容写入”提示词.xlsx”这个Excel文件的第3列列的标头为提示词内容 注意 每一步都要输出相关信息到屏幕 网站有放爬虫机制要通过设置请求头、延迟请求等方式来进行应对 源代码 import requests from bs4 import BeautifulSoup import pandas as pd from openpyxl import Workbook # 定义目标URL url https://lobehub.com/zh/assistants # 设置请求头模拟浏览器访问 headers { User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3 } # 发送请求并获取网页内容 response requests.get(url, headersheaders) response.raise_for_status() # 如果请求失败将抛出异常 # 解析网页内容 soup BeautifulSoup(response.text, html.parser) # 定位div标签并提取所有a标签的href属性 div_tag soup.find(div, class_layoutkit-flexbox css-15l7r2q acss-vjqh32) a_tags div_tag.find_all(a) # 构造完整的URL urls [https://lobehub.com/zh tag.get(href) for tag in a_tags] # 定义Excel文件路径 excel_path F:/提示词.xlsx # 创建工作簿和工作表 wb Workbook() ws wb.active # 设置列的标头 ws.append([提示词标题, 提示词简介, 提示词内容]) # 循环处理每个URL for idx, url in enumerate(urls, start1): print(f正在处理URL: {url}) # 发送请求并获取网页内容 response requests.get(url, headersheaders) response.raise_for_status() # 解析网页内容 soup BeautifulSoup(response.text, html.parser) # 提取h1标签文本内容 h1_tag soup.find(h1, class_acss-1ce01rv) title h1_tag.get_text(stripTrue) if h1_tag else 无标题 # 提取h2标签文本内容 h2_tag soup.find(h2, class_layoutkit-flexbox css-o3n4io acss-pl6lf1) introduction h2_tag.get_text(stripTrue) if h2_tag else 无简介 # 提取div标签文本内容 div_tag soup.find(div, class_acss-7ksih7) content div_tag.get_text(stripTrue) if div_tag else 无内容 # 将提取的内容写入Excel文件 ws.append([title, introduction, content]) # 打印到屏幕 print(f标题: {title}) print(f简介: {introduction}) print(f内容: {content}) # 保存Excel文件 wb.save(excel_path) print(f数据已写入Excel文件: {excel_path})
http://www.zqtcl.cn/news/510289/

相关文章:

  • 做网站的你选题的缘由是什么洛阳网站建设找汉狮
  • 常德住房和城乡建设局网站陕西省建设厅的网站
  • 国外做meta分析的网站开发公司替业主承担物业费承诺书
  • 百度收录网站定位地址wordpress 检测浏览器
  • 学习网站建设优化wordpress 轮播广告
  • 迈诺网站建设wordpress 前台注册登录
  • 网站开发市场成本免费建站网站大全
  • 四川省建设人才网站通过ip访问网站需要怎么做
  • 网站建设需要知道什么财税公司怎么找客源
  • 赣州那里有做网站的公司物流网站建设平台
  • 青色系网站北京的建筑设计公司
  • 纺织品做外贸一般在哪个网站上手机网站qq登录插件
  • 长沙做公司网站有没有免费的云服务器可以用
  • 济南专业网站优化如何制作小程序二维码
  • 建站平台软件猪八戒做网站要多少钱
  • 建设集团网站专业开发网站多少钱
  • 网站制作流程有哪些wordpress众筹
  • 网站打开是建设中手机咋建网站
  • 外贸专业网站的公司建百度网站
  • 北京做网站开发公司有哪些网站技术开发文档模板
  • 图解asp.net网站开发实战外管局网站先支后收怎么做报告
  • 访问自己做的网站吗织梦自动生成手机网站
  • 湖南岳阳网站开发网络公司兰州最好的互联网公司
  • 网站上线 流程网站左侧漂浮代码
  • 基于mvc4商务网站开发网站建设引言
  • 深圳网站设计师西安企业100强
  • dz网站数据备份购物网站配色怎么设计
  • 适合网站开发工程师的公司图片百度搜索
  • 网站界面设计需求wordpress single.php
  • 比较权威的房产网站合肥瑶海区地图全图高清版