当前位置: 首页 > news >正文

延安市建设局网站十大微商推广平台

延安市建设局网站,十大微商推广平台,网站备案更换,wordpress小程序主题进行selenium包和chromedriver驱动的安装 安装selenium包 在命令行或者anaconda prompt 中输入 pip install Selenium 安装 chromedriver 先查看chrome浏览器的版本 这里是 123.0.6312.106 版 然后在http://npm.taobao.org/mirrors/chromedriver/或者https://googlechrom…进行selenium包和chromedriver驱动的安装 安装selenium包 在命令行或者anaconda prompt 中输入 pip install Selenium 安装 chromedriver 先查看chrome浏览器的版本 这里是 123.0.6312.106 版 然后在http://npm.taobao.org/mirrors/chromedriver/或者https://googlechromelabs.github.io/chrome-for-testing/ 中下载对应版本的chromediver 由于没有106版的这里下的是105版 下载解压后 把exe文件复制到chrome浏览器的安装目录和 python的安装目录scripts文件夹下 或者 放到Anaconda的scripts文件夹下 或 测试 from selenium import webdriver browserwebdriver.Chrome() browser.get(https://www.sohu.com/)自动打开搜狐页面即可 注 浏览器自动更新后chromediver 也需要重新下载并按以上路径配置 SeleniumChrome Driver 爬取搜狐页面信息 在selenium中不同的版本语法的用法具有差异 按照书上的用chromedriver访问搜狐页面代码报错如下 chrome_driver_path传给webdriver.Chrome()时方式不对 可参考下面这位博主的语法进行修改 http://t.csdnimg.cn/xxGhp from selenium.webdriver.chrome.service import Service# 设置 ChromeDriver 的路径 chrome_driver_path F:/chromedriver/chromedriver-win64/chromedriver.exe# 创建 Chrome WebDriver service Service(chrome_driver_path) driver webdriver.Chrome(serviceservice)代码实现 导入包 from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.webdriver.chrome.options import Options from selenium.webdriver.common.by import By from selenium import webdriver: 导入了Selenium库中的webdriver模块它包含了各种WebDriver的实现用于模拟不同的浏览器行为。 from selenium.webdriver.chrome.service import Service: 导入了Service类它用于配置和启动ChromeDriver服务。 from selenium.webdriver.chrome.options import Options: 导入了Options类它用于配置Chrome浏览器的选项例如设置浏览器的头less模式等。 from selenium.webdriver.common.by import By: 导入了By类它定义了一些用于查找元素的方法例如通过class name、id等。 配置ChromeDriver 的路径并启动浏览器 # 设置 ChromeDriver 的路径 chrome_driver_path F:/chromedriver/chromedriver-win64/chromedriver.exe# 创建 Chrome WebDriver# # 创建 Chrome Options 对象 # chrome_options Options() # chrome_options.add_argument(--headless) # 无头模式即不显示浏览器窗口service Service(chrome_driver_path) driver webdriver.Chrome(serviceservice)# 打开搜狐网站 driver.get(https://www.sohu.com/)获取当前页面的Html源码 # 获取当前网页的 HTML 源码 html_source driver.page_source print(HTML 源码:) print(html_source)运行结果如图所示 获取当前页面的URL # 获取当前网页的 URL current_url driver.current_url print(\n当前网页的 URL:) print(current_url)运行结果如图所示 获取classname为‘txt’的页面元素 # 使用 find_elements 方法查找 class 属性为 txt 的元素 txt_elements driver.find_elements(By.CLASS_NAME, txt)# 遍历输出每个元素的文本内容 for element in txt_elements:print(element.text)运行结果如图所示 获取 标签 属性为 ‘footer’ 的元素文本 # 使用 find_elements 方法查找 标签 属性为 footer 的元素 txt_elements driver.find_elements(By.TAG_NAME, footer)# 遍历输出每个元素的文本内容 for element in txt_elements:print(element.text)运行结果如下图所示 获取 class 属性为 ‘titleStyle’ 的元素的文本及href链接 # 使用 find_elements 方法查找 class 属性为 titleStyle 的元素 title_elements driver.find_elements(By.CLASS_NAME, titleStyle)# 遍历输出每个元素的文本内容 for element in title_elements:text element.texthref element.get_attribute(href)print(fText: {text}, Href: {href})运行结果如下图所示 获取 xpath 搜狐首页的导航栏标签 及 href链接 # 使用 find_elements 方法查找 xpath 搜狐首页的导航栏标签 title_elements driver.find_elements(By.XPATH, /html/body/div[2]/div/nav[classnav area]//a)# 遍历输出每个元素的文本内容 for element in title_elements:text element.get_attribute(innerHTML).strip()if text:href element.get_attribute(href)print(fText: {text}, Href: {href})运行结果如下图示 这里运行出来后大的标签会有strong/strong 可以通过正则表达式进行优化 优化代码如下 import re# 使用 find_elements 方法查找 xpath 搜狐首页的导航栏标签 title_elements driver.find_elements(By.XPATH, /html/body/div[2]/div/nav[classnav area]//a)# 遍历输出每个元素的文本内容 for element in title_elements:inner_html element.get_attribute(innerHTML)text re.sub(r[^]*, , inner_html).strip()if text:href element.get_attribute(href)print(fText: {text}, Href: {href})匹配左尖括号表示 HTML 标签的开始。 [^]匹配除了右尖括号之外的任何字符。 *匹配前面的字符零次或多次即匹配任意数量的除右尖括号之外的字符。 匹配右尖括号表示 HTML 标签的结束。 re.sub(pattern, repl, string) pattern要匹配的正则表达式模式。 repl用于替换匹配文本的字符串。 string要进行替换操作的原始字符串。 运行结果如下图所示 关闭 WebDriver # 关闭 WebDriver driver.quit()完整代码 import re from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.webdriver.chrome.options import Options from selenium.webdriver.common.by import By# 设置 ChromeDriver 的路径 chrome_driver_path F:/chromedriver/chromedriver-win64/chromedriver.exe# 创建 Chrome WebDriver# # 创建 Chrome Options 对象 # chrome_options Options() # chrome_options.add_argument(--headless) # 无头模式即不显示浏览器窗口service Service(chrome_driver_path) driver webdriver.Chrome(serviceservice)# 打开搜狐网站 driver.get(https://www.sohu.com/)# 获取当前网页的 HTML 源码 html_source driver.page_source print(HTML 源码:) print(html_source)# 获取当前网页的 URL current_url driver.current_url print(\n当前网页的 URL:) print(current_url)# 使用 find_elements 方法查找 class 属性为 txt 的元素 txt_elements driver.find_elements(By.CLASS_NAME, txt)# 遍历输出每个元素的文本内容 for element in txt_elements:print(element.text)# 使用 find_elements 方法查找 标签 属性为 footer 的元素 txt_elements driver.find_elements(By.TAG_NAME, footer)# 遍历输出每个元素的文本内容 for element in txt_elements:print(element.text)# 使用 find_elements 方法查找 class 属性为 titleStyle 的元素 title_elements driver.find_elements(By.CLASS_NAME, titleStyle)# 遍历输出每个元素的文本内容 for element in title_elements:text element.texthref element.get_attribute(href)print(fText: {text}, Href: {href})# # 使用 find_elements 方法查找 xpath 搜狐首页的导航栏标签 # title_elements driver.find_elements(By.XPATH, /html/body/div[2]/div/nav[classnav area]//a)# # 遍历输出每个元素的文本内容 # for element in title_elements: # text element.get_attribute(innerHTML).strip() # if text: # href element.get_attribute(href) # print(fText: {text}, Href: {href})# 使用 find_elements 方法查找 xpath 搜狐首页的导航栏标签 title_elements driver.find_elements(By.XPATH, /html/body/div[2]/div/nav[classnav area]//a)# 遍历输出每个元素的文本内容 for element in title_elements:inner_html element.get_attribute(innerHTML)text re.sub(r[^]*, , inner_html).strip()if text:href element.get_attribute(href)print(fText: {text}, Href: {href})# 关闭 WebDriver driver.quit()
http://www.zqtcl.cn/news/652601/

相关文章:

  • 临沂外贸国际网站建设网站开发外包公司合同
  • 网站设置快捷方式温州网站建设方案报价
  • 经营网站需要什么费用如何鉴赏网站论文
  • 聊城网站推广公司网站 防攻击
  • 小米盒子做网站一个县城广告公司利润
  • 天津市区县档案部门网站建设指导意见网站开发的需求分析教学视频
  • 网站服务合同范本企业网站建设费是无形资产吗
  • 国外做家纺的网站试用体验网站
  • 百度网站下载安装免费制作短视频的软件
  • 山西省这房和城乡建设厅网站邯郸北京网站建设
  • 廊坊网站seo服务主机服务器网站 怎么做
  • 网站的建设与运维东营会计信息网
  • 郑州网站建设程序3g手机网站
  • 建设监理网站设计了网站首页
  • 织梦教育网站开发商务网站建设实训总结
  • 广西执业药师培训网站网站设计 原型图
  • 网站建设客户群体分析微信开放平台小程序开发文档
  • led网站建设wordpress .htaccess 固定链接
  • 学校网站建设申请报告一个好网站设计
  • 网站雪花特效wordpress文件解析
  • 招聘网站哪个好用淮北之窗
  • 索莱宝做网站网站在线布局
  • 站内seo的技巧做php网站阿里云服务器
  • 网站开发需要用到哪些软件爱站网权重查询
  • 免费注册个人网站铁路工程造价信息网
  • 电子商务大型网站建设电商静态网页模板
  • 网站建设公司利润怎么样长沙网站制作作
  • 淄博优化网站企业营销型网站做的好
  • 玉泉营网站建设网络营销公司组织架构
  • 网上有专业的做网站吗最新网站域名ip地址查询