当前位置: 首页 > news >正文

关于建网站做淘宝联盟美容院装修

关于建网站做淘宝联盟,美容院装修,wordpress百度网盘插件,开发小程序好的公司python爬虫selenium和ddddocr使用 selenium使用 selenium实际上是web自动化测试工具#xff0c;能够通过代码完全模拟人使用浏览器自动访问目标站点并操作来进行web测试。 通过pythonselenium结合来实现爬虫十分巧妙。 由于是模拟人的点击来操作#xff0c;所以实际上被反…python爬虫selenium和ddddocr使用 selenium使用 selenium实际上是web自动化测试工具能够通过代码完全模拟人使用浏览器自动访问目标站点并操作来进行web测试。 通过pythonselenium结合来实现爬虫十分巧妙。 由于是模拟人的点击来操作所以实际上被反爬的概率将大大降低。 selenium能够执行页面上的js对于js渲染的数据和模拟登陆处理起来非常容易。 1.安装 pip install selenium2.安装模拟驱动webdriver 以谷歌浏览器为例首先查看浏览器的版本号 下载对应版本号的安装包,下好后解压 版本号70-114http://chromedriver.storage.googleapis.com/index.html 版本号118-120https://googlechromelabs.github.io/chrome-for-testing/#stable 3.代码编写 首先引入包 from selenium import webdriver from selenium.webdriver.chrome.service import Service配置浏览器启动地址和webservice地址 options webdriver.ChromeOptions() options.binary_location chrome.exe的地址 driver_location chromedriver.exe的地址打开浏览器并访问网站 browser webdriver.Chrome(serviceService(driver_location), optionsoptions) browser.get(https://www.jd.com/)完整代码 # Author : 陈天在睡觉 # Time : 2023/10/28 23:19 from selenium import webdriver from selenium.webdriver.chrome.service import Serviceoptions webdriver.ChromeOptions() options.binary_location C:\\chrome.exe# 谷歌浏览器地址 driver_location E:\\chromedriver.exe# 谷歌浏览器driver地址 browser webdriver.Chrome(serviceService(driver_location), optionsoptions) browser.get(https://www.jd.com/) # 访问网站这个时候我们发现浏览器打开页面后就会关闭我们只需要加上一行代码即可 options.add_experimental_option(detach,True)完整代码 4.获取元素 我们可以通过drowser的find_element找到对象 from selenium.webdriver.common.by import By browser.find_element(By.ID,title)#通过id来查找id为title的元素老版本的selenium查找方法为 from selenium.webdriver.common.by import By browser.find_element_by_id(title)找到元素可以使用click()模拟点击send_keys()模拟输入 from selenium.webdriver.common.by import By username browser.find_element(By.ID,username) submit browser.find_element(By.ID,submit) username.send_keys(admin) submit.click()ddddocr使用 ddddocrDeep Double-Digital Digits OCR是一个基于深度学习的数字识别库专门用于识别双重数字双位数字的任务。它是一个开源项目提供了训练和预测的功能可用于识别图片中的双位数字并输出其具体的数值。 深度学习ddddocr利用深度学习技术特别是卷积神经网络和循环神经网络对双重数字进行准确的识别。开源项目ddddocr是一个开源项目允许用户免费使用、修改和分发代码。这使得更多的开发者可以参与其中贡献自己的想法和改进。高准确率通过深度学习的方法ddddocr在双重数字识别任务上能够取得较高的准确率有效克服了传统方法在此任务上的困难。灵活性ddddocr提供了训练和预测的功能用户可以根据自己的需求自定义模型并进行训练以适应不同的双重数字识别任务。 ddddocr的目标是提供一个简单而有效的工具帮助开发者和研究者在双重数字识别任务上取得更好的结果。通过使用该库用户可以轻松地集成双重数字识别功能到自己的应用程序或项目中实现更准确和可靠的数字识别功能。 1.安装 需要注意的是python版本过高是安装不了的我使用的是python3.9 pip install ddddocr2.修改配置 我们直接使用ddddocr会出现以下错误 原因是在pillow的10.0.0版本中ANTIALIAS方法被删除了使用新的方法即可 旧方法Image.ANTIALIAS 新方法Image.LANCZOS 解决办法 方案一修改ddddocr的_init_.py文件将其中的ANTIALIAS替换为新方法 image image.resize((int(image.size[0] * (64 / image.size[1])), 64), Image.ANTIALIAS).convert(L)image image.resize((int(image.size[0] * (64 / image.size[1])), 64), Image.LANCZOS).convert(L)方案二降级Pillow的版本比如使用9.5.0版本 先卸载再重新安装 pip uninstall -y Pillowpip install Pillow9.5.0这里我采用的是方法一直接点击红框框里的文件 3.编写代码 直接上代码 # Author : 陈天在睡觉 # Time : 2023/10/29 21:50 import ddddocrocr ddddocr.DdddOcr() with open(img.png, rb) as f:image f.read() res ocr.classification(image)print(识别出的验证码为 res)测试的图片 测试结果 如果不想看到广告可以添加show_ad False # Author : 陈天在睡觉 # Time : 2023/10/29 21:50 import ddddocrocr ddddocr.DdddOcr(show_ad False) with open(img.png, rb) as f:image f.read() res ocr.classification(image)print(识别出的验证码为 res)
http://www.zqtcl.cn/news/290322/

相关文章:

  • 百度智能建站平台建设工程信息网官网入口查询
  • 比价网站源码整站程序服务器怎么发布网站
  • html插件代码大全济南网站关键词优化公司
  • 优秀的手机网站设计网站推广的特点
  • 滨州北京网站建设电子商务网站规划与管理
  • 如何注册公司网站域名中国有几大网站
  • php网站留言板怎么做wordpress 相关文章推荐
  • 怎么看网站被惩罚专业的网站建设流程
  • 如何制作手机免费网站模板下载用户体验设计师是什么
  • php网站建设基本流程基于php网站开发设计
  • 建设一个网站需要哪些软硬件条件无做弊的棋牌游戏网站
  • 最有设计感的网站扬中网站建设 优帮云
  • 企业建设银行网站登录不了wordpress需要ftp
  • 广州营销型网站建设团队专业建设内涵包括哪些内容
  • 网站如何做响应式布局外国网站上做Task
  • 知乎网站建设入门书大渡口集团网站建设
  • 免费网站建设是什么宁波网站建设的价格表
  • 网站设计导航栏高度网站设计的经营范围
  • 帮别人建设网站多少利润北京网站建设公司华网制作作
  • 微信网站需要备案吗瑞安商业网站建设
  • 做网站如何计算工资wordpress stheme
  • 网站建设销售人才简历wordpress 搜索tag
  • 设计网站专业云南旅行社网站开发
  • 小规模开普票网站建设几个点张浦专业做网站
  • 点击图片跳转到网站怎么做链接网址后缀名大全
  • php网站开发优化crm客户系统
  • 韩国网站免费模板wordpress数据库名称
  • 如何修改网站发布时间贵阳网站建设报价
  • 东莞网站推广培训免费云电脑
  • 湖北网站建设详细方案脑叶公司手机版下载