当前位置: 首页 > news >正文

淄博外贸网站制作wordpress 多域名插件

淄博外贸网站制作,wordpress 多域名插件,做社群最好的网站源码,wordpress 页面分栏目录 一、系统环境 1 镜像拉取ppocr 进行部署 2 安装paddlepaddle 二、训练前的准备 1 下载源码 2 预模型下载 3 修改模型训练文件yml 4 编排训练集 5 执行脚本进行训练 6 需要修改文件夹名称 三、开始训练 1 执行训练命令 2 对第一次评估进行解释 3 引言 五、总… 目录 一、系统环境 1 镜像拉取ppocr 进行部署 2 安装paddlepaddle 二、训练前的准备 1 下载源码 2 预模型下载 3 修改模型训练文件yml 4 编排训练集 5 执行脚本进行训练 6 需要修改文件夹名称 三、开始训练 1 执行训练命令 2 对第一次评估进行解释 3 引言 五、总结 一、系统环境 1. 镜像拉取ppocr 进行部署 注gitee上有提供环境准备的链接【链接】 注其中用到了下方红框命令 2. 安装paddlepaddle pip install paddlepaddle二、训练前的准备 1. 下载源码 切换到 /paddle/目录下 下载源码 cd /paddle git clone https://gitee.com/paddlepaddle/PaddleOCR.git # 切换版本 git checkout origin/release/2.72. 预模型下载 注预训练模型已经训练好的模型。在此模型基础上训练对生成新的模型进行增强 模型下载gitee.paddleocr 可直接跳转至下方页面对模型进行下载 这里参考的文章 | 注进入PP-OCR系列模型下载页面 注此处下载的训练模型内容是 ch_det_mobile_v2.0_det ( 跟随参考文章 ) 下载后在docker容器中创建目录将模型保存至目录中 注首先创建目录 mkdir /paddle/PaddleOCR/Preliminary_training使用公开数据集 注可训练自己的数据集这里跳过直接使用公开数据集 训练自己的数据集 参考文章 | 注公开数据集下载说明 | 注共3部分 下载图片和标注 注进入网站进行下载时需要注册登录 注下图就是下载后的内容 注下载的文件需要对文件夹名称做修改留作彩蛋文章后面会说 去那 | 3. 修改模型训练文件yml 注修改预训练模型的位置。修改use_gpu: false因本机使用的是cpu 4. 将下载的训练集进行编排 注编排如图 5. 执行脚本进行训练 注选择配置文件进行训练这里选择 ./configs/det/det_mv3_db.yml det_mv3_db的意思基于db和mobileNetV3算法的文本检测配置文件 注处理执行时遇到的问题 问题1处理模块不存在问题 ModuleNotFoundError: No module named skimage , imgaug, pyclipper, tqdm, rapidfuzz 注安装相关模块进行解决 # 安装图像处理模块 pip install scikit-image # 安装图像增强模块 pip install imgaug # 安装形状裁剪模块 pip install pyclipper # 安装嵌入式数据库模块 pip install lmdb # 安装进度条库 pip install tqdm # 安装字符串匹配库 pip install rapidfuzz问题2对象无此属性错误 注编辑报错文件/paddle/PaddleOCR/tools/program.py 进行修改。将dist.ParallelEnv().dev_id 为 dist.get_rank() 错误处理参考文章 | 6. 修改文件夹名称彩蛋 注修改训练文件夹 ch4_training_images 为 标注文件中train_icdar2015_label.txt图片路径的名称 icdar_c4_train_imgs 注或者修改标注文件的内容也可以保持一致。避免执行训练脚本时报错 注查看标注文件 train_icdar2015_label.txt cat ./train_data/icdar2015/text_localization/train_icdar2015_label.txt注故将ch4_training_images 文件夹名称改成 icdar_c4_train_imgs/ 三. 开始训练 1. 执行训练命令 python tools/train.py -c configs/det/det_mv3_db.yml 在错误处理完二中出现的问题后执行又出现了运行期间的系统级别问题 注解决方案是修改配置文件参数兼容系统当前系统性能 参考 | 注需要修改配置文件 yml参数 num_workers 0, 避免报错内存空间不足。空间足够大cpu核数够高可以尝试修改其他数值这里没有再进行测试 参考 | 解决后再次执行 python tools/train.py -c configs/det/det_mv3_db.yml 下面是虚拟机配置简单概括 注cpu配置 4个处理器2个内核数量 注内存8G 2. 训练期间第一次评估进行解释 注使用的文心 做的翻译, 向他问了下面这段内容 [2024/03/02 13:36:13] ppocr INFO: epoch: [1/1200], global_step: 10, lr: 0.001000, loss: 8.048188, loss_shrink_maps: 4.862389, loss_threshold_maps: 2.202206, loss_binary_maps: 0.975967, loss_cbn: 0.000000, avg_reader_cost: 0.13627 s, avg_batch_cost: 89.83051 s, avg_samples: 16.0, ips: 0.17811 samples/s, eta: 78 days, 14:11:27注最后的 eta 时间很大果断放弃看来应该用小一点的训练集去做 3. 引言。 注后期会训练自定义模型在此更新链接 Ocr之PaddleOcr尝试训练自定义模型 | 五、总结 1. 本篇文章只下载了检测模型进行训练测试。后期还会生成推理模型和对识别模型进行训练并测试并对链接进行更新 推理模型生成 |识别模型训练 | 2. 不同电脑的配置会对模型训练时产生不一样问题。文章中对出现的问题在网上进行搜索基本都能定位到问题的原因和解决方案。 3. 对模型进行训练的目的。我在工作中使用到了paddleocr识别模型但是相比较TesseractOCR识别各有千秋。这里希望PaddleOCR能够更好用所以希望自己能够进一步对他进行训练期待PaddleOCR能变的更好用。
http://www.zqtcl.cn/news/904816/

相关文章:

  • 沙洋县住房和城乡建设局网站单页网站下载
  • 江宁区住房建设局网站建设工程扣分查询网站
  • wordpress火车采集优化算法分类
  • 厦门做网站公司有哪些有什么好的加盟店项目
  • wap网站开发技术怎么做消费信贷网站
  • 公司网站开发外包公司深圳网站建设sz886
  • 中英文网站建设需要懂英语吗电气网站设计
  • 双语网站用什么程序做新网站如何被网站收录
  • 怎么做视频平台网站想开个小说网站怎么做
  • 网站安全监测预警平台建设成效阐述网络营销策略的内容
  • 网站上的qq如何做悬浮沧州做网站的公司
  • 电子商务网站系统规划报告移动商城 网站建设方法方式
  • 网站建设架构选型引擎seo优
  • 什么电脑做网站前段用网站建设工作人员有哪些职责
  • 网站建设技巧网站建设 总结
  • 有站点网络营销平台搜一下百度
  • 沈阳网站建设找德泰诺wordpress 访客计数器
  • 专业网站建设价格分析企业展示型网站建设方案
  • 东丽做网站公司帮做网站的公司
  • 网站的icon图标做多大验证wordpress
  • html制作音乐网站代码已经买了域名怎么做网站
  • 网站做收付款接口山东专业的制作网站
  • 龙岗建设高端网站如何建立网站会员系统吗
  • 中国建设银行的网站色彩wordpress 图片采集器
  • 渭南做网站价格江西省城乡住房建设部网站
  • 个人网站可以做充值安徽建设厅网站首页
  • 技术支持 东莞网站建设石材小企业网站建设查询
  • 政务公开网站建设的亮点和建议wordpress注册怎么设置密码
  • 外贸有哪些网站成都网络营销搜索推广优势
  • 国外mod大型网站财税公司