当前位置: 首页 > news >正文

沧州高速公路建设管理局网站游戏推广员

沧州高速公路建设管理局网站,游戏推广员,网贷网站建设,昌乐营销型网站建设嗨喽~大家好呀#xff0c;这里是魔王呐 ❤ ~! python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取 如何使用thefuzz 库#xff0c;它允许我们在python中进行模糊字符串匹配。 此外#xff0c;我们将学习如何使用process 模块#xff0c;该模块允许我们在模糊…嗨喽~大家好呀这里是魔王呐 ❤ ~! python更多源码/资料/解答/教程等 点击此处跳转文末名片免费获取 如何使用thefuzz 库它允许我们在python中进行模糊字符串匹配。 此外我们将学习如何使用process 模块该模块允许我们在模糊字符串逻辑的帮助下有效地匹配或提取字符串。 使用thefuzz 模块来匹配模糊字符串 这个库在旧版本中有一个有趣的名字因为它有一个特定的名字这个名字被重新命名。 所以现在是由不同的库来维护但是它目前的版本叫做thefuzz 所以这就是你可以通过下面的命令来安装的。 pip install thefuzz但是如果你在网上看例子你会发现一些例子的旧名称是fuzzywuzzy 。所以它已经不再被维护并且过时了但是你可能会发现一些用这个名字的例子。 thefuzz 库是基于 所以你必须用这个命令来安装它。python-Levenshtei pip install python-Levenshtein而如果你在安装过程中遇到一些问题你可以使用下面的命令如果再次遇到错误那么你可以在google上搜索找到相关的解决方案。 pip install python-Levenshtein-wheels本质上模糊匹配字符串就像使用regex或沿着两个字符串的比较。 在模糊逻辑的情况下你的条件的真值可以是0 和1 之间的任何实数。 因此基本上不是说任何东西是True 或False 你只是给它在0 到1 之间的任何值。 它是通过使用距离度量计算两个字符串之间的不相似性其形式是一个称为距离的值。 使用给定的字符串你使用一些算法找到两个字符串之间的距离。一旦你完成了安装过程你必须从thefuzz 模块中导入fuzz 和process 。 from thefuzz import fuzz, process在使用fuzz 我们将手动检查两个字符串之间的不相似性。 遇到问题没人解答小编创建了一个Python学习交流QQ群926207505 寻找有志同道合的小伙伴互帮互助,群里还有不错的视频学习教程和PDF电子书ST1Just a test ST2just a test print(ST1ST2) print(ST1!ST2)它将返回一个布尔值但以一种模糊的方式你会得到这些字符串的相似程度的百分数。 False True模糊字符串匹配允许我们以模糊的方式更有效、更快速地完成这项工作。假设我们有一个例子有两个字符串其中一个字符串与大写的J 如上所述不相同。 如果我们现在去调用ratio() 函数它给我们一个相似性的度量那么这将为我们提供一个相当高的比率即91 而不是100 。 from thefuzz import fuzz, process print(fuzz.ratio(ST1, ST2))输出 91如果字符串更加延长例如如果我们不只是改变一个字符而是改变一个完全不同的字符串那么看看它的回报看一看。 遇到问题没人解答小编创建了一个Python学习交流QQ群926207505 寻找有志同道合的小伙伴互帮互助,群里还有不错的视频学习教程和PDF电子书ST1This is a test string for test ST2There aresome test string for testing print(fuzz.ratio(ST1,ST2))现在可能会有一些相似之处但会很75 这只是一个简单的比率并不复杂。 75我们还可以继续尝试像部分比例这样的东西。例如我们有两个字符串我们想确定它们的分数。 ST1There are test ST2There are test string for testing print(fuzz.partial_ratio(ST1,ST2))使用partial_ratio() 我们会得到100%因为这两个字符串有相同的子字符串(There are test)。 在ST2 我们有一些不同的词字符串但这并不重要因为我们看的是部分比率或个别部分但简单的比率并不类似。 100假设我们有相似的字符串但有不同的顺序然后我们使用另一个度量。 CASE_1This generation rules the nation CASE_2Rules the nation This generation两种情况下在该短语的相同含义上有完全相同的文字但使用ratio() 就会有相当大的不同而使用partial_ratio() 就会有不同。 如果我们通过token_sort_ratio() 这将是100%因为它基本上是完全相同的文字但顺序不同。 因此这就是token_sort_ratio() 该函数将单个标记进行排序它们的顺序并不重要。 遇到问题没人解答小编创建了一个Python学习交流QQ群926207505 寻找有志同道合的小伙伴互帮互助,群里还有不错的视频学习教程和PDF电子书print(fuzz.ratio(CASE_1,CASE_2)) print(fuzz.partial_ratio(CASE_1,CASE_2)) print(fuzz.token_sort_ratio(CASE_1,CASE_2))输出 47 64 100现在如果我们用另一个词来改变一些词我们会有一个不同的数字但基本上这是一个比率 它不关心个别标记的顺序。 CASE_1This generation rules the nation CASE_2Rules the nation has This generation print(fuzz.ratio(CASE_1,CASE_2)) print(fuzz.partial_ratio(CASE_1,CASE_2)) print(fuzz.token_sort_ratio(CASE_1,CASE_2))输出 44 64 94token_sort_ratio() 也是不同的因为它有更多的词在里面但我们也有一个叫做token_set_ratio() 的东西一个集合包含每个标记只有一次。 所以它出现的频率并不重要让我们看看一个例子字符串。 遇到问题没人解答小编创建了一个Python学习交流QQ群926207505 寻找有志同道合的小伙伴互帮互助,群里还有不错的视频学习教程和PDF电子书CASE_1This generation CASE_2This This generation generation generation generation print(fuzz.ratio(CASE_1,CASE_2)) print(fuzz.partial_ratio(CASE_1,CASE_2)) print(fuzz.token_sort_ratio(CASE_1,CASE_2)) print(fuzz.token_set_ratio(CASE_1,CASE_2))我们可以看到一些相当低的分数但是我们使用token_set_ratio() 函数得到了100%的分数因为我们有两个令牌This 和generation 存在于两个字符串中。 使用process 模块以高效的方式使用模糊字符串匹配 不仅有fuzz 还有process 因为process 是有帮助的可以使用这种模糊匹配从一个集合中提取出来。 例如我们准备了几个列表项来演示。 Diff_items[programing language,Native language,React language,People stuff, This generation, Coding and stuff]其中一些是非常相似的你可以看到母语或编程语言现在我们可以去挑选最好的个别匹配。 我们可以手动操作只需评估分数然后挑选出最优秀的人选但我们也可以用process 。 要做到这一点我们必须调用process 模块中的extract() 函数。 它需要几个参数第一个是目标字符串第二个是你要提取的集合第三个是限制将匹配或提取的内容限制为两个。 例如如果我们想提取像language 在这种情况下选择母语和编程语言。 print(process.extract(language,Diff_items,limit2))输出 [(programing language, 90), (Native language, 90)]问题是 这不是NLP自然语言处理 这背后没有智能 它只是看单个标记。 因此举例来说如果我们使用programming 作为目标字符串并运行这个。 第一个匹配将是programming language 但第二个匹配将是Native language 这将不是编码。 即使我们有编码因为从语义上讲编码更接近于编程但这并不重要因为我们在这里没有使用AI。 遇到问题没人解答小编创建了一个Python学习交流QQ群926207505 寻找有志同道合的小伙伴互帮互助,群里还有不错的视频学习教程和PDF电子书Diff_items[programing language,Native language,React language,People stuff, Hello World, Coding and stuff] print(process.extract(programing,Diff_items,limit2))输出 [(programing language, 90), (Native language, 36)]另一个最后的例子是这是如何有用的 我们有一个庞大的书库想找到一本书但我们不知道确切的名字或如何调用它。 在这种情况下我们可以使用extract() 在这个函数里面我们将把fuzz.token_sort_ratio 传给scorer 参数。 LISt_OF_Books[The python everyone volume 1 - Beginner,The python everyone volume 2 - Machine Learning,The python everyone volume 3 - Data Science,The python everyone volume 4 - Finance,The python everyone volume 5 - Neural Network,The python everyone volume 6 - Computer Vision,Different Data Science book,Java everyone beginner book,python everyone Algorithms and Data Structure] print(process.extract(python Data Science,LISt_OF_Books,limit3,scorerfuzz.token_sort_ratio))我们只是传递它我们并没有调用它现在我们在这里得到了最高的结果我们得到了另一本数据科学书作为第二个结果。 输出 [(The python everyone volume 3 - Data Science, 63), (Different Data Science book, 61), (python everyone Algorithms and Data Structure, 47)]这就是如何是相当准确的如果你有一个项目你必须以模糊的方式找到它它可以相当有帮助。 我们也可以用它来实现你的程序自动化。 还有一些额外的资源你可以使用github和stackoverflow找到更多帮助。 尾语 最后感谢你观看我的文章呐~本次航班到这里就结束啦 希望本篇文章有对你带来帮助 有学习到一点知识~ 躲起来的星星也在努力发光你也要努力加油让我们一起努力叭。 最后宣传一下呀~更多源码、资料、素材、解答、交流皆点击下方名片获取呀
http://www.zqtcl.cn/news/623953/

相关文章:

  • 网站主题编辑工具WordPress公司网站策划方案
  • 做旅游网站选什么空间搜索引擎优化策略有哪些
  • 网站备案多少钱安全网站建设与服务的关系
  • 手机端网页设计尺寸规范优化seo排名
  • 做网站业务提成多少厦门十大装修公司排名榜
  • 为什么用开源建站wordpress rss 插件
  • 语文建设投稿网站南昌做网站的公司多不多
  • 石家庄网站建设的公司功能性质网站
  • 企业网站主页模板装饰公司名字起名大全
  • 马鞍山网站设计价格如何在微信公众号内部做网站
  • 申请网站建设经费的报告生态建设网站
  • 建网站要多少钱用自己的服务器河北工程大学网站开发成本
  • 宁波网站建站公司商务网站模块设计时前台基础设施建设不包括
  • 徐州免费网站制作怎么用阿里云服务器搭建wordpress
  • php猎奇源码 织梦新闻视频图片八卦娱乐趣事资讯门户网站模板html代码表格
  • 南通做网站优化哪家好网页策划书 网站建设定位
  • 防止访问网站文件夹绵阳 网站设计
  • 网页与网站的区别是什么东莞网站公司排名
  • 盐城市城乡和住房建设厅网站wordpress文章订阅
  • 济南网站优化wordpress文件上传到那个文件
  • 外贸网站租用外国服务器好还是自己装一个服务器好高质量外链网站
  • 珠海专门做网站成都到西安
  • 网站做1920px好吗长沙seo优化排名
  • 哈尔滨微信网站开发wordpress 视
  • wordpress 分享封面图片尺寸重庆官网优化乐育公司
  • dede手机网站更新受欢迎的昆明网站建设
  • 网站设计外包合同专做自驾游的网站
  • 网站建设服务预算游戏网站怎么赚钱
  • 怎么做网站关键词视频手机网页前端开发
  • 好网站具备条件网站建设外链