当前位置: 首页 > news >正文

网站质量建行员工app最新版下载

网站质量,建行员工app最新版下载,网站手机端首页用什么软件做,工装效果图网站textdistance是Python的第三方库#xff0c;用于计算文本之间的相似度或距离。它提供了30个算法#xff0c;简单易用。 安装 pip install textdistance# 使用扩展库#xff0c;提高性能 pip install textdistance[extras]使用 import textdistance# 计算编辑…textdistance是Python的第三方库用于计算文本之间的相似度或距离。它提供了30个算法简单易用。 安装 pip install textdistance# 使用扩展库提高性能 pip install textdistance[extras]使用 import textdistance# 计算编辑距离 distance textdistance.levenshtein.distance(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(编辑距离:, distance)# 计算余弦相似度 similarity textdistance.cosine.similarity(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(余弦相似度:, similarity)# 计算 Jaccard 系数 coefficient textdistance.jaccard(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(Jaccard 系数:, coefficient)# 计算 Hamming 距离 distance textdistance.hamming.distance(如何更换花呗绑定银行卡, 花呗更改绑定银行卡) print(Hamming 距离:, distance)结果 编辑距离: 5 余弦相似度: 0.8040302522073697 Jaccard 系数: 0.6666666666666666 Hamming 距离: 10应用场景 拼写检查 在拼写检查中可以使用编辑距离等算法来比较单词之间的相似度从而找出可能的正确拼写。 import textdistance# 拼写检查 word 发愤图强 possible_spellings [发奋图强, 发奋图, 发愤图]for spelling in possible_spellings:distance textdistance.levenshtein.distance(word, spelling)if distance 1:print(可能的正确拼写:, spelling)结果 可能的正确拼写: 发奋图强 可能的正确拼写: 发愤图文档相似度计算 在信息检索和推荐系统中经常需要计算文档之间的相似度以便为用户提供相关的信息或推荐内容。 import textdistance# 文档相似度计算 doc1 Python is a programming language doc2 Python is used for web development doc3 Java is a programming languagesimilarity1 textdistance.cosine.similarity(doc1, doc2) similarity2 textdistance.cosine.similarity(doc1, doc3)print(文档1和文档2的余弦相似度:, similarity1) print(文档1和文档3的余弦相似度:, similarity2)文档1和文档2的余弦相似度: 0.6063390625908325 文档1和文档3的余弦相似度: 0.8391463916782737数据清洗 在数据清洗过程中可以使用 Hamming 距离等算法来比较数据条目之间的相似度从而找出相似但不完全相同的数据。 import textdistance# 数据清洗 data [配偶, 原配, 元配, 老婆, 夫人, 爱人]for i in range(len(data)):for j in range(i1, len(data)):distance textdistance.hamming.distance(data[i], data[j])if distance 1:print(相似但不完全相同的数据:, data[i], data[j])结果 相似但不完全相同的数据: 原配 元配 相似但不完全相同的数据: 夫人 爱人import textdistance# 姓名匹配 name1 李建国 name2 张建国 name3 王爱国coefficient1 textdistance.jaccard.normalized_similarity(name1, name2) coefficient2 textdistance.jaccard.normalized_similarity(name1, name3)print(姓名1和姓名2的Jaccard系数:, coefficient1) print(姓名1和姓名3的Jaccard系数:, coefficient2)结果 姓名1和姓名2的Jaccard系数: 0.5 姓名1和姓名3的Jaccard系数: 0.19999999999999996textdistance 提供了丰富多样的文本比较算法和距离度量方法可以满足各种不同的文本比较需求。 相关链接 源码
http://www.zqtcl.cn/news/868718/

相关文章:

  • 网站顾客评价网站中怎么做网站统计
  • 网站建设安全措施表白网站是怎么做的
  • 一个服务器可以做几个网站百度北京公司地址全部
  • 武侯区网站建设哪里好点个人社保缴费比例是多少
  • 创建属于自己的网站定制应用软件有哪些
  • 网站建设类岗位建设工程施工合同示范文本2023最新版
  • 建站设计公司wordpress 跨域 cros
  • 做网站的公司哪好工程设计东莞网站建设技术支持
  • 虹口网站开发开发公司设计管理部绩效考核
  • 网站改版升级通知国外服务器公司有哪些
  • 做网站的s标的软件深圳网站建设 湖南岚鸿
  • 设计网站建设的合同书公司装修合同范本
  • 门户网站的好处企业邮箱系统
  • 重庆企业建站公司有那些网站做结伴旅游的
  • 创意营销策划案例网站网页制作及优化
  • 网站上动画视频怎么做的建设兵团12师教育局网站
  • 博客网站开发思维导图app网站制作公司
  • 池州网站建设有哪些公司兴义网站seo
  • seo优化网站模板网站建设的七大优缺点
  • 天猫国际采取的跨境电商网络营销方式关键词排名优化公司推荐
  • 亳州建设网站做网站文字怎么围绕图片
  • 网站开发 项目计划外链建设给网站起的作用
  • 你好南京网站网站开发实施步骤和说明
  • 文化共享工程网站建设情况wordpress菠菜插件
  • 网站大气是什么意思哈尔滨做网站电话
  • 公司网站站群是什么化妆品网站设计欣赏
  • 网站公司未来计划ppt怎么做平潭做网站
  • 做网站和推广工资多少招聘网站建设价格
  • 网站建设 响应式 北京网架公司十大排名榜
  • 网站推广目标关键词是什么意思网站推广软件工具