当前位置: 首页 > news >正文

快速搭建网站教程巴中做网站公司

快速搭建网站教程,巴中做网站公司,W7如何安装WordPress,株洲网红在使用Hanlp词典或者jieba词典进行分词的时候#xff0c;会出现分词不准的情况#xff0c;原因是内置词典中并没有收录当前这个词#xff0c;也就是我们所说的未登录词#xff0c;只要把这个词加入到内置词典中就可以解决类似问题#xff0c;如何操作呢#xff0c;下面我…在使用Hanlp词典或者jieba词典进行分词的时候会出现分词不准的情况原因是内置词典中并没有收录当前这个词也就是我们所说的未登录词只要把这个词加入到内置词典中就可以解决类似问题如何操作呢下面我们来看一下一在Hanlp词典中添加未登录词1.找到hanlp内置词典目录位于D:\hnlp\hanlp_code\hanlp\data\dictionary\custom也就是Hanlp安装包中的data\dictionary\custom下目录2.将未登录词以词名词性词频的格式添加到文件中(句首或者句尾都可以)3.将字典的同名bin文件删除掉执行文件时读取的是bin文件必须删掉后等下次执行时重新生成新字典才发挥作用4.使用新字典重新执行文件执行时会遇到没有相关bin文件的提示不过放心程序会自动生成一个新的bin文件骚等片刻就好了。验证结果是否正确二在jieba词典中添加未登录词先来看看没添加登录词的效果好我们需要开始添加未登录词了1.新建一个dict.txt文件将未登录词直接添加到txt文件中2.加载dict.txt文件这个过程有一步要动态调整词频因为词典默认是从词频较高的词开始匹配调整未登录词的词频靠前这样可以优先匹配#-*- codingutf8 -*-import jiebaimport re#将添加有未登录词的词典加载进来jieba.load_userdict(D:\hnlp\hanlp_code\dict.txt)#动态调整词频让未登录词的词频自动靠前这样可以优先匹配[jieba.suggest_freq(line.strip(), tuneTrue) for line in open(dict.txt,r,encodingutf8)]stringTNM分期不太能明确地区分 ,以及辅助治疗(氟尿嘧啶单药或联合奥沙利铂)wordsjieba.cut(string,HMMFalse)print(/.join(words))3.验证分词是否有效文章来源于小鱼儿的博客
http://www.zqtcl.cn/news/322900/

相关文章:

  • 管理外贸网站模板下载大数据营销优势
  • 做网站的小图标硬盘做网站空间
  • 微信网站界面设计宁波网站优化公司推荐
  • 深圳商城网站开发七冶建设集团网站
  • 广州旅游网站建设设计公司wordpress长文章分页代码
  • 手机营销网站网站的字体
  • 设计网站大全软件互动营销用在哪些推广上面
  • 建设银行网站怎样查询贷款信息吗台州网站制作 外贸
  • 建设网站的步骤知乎app开发定制公司
  • 怎样自己做刷赞网站专业网站设计服务
  • 云主机建站如何让自己做的博客网站上线
  • 目前我们的网站正在建设中做网站违反广告法
  • 有没有做美食的规模网站怎么做国外的网站吗
  • 竭诚网络网站建设开发杭州百度推广
  • 怎样购买起名软件自己做网站小程序制作收费
  • 制作企业网站欢迎界面素材cuntlove wordpress
  • 适合建设网站的国外服务器人工智能培训机构
  • 怎么套网站潜江资讯网招聘信息
  • 网站建设 微信公众号建设网站需要
  • 做房产经纪的那些网站可以进客网站关键词排名如何做
  • 网站建设实验总结百科wordpress 前台插件
  • 招聘网站建设销售成都 网站建设
  • 手机选择网站wordpress捐赠按钮
  • 网站建设上动漫制作教学
  • 怎么用cms做网站计算机网络技术专业
  • 建设部颁发的证书网站请问注册公司怎么注册
  • 网站开发php和c语言区别网站开发教程大全
  • 建设银行通控件网站谷歌推广
  • 我要建网站需要什么付费wordpress
  • 网站收录查询情况wordpress主题仿