当前位置: 首页 > news >正文

青岛做网站的公司排名系网站建设工作总结

青岛做网站的公司排名,系网站建设工作总结,网亿(深圳)信息科技有限公司,免费的个人网站第1关#xff1a;预测句子概率 任务描述 本关任务#xff1a;利用二元语言模型计算句子的概率 相关知识 为了完成本关任务#xff0c;你需要掌握#xff1a;1.条件概率计算方式。 2.二元语言模型相关知识。 条件概率计算公式 条件概率是指事件A在事件B发生的条件下发…第1关预测句子概率 任务描述 本关任务利用二元语言模型计算句子的概率 相关知识 为了完成本关任务你需要掌握1.条件概率计算方式。 2.二元语言模型相关知识。 条件概率计算公式 条件概率是指事件A在事件B发生的条件下发生的概率。条件概率表示为PA|B。若只有两个事件AB则有如下公式 二元语言模型 二元语言模型也称为一节马尔科夫链通俗的讲我们可以认为这是一个词的概率实际上只是跟前边的词有关,那么就可以有以下的方程: 同时为了保证条件概率在 i1 时有意义同时为了保证句子内所有字符串的概率和为 1可以在句子首尾两端增加两个标志: BOS \W1W2…Wn\ EOS 为了估计P(WI|WI-1)的条件概率,我们计算出wi-1,wi的词汇出此案的频率然后进行归一化,公式如下: 计算出每个词汇的概率后便可根据公式求得句子的概率。 编程要求 根据提示在右侧编辑器补充代码计算并输出测试语句的概率 测试说明 平台会对你编写的代码进行测试 语料库 研究生物很有意思。他大学时代是研究生物的。生物专业是他的首选目标。他是研究生。 测试输入 研究生物专业是他的首选目标 预期输出 0.004629629629629629 import jiebajieba.setLogLevel(jieba.logging.INFO)# 将句子变为BOSxxxxxEOS这种形式 def reform(sentence):if sentence.endswith(。):sentence sentence[:-1]sentence sentence.replace(。, EOSBOS)sentence BOS sentence EOSreturn sentence# 分词并统计词频 def segmentation(sentence, dic):jieba.suggest_freq(BOS, True)jieba.suggest_freq(EOS, True) # 让jieba库知道BOS和EOS这两个词的存在并记录它们的出现频率lists jieba.lcut(sentence, HMMFalse) # 当输入的文本比较短时隐马尔科夫模型的效果可能会下降导致分词结果不准确if dic is not None:for word in lists:if word not in dic:dic[word] 1else:dic[word] 1return lists# 比较两个数列二元语法 def compareList(ori_list, tes_list):count_list [0] * len(tes_list)for t in range(len(tes_list)-1):for n in range(len(ori_list)-1):if tes_list[t] ori_list[n]:if tes_list[t1] ori_list[n1]:count_list[t] 1return count_list # 计算概率 def probability(tes_list, ori_dic, count_list):flag 0p 1del tes_list[-1]for key in tes_list:p * float(count_list[flag]) / float(ori_dic[key])flag 1return pif __name__ __main__:# 语料句子sentence_ori 研究生物很有意思。他大学时代是研究生物的。生物专业是他的首选目标。他是研究生。ori_dict {}# 测试句子sentence_test input()ori_dict2 {}sentence_ori_temp reform(sentence_ori)ori_list segmentation(sentence_ori_temp, ori_dict)sentence_tes_temp reform(sentence_test)tes_list segmentation(sentence_tes_temp, None)count_list compareList(ori_list, tes_list)p probability(tes_list, ori_dict, count_list)print(p) 第2关数据平滑 任务描述 本关任务实现二元语言模型的数据平滑并利用平滑后的数据计算句子概率。 相关知识 为了完成本关任务你需要掌握1.模型平滑化。2.good-turning平滑。 模型平滑 在使用语言模型直接计算某个句子出现的概率时可能会由于某个单词或单词对出现的概率为0而导致整个句子出现的概率为0。 例如下面这个场景 在上面的场景中由于部分单词对出现的概率为0导致最终两句话出现的概率均为0。但实际上s1“今天没有训练营”比s2“今天训练营没有”更符合语法习惯我们也更希望计算出来的P(s1)大于P(s2)。 一般来说语言模型的平滑处理可分为以下三类 Discounting折扣通过给概率不为0的项打折扣来提高概率为0的项的概率Interpolation插值在使用N-gram模型计算某一项的概率时同时结合低阶的模型所计算出的概率Back‐offapproximate counts of unobserved N‐gram based on the proportion of back‐off events (e.g., N‐1 gram)。 这里我们主要介绍与使用Discounting中的good-turning平滑方法。 good-turning平滑 Good-Turing技术是在1953年由古德I.J.Good引用图灵Turing的方法而提出来的其基本思想是用观察计数较高的N元语法数重新估计概率量的大小并把它指派给那些具有零计数或者较低计数的N元语法。涉及的符号含义为: c某个N元语法出现的频数。 Nc出现次数为c的 N-gram 词组的个数是频数的频数 c*Good-Turing平滑计数 设N为测试元组集合中元组的数目则有如下公式 通过新频数可计算出经过good-turing平滑后的元组概率公式如下 编程要求 根据提示在右侧编辑器补充代码编写平滑函数计算句子的概率 测试说明 平台会对你编写的代码进行测试 语料库 研究生物很有意思。他大学时代是研究生物的。生物专业是他的首选目标。他是研究生。 测试输入 他是研究物理的 预期输出 5.6888888888888895e-05 import jieba #语料句子 sentence_ori研究生物很有意思。他大学时代是研究生物的。生物专业是他的首选目标。他是研究生。 #测试句子 sentence_testinput() #任务编写平滑函数完成数据平滑利用平滑数据完成对2-gram模型的建立计算测试句子概率并输出结果 # ********** Begin *********# def gt(N, c):if c1 not in N:cx c1else:cx (c1) * N[c1]/N[c]return cx jieba.setLogLevel(jieba.logging.INFO) sentence_ori sentence_ori[:-1] words jieba.lcut(sentence_ori) words.insert(0, BOS) words.append(EOS) i 0 lengh len(words) while i lengh:if words[i] 。:words[i] BOSwords.insert(i, EOS)i 1lengh 1i 1 phrases [] for i in range(len(words)-1):phrases.append(words[i]words[i1]) phrasedict {} for phrase in phrases:if phrase not in phrasedict:phrasedict[phrase] 1else:phrasedict[phrase] 1 words_test jieba.lcut(sentence_test) words_test.insert(0, BOS) words_test.append(EOS) phrases_test [] for i in range(len(words_test)-1):phrases_test.append(words_test[i]words_test[i1]) pdict {} for phrase in phrases_test:if phrase not in phrasedict:pdict[phrase] 0else:pdict[phrase] phrasedict[phrase] N {} for i in pdict:if pdict[i] not in N:N[pdict[i]] 1else:N[pdict[i]] 1 N[0] 1 Nnum 0 for i in N:Nnum i*N[i] p 1 for phrase in phrases_test:c pdict[phrase]cx gt(N, c)p * cx/Nnum print(p)
http://www.zqtcl.cn/news/515432/

相关文章:

  • 专门做私人定制旅游的网站专做韩餐网站
  • 网站 续费wordpress首页调用指定分类
  • 2008系统怎么做网站免费设计软件下载
  • 做电音的软件的专业下载网站宁波俄语网站建设
  • 北?? 网站建设旅游手机网站开发
  • 乐清做网站的网站备案容易通过吗
  • 网站qq登录 开发一个小型网站开发成本
  • 湖北网络建设公司网站js跳转到别的网站
  • 郑州网站app开发的汽车网站 源码
  • 河南网站建设企业做网站多少钱西宁君博示范
  • 沈阳有做网站的吗青浦手机网站制作
  • 腾讯云免费建站建立一个网站英语
  • 沙漠风网站建设怎么样官方网站建设银行2010年存款利息
  • 360报危险网站微信代码小程序
  • 网站维护报价单国外 做励志视频的网站
  • 用源码做自己的网站公司网站建设哪家公司好
  • 网站运营做seohtml前端网站开发PPT
  • 上海网站定制设计图wordpress网站在线安装
  • 互动网站的核心技术wordpress不用插件
  • 厦门市建设工程交易中心网站怎么自己做游戏软件的app
  • 网站论文参考文献人力资源公司名称大全简单大气
  • 射阳做企业网站哪家好wordpress 进销存
  • 青海个人旅游网站建设wordpress用户名密码加密方式
  • 安徽平台网站建设找哪家wordpress首页加登录
  • 雅安市住房和城乡建设局网站湖南全程电子化服务平台官网
  • dw做的上传网站打不开网页制作培训价格
  • 工程网站怎么做广州做网站平台
  • 成都网站建设 全美深圳定制网站建设
  • 邢台网站建设与制作陕西高速公路建设集团网站
  • 太原 招聘 网站建设 技术经理关于 建设 二级网站