当前位置: 首页 > news >正文

桥 网站建设抚州招聘网站建设

桥 网站建设,抚州招聘网站建设,wordpress备份百度云,做网站还赚钱么机器学习的一个重要应用就是文档的自动分类。在文档分类中#xff0c;整个文档#xff08;比如电子邮件#xff09;是实例#xff0c;而电子邮件中的某些元素则构成特征。虽然电子邮件是一种会不断增加的文本#xff0c;但我们同样也可以对新闻报道、用户流言、公文等其他…机器学习的一个重要应用就是文档的自动分类。在文档分类中整个文档比如电子邮件是实例而电子邮件中的某些元素则构成特征。虽然电子邮件是一种会不断增加的文本但我们同样也可以对新闻报道、用户流言、公文等其他任意类型的文本进行分类。我们可以观察文档中出现的词并把每个词的出现或者不出现作为一个特征这样得到的特征数目就会跟词汇表中的词目一样多。朴素贝叶斯是贝叶斯分类器的一个扩展适用于文档分类的常用算法。 使用每个词作为特征并观察他们是否出现这样得到的特征数目会非常非常多。据估计仅在英语中单词总数就有500000之多为了进行英文阅读估计需要掌握数千单词。 朴素贝叶斯的一般过程 1、收集数据 2、准备数据需要数值型或者布尔型数据 3、分析数据有大量特征时绘制特征作用不大此时使用直方图效果更好 4、训练算法 5、测试算法 6、使用算法一个常见的朴素贝叶斯应用是文档分类。可以在任意的分类场景中使用朴素贝叶斯分类器不一定非要是文本。 假设词汇表中有1000个单词。要得到好的概率分布就需要足够的数据样本假定样本数为N。由统计学知如果每个特征需要N个样本那么对于10个特征将需要个样本对于包含1000个特征的词汇表将需要个样本。可以看到所需要的样本数会随着特征数目增大而迅速增长。 如果特征之间相互独立那么样本数就可以从减少到1000*N。所谓独立指的是统计意义上的独立即一个特征或单词出现的可能性与它和其他单词相邻没有关系。举个例子假设单词bacon出现在unhealthy后面与出现在delicious后面的概率相同。当然我们知道这种假设并不成立bacon尝尝出现在delicious附近很少出现在unhealthy附近这个假设正式朴素贝叶斯中朴素一词的含义。朴素贝叶斯分类器中的另一个假设是每个特征同等重要。其实这个假设也有问题。 如果要判断留言板的留言是否得当那么可能不需要看完所有1000个单词而只需要看10~20个特征就足可以做出判断了。尽管上述假设存在一些小的瑕疵但朴素贝叶斯的实际效果很好。
http://www.zqtcl.cn/news/655335/

相关文章:

  • ps做网站的优点国际设计师网站有哪些
  • 学校网站建立安阳市网站建设
  • 邢台做网站流程摄影工作室网站设计
  • 掉关键词网站重大军事新闻
  • 建材网站建设功能方案上海建筑室内设计有限公司
  • 高端企业网站设计公司怎么帮公司做网站建设
  • 湖北专业网站建设维修电话企业网络管理方案
  • 做网站外链wordpress网页怎么上传
  • wordpress站点优化石景山网站开发
  • 企业网站建设的流程店铺推广引流
  • 北京网站优化wyhseo信息化建设杂志社官方网站
  • 网站图片处理方案动漫制作这个专业怎么样
  • 做写手哪个网站好黄页网站建设黄页网站建设
  • 多语言企业网站免费模板网站哪个好
  • 拟一份饰品网站建设合同襄樊门户网站建设
  • 你对网站第一印象受欢迎的广州做网站
  • 网站开发项目的需求分析浙江省城乡建设网站证件查询
  • 整站seo定制简单 大气 网站模版
  • 网站界面设计策划书怎么做云匠网订单多吗
  • html教程 pdf网站建设优化兰州
  • 招聘网站可以同时做两份简历吗外贸网站示例
  • 黑链 对网站的影响企业融资计划书范本
  • 自己的简历怎么制作网站学院网站建设成效
  • 周口seo 网站郑州建站网站的公司
  • 网站布局模板北京装修大概多少钱一平方
  • 德阳网站建设ghxhwl风景网站模板
  • 昌邑网站建设拓者设计吧现代效果图
  • 学校网站建设成功案例网站开发需要学习哪些内容
  • 怎么让公司建设网站seo于刷网站点击
  • 网站建设合同严瑾建设网站宣传