当前位置: 首页 > news >正文

效果图在哪个网站可以找比较好wordpress 3.8 中文

效果图在哪个网站可以找比较好,wordpress 3.8 中文,南京怎么做网站,企业为什么要增资喵喵喵#xff0c;细心的你有没有发现小夕已经将卧室和书房精装修了呢~可以输入口令【ho】#xff0c;或者点击主页的“旧的故事”标签进入哦。一个小现象小夕今天给大家讲一个自然语言处理/信息检索领域的小现象~细心的同学可能发现啦#xff0c;每当你在使用某度进行搜索时… 喵喵喵细心的你有没有发现小夕已经将卧室和书房精装修了呢~可以输入口令【ho】或者点击主页的“旧的故事”标签进入哦。一个小现象小夕今天给大家讲一个自然语言处理/信息检索领域的小现象~细心的同学可能发现啦每当你在使用某度进行搜索时一旦打了错别字往往不会影响你的搜索结果它会帮你自动校正。如下图所示~小夕把“搜狗”打成了“馊狗”可以看到某度自动将馊狗给校正成搜狗了。 同样的现象还会发生在输入法、word等一系列自然语言文本输入的场合中。那么看起来如此不可思议的事情是怎么做到的呢小原理 可能有机智的喵喵会想到只要将用户输入的词在字典里查一下不就好咯~查不到的词就是错词呀~ 说的很对哦但是更详细的说 分词在汉语纠错的时候还会有一个“分词”的过程就是将用户输入的一串文本切分成一个个的词语。比如用户输入了“搜狗搜索厉害吗”那么负责分词的代码就会将其分成“搜狗|搜索|厉害|吗”。如何分的呢小夕以后讲哦~为了缩小本文规模小夕以此处不需要分词的英文为例来讲解一下拼写校正技术。纠正首先在词典中查找确认该词是否为错词。但注意在不同的应用中词典的定义可能不一样呐。比如在输入法中词典是拼音词典只要合乎拼音语法基本就可以确定该词就是好词除非有更智能的优化。但在web搜索引擎中词典是搜索热度词典也就是记录用户输入某个词可能性的词典。比如上文中“馊狗”的搜索热度很低即罕见词。而与之相近的“搜狗”的热度会比“馊狗”的热度大很多此时就可以将“馊狗”看作是错词而实际上“馊狗”这个词语完全可能存在。 小夕为了缩小本文规模不讨论分词过程哦因此以英文单词为例讲解。英文中的空格自带分词属性2333小难点 而第二步的关键点或者说难点在哪里呢显然查找某个词是否是罕见词很容易就去词典里翻一翻就好了。但是如何确定与该错词的正确形式呢或者说如何确定用户心里真正想输入的那个词呢这就是关键啦。 一个很简单的例子是计算该错词与其他正常词的相似度这个相似度叫编辑距离。然后我们得到编辑距离最小也就是相似度最大的词就是该错词的正确形式啦~ 编辑距离有多种计算方法其中最常用的是计算Levenshtein距离。Levenshtein 这Levenshtein距离怎么计算呢首先了解一下编辑操作1、    将一个字符插入字符串2、    从字符串中去除一个字符3、    将字符串中的一个字符替换成另外一个字符。 令上述操作的每一步的代价都为1则一个单词变换成另一个单词的最小代价也就是最少编辑操作次数就为这两个单词的Levenshtein距离。 那么如何用算法实现两个单词之间的Levenshtein距离计算呢小算法 还记不记得小夕在上一篇文章中教给你的方法吖要从算法问题中提炼算法思想哦然后将算法思想再用于新的算法问题 假如我们要计算paris和alice的Levenshtein距离利用上一节提炼出来的枚举法、分治法等思想是不是很轻松就出来思路啦但是呢小夕在这里不用这么low的算法啦小夕要用动态规划DP思想来解决这个问题 DP思想呢小夕的解释就是DP会记忆你之前已经走过的道路因此不会像枚举法分治一样来来回回的对同一种情况反复计算。之前完全不了解DP的喵喵小夕强烈建议你去看《算法导论》上的讲解哦炒鸡清晰 好在开始之前我们先画一张表格用来记录走过的路~这张表的每个元素都代表着两个串的编辑距离。比如上图中的元素N就代表着“pa”到“al”的编辑距离最右下角的元素就代表着“paris”到“alice”的编辑距离最左上角的元素代表着null到null的编辑距离。 显然呀要从左上角按照某种轨迹走到右下角呢~想不明白的请面壁喵喵喵 null到null的距离当然是0啦。所以第一个元素填0。然后我们从左往右走一行走完就从下一行的最左边开始走直到走到右下角。 显然第二个元素代表从null到p的距离我们只需要在它左边的元素的基础是也就是null到null的基础上将第二个null添加一个字符p回忆一下前面的三种编辑操作。所以代价增加1所以第二个元素等于011。同理写出第一行的其他元素值。第二行的第一个元素只需要在它头上的元素的基础上加个a所以是01。而第二个元素开始就复杂些了它1可以在左边元素的基础上修改2也可以在上边元素的基础上修改。3万一遇到两个字符串末尾元素相同的情况则编辑距离要等于左上角元素。比如pred到had的编辑距离与pre到ha的编辑距离相等所以我们额外定义一下如果两串末尾的元素不相等则编辑距离还可以等于左上角元素的值1。 然后我们计算出这三种情况后取最小值为该元素的最终值。如图该格子的左上角的1是基于左上角元素1得到右上角的2是基于上边的元素1得到左下角的2是基于左边的元素1得到右下角为前面这三种情况的最小值。 于是按照这种思路整个表格就画成啦~所以呀前面讲过了最右下角元素的右下角的值就是paris与alice的最小编辑距离啦~即为4。 有人觉得诶计算量看起来也蛮大的嘛。好咯你可以用蛮力法分治画一张图试试你就知道这张表格多小啦 Completed 看吧~人工智能大领域中的NLP领域的一个任务最核心的就是你们算法课上学的动态规划啦~千万不要书到用时方恨少哦跟小夕一起学算法吧喵喵喵~ 所以要不要考虑给小夕买好吃的呀o(≧v≦)o
http://www.zqtcl.cn/news/200386/

相关文章:

  • 网站运营有什么用常熟智能网站开发
  • 如何组建做网站的团队绍兴网站建设推广
  • 资讯类响应式网站模板深圳网站建设培训机构
  • 电子商务网站功能设计3d动画制作过程
  • 随机网站生成器win7asp+sql server 2008做网站
  • 金本网站建设设计江苏建筑业网
  • 校园网站建设的作用淄博网站建设网站推广优化
  • 域名过期了怎么办怎么找回网站校友录网站开发设计
  • 医疗 企业 网站建设seo网络优化是什么工作
  • e时代速递搜索引擎网站建设aso关键词搜索优化
  • 产品单页营销型网站模板龙华网站建设深圳信科
  • 建网站平台要多少钱投资公司取名字大全
  • 建设网站需要哪些设备重庆本地建站
  • 学做家常菜去那个网站专业制作网站制作
  • 合肥网站建设公网站程序如何上传
  • 潍坊网站建设招聘官方网站建设 在线磐石网络
  • 校友网站建设开一个网站的流程
  • 商业门户网站是什么意思哪家培训机构学校好
  • 青岛企业网站制作seo排名优化培训网站
  • 2018做网站还是app上海搜索seo
  • 网站建设用模板好吗罗湖网站制作费用
  • 网站图片延时加载app推广视频
  • 郑州设计师网站个人搭建网站要多少钱
  • 网站制作成品下载wordpress怎么更改样式
  • 河北省城乡和建设厅网站首页网站维护属于什么部门
  • 西安建网站公司哪家好网站导航条设计欣赏
  • 张家港网站网络优化济南网站建设0531soso
  • 关于网站的建设深圳搜索优化排名
  • 网站建设的布局建设通破解vip
  • 怎样做公司网站介绍网站百度排名优化