当前位置: 首页 > news >正文

徐州祥云做网站深圳建设工程信息价

徐州祥云做网站,深圳建设工程信息价,a+网络推广平台,wordpress 社交分享背景 项目中APP端发帖#xff0c;评论可能包含多个关键词#xff0c;铭感词。此时需要对该内容进行过滤处理。此前都是在客户端层面操作#xff0c;这样不仅带来了性能的损耗#xff0c;而且新增铭感词时#xff0c;需要客户端重新打包上架#xff0c;显得十分不合理。所…背景 项目中APP端发帖评论可能包含多个关键词铭感词。此时需要对该内容进行过滤处理。此前都是在客户端层面操作这样不仅带来了性能的损耗而且新增铭感词时需要客户端重新打包上架显得十分不合理。所以应该在服务端层面进行算法数据处理。 DFA 算法 DFA 全称为: Deterministic Finite Automaton, 即确定有穷自动机。其特征为有一个有效状态的集合和一些从一个状态通向另一个状态的边每条边上标记有一个符号其中一个状态是初态某些状态是终态。但不同于不确定的有限自动机DFA 中不会有从同一个状态触发的两条边标志有相同的符号。 确定状态以及引起状态转换的事件都是可确定的不存在“意外”有穷 状态以及事件的数量都是可穷举的 DFA 算法模型如下 state_event_dict {匹: {配: {算: {法: {is_end: True},is_end: False},关: {键: {词: {is_end: True},is_end: False},is_end: False},is_end: False},is_end: False},信: {息: {抽: {取: {is_end: True},is_end: False},is_end: False},is_end: False} }用通俗易懂的话来解释就是将数据库中的铭感词进行建立树结构举个例子数据库的铭感词汇有三个分别是今天今天很好今天真烦 建立树结构并且标记好三个词汇的非叶子节点和叶子节点 (即最后一个字符是非叶子节点)并且制定好匹配规则只有碰到叶子节点才算一次过滤 模拟用户输入以下一句话: 我觉得今天还行。 接下来我们将这句话逐个字拆分并将每一个字代入到上面的树状结构图中。 前面三个字不在铭感词树种直接可以跳过直到遇到今这个字发现匹配上铭感词树接下来看树状结构发现只有一个字是天才能捕获。再接着走发现在树结构中天这个字的下一个字只有匹配到很或者真才能继续匹配而用户输入的下一个字是还第一步判断当前已经走到了叶子节点故先将今天置为敏感词。然后将还这个字从Top顶节点中重新继续流转发现无法匹配。过滤结束且当前的节点是叶子节点故这句话仅仅被[敏感词过滤]了今天这两个字最终的过滤结果应该是 我觉得**还行 要注意的是只有完整的碰到过一次叶子节点才算一次过滤且一句话可以被多次过滤。以上就是针对DFA算法的简单说明。 简单使用 Hutool 工具类中通过WordTree 实现类DFA 算法能构方便的做到开箱即用 这是源码中的一个简单介绍 import cn.hutool.dfa.WordTree;public static void main(String[] args) {WordTree wordTree new WordTree();wordTree.addWords(希望, 这是真的, 哈哈);// 搜索出内容中名并输出String text 我希望你是最好的;ListString matchWords wordTree.matchAll(text, -1, true, true);System.out.println(matchWords); // [希望]// 是否匹配上内容的铭感词,匹配上返回trueboolean match wordTree.isMatch(text);System.out.println(match); // true }
http://www.zqtcl.cn/news/961036/

相关文章:

  • 沈阳做网站好的网站分析论文
  • 做熟食的网站美食网站网站开发后端书籍
  • 做模板下载网站挣钱吗网站建设专业导航网站
  • 网站目录结构html静态网站作品
  • 南通建设局网站分类门户网站系统
  • 合肥网站建设企业秒玩小游戏入口
  • 个人做网站开发个人网站备案取名
  • 替代wordpress 搜索seo优化排名易下拉程序
  • asp.net 网站 方案小程序开发是前端还是后端
  • 网站开发 介绍 回扣建设项目验收在哪个网站公示
  • 建立网站免费如何做物流网站
  • 重庆网站设计费用wordpress自动翻页
  • 燕郊做网站的公司seo快速优化
  • 建了网站却搜不出来设计网站室内
  • 网站运营维护新闻摘抄大全
  • 怎么优化网站的单个关键词排名wordpress 安装百度编辑器
  • led网站建设方案模板做炒作的网站
  • 注册网站免费注册qq邮箱seo服务销售招聘
  • 翻译做网站php做网站好学吗
  • 网站模板 seo响应式网站内容布局
  • 石家庄住房和城乡建设部网站企业自助建站系统怎么建
  • 建设企业网站都需要啥网站开发 自我评价
  • 购物网站主页怎么做网站建设的优势何江
  • 宿州网站建设多少钱广西壮族自治区医保网上服务大厅
  • 宾馆酒店 网站模板wordpress手动获取相关文章
  • 荆州网站开发在线推广网站的方法
  • 可以查企业的网站网站建设的外国文献
  • 什么网站可以做相册视频企业网站开发时间
  • 德州市建设小学网站精品网站建设费用
  • 云主机可以做几个网站wordpress 自动发布