当前位置: 首页 > news >正文

建设银行江苏分行网站广州网页设计机

建设银行江苏分行网站,广州网页设计机,建湖企业做网站多少钱,岷县网站建设加词#xff0c;加产品#xff0c;调价是广告主的核心问题#xff0c;为了解决广告主加词的问题在阿里巴巴以及速卖通的账户后台提供了加词利器——先知#xff0c;一键解决广告主烦恼#xff0c;从此不再为加词而忧愁。一 引言 在目前付费搜索引擎中#xff0c;买词和竞… 加词加产品调价是广告主的核心问题为了解决广告主加词的问题在阿里巴巴以及速卖通的账户后台提供了加词利器——先知一键解决广告主烦恼从此不再为加词而忧愁。 一 引言 在目前付费搜索引擎中买词和竞价成为广告主竞争流量的主要手段。因此在付费搜索引擎的广告主账户后台中所有的功能都是围绕三个点在展开第一推广产品(product)第二购买关键词(keyword)第三关键词出价(bidprice)。在广告主加入新的产品时第一诉求就是购买关键词。在目前国际B类电商平台上广告主如何在网站千万级的关键词中选择适合该产品的关键词对于用户来说是一个艰难的任务。并且考虑到网站整体的检索质量网站展示的广告必须和用户的搜索意图相符所以在广告主购买关键词时必须要求购买的关键词和产品能够绑定所谓绑定就是keyword和product的相关性分(mlrscore)必须保证在良及以上。千万级的keyword集合挑选适合购买的关键词少之又少。如何给用户提供高效选词的渠道成为广告后台账户的重点。 在阿里巴巴国际站投放广告开始广告后台就有了产品推词模块——先知。先知主要提供根据产品给用户推荐适合购买的关键词。在广告主进入后台进行买词时先知都会实时计算出广告主可以购买的关键词集合为广告主提供高效的买词解决方案。 二 模块及算法设计 产品推词包含四个模块 QueryProcess模块完成title中心短语的抽取。query特征抽取模块为离线模块抽取完特征后导入引擎由引擎建立倒排索引。检索引擎模块完成匹配query的召回。mlrscore计算模块完成offer和query的文本相关性计算。模块间的调用关系如下图所示 2.1 中心短语抽取 2.1.1 中心短语构造 TermWeight作为底层基础模块完成query以及产品title中的term权重分析。TermWeight使用同session的点击query作为训练数据使用GBDT模型进行训练构建成query以及title的term权重分析的算法模块。 通过TermWeight分析后term权重越高表明该term在title中的价值越大因此通过分析后的weight排序取top n的term作为title的核心短语。 在QP模块中TermWeight分析后的term取top50%的term为有用的term记为Tu有用term的top50%为重要的term记为Ti。如果term长度小于6则所有的query都作为有用的term。如果term的长度大于16最多取8个term为有用term。 使用重要term集合Ti和有用Term Tu进行两两组合再组合时考虑term在title中的位置信息。考虑组合的位置信息共有4种位置分别如下 w1 w2型表示在title中w1是出现在w2前面所以组合的中心短语只有w1 w2一种。 w2 w1型表示在title中w2出现在w1前面组合成w2 w1的中心短语。 w1 w2 w1型表示在title中w1即在w2前面出现也在后面出现所以组合的中心短语有两种分别为w1 w2和w2 w1。 w2 w1 w2型表示在title中w1前后都出现了w2。可以组合成w2 w1和w1 w2两种query。 根据上述四种组合并去重得到title的初步组合中心短语。中心短语的权重使用组合的两个term中权重较高者表示。 2.1.2 中心短语语言模型处理 根据3.1.1中的方式初步构造出了title的中心短语组合出的中心短语很多并不符合语法规范。在3.1.1中组合的只有bigram所以使用bigram语法对组合的中心短语进行过滤。 bigram语法的线下训练方式如下 bigram训练数据由网站所有offer的title和搜索query组成。bigram的权重使用在文本中出现的频率来表示是否符合语法如果两个单词经常一起出现则对应的频率也会比较高。 统计bigram的方法如下 对每条文本进行归一化然后进行切分。得到有序的word.按照有序的方式分别统计bigram出现的次数以及每个单词出现的次数。计算bigram的频率。PxixjCxixj/Cxi。Cxixj是xi xj出现的次数Cxi是xi出现的次数。为了减小索引的大小在计算频率是过滤Cxi100的term。3.1.1中得到的bigram经过语言模型处理得到bigram的频率。结合bigram在termweight中的权重得到bigram总的权重。总权重计算方式如下 finalweight0.4*(bi_weight/max_bi_weight)0.6*(t_weight/max_t_weight) 其中bi_weight为当前bigram的语言模型频率max_bi_weight为title的所有bigram中语言模型频率的最大值。t_weight为bigram的termweight权重max_t_weight为title的所有bigram中termweight的最高权重。最后的结果再按照线性组合。 在上述语言模型中对于未登录词在训练bigram时并没有进行平滑所以在处理是如果是未登录词则返回MIN_WEIGHT0.000001的极小值。 2.2 线下Query特征抽取 为了满足产品推词的精准以及买词的合理性需要对offer能够推荐的词进行筛选所以需要对Query进行特征分析检索时根据query的特征计算排序分。 Query特征抽取模块为线下模块设计的特征主要为Query的预测类目Query的中心词Query的长度等。 2.3 检索引擎 QP获得的中心短语进行检索使用query的特征和中心短语的特征计算整体检索的排序分然后最终取top的检索结果作为offer推词的初步结果然后在调用rs计算QSScore根据QS分最为最终的推词结果。
http://www.zqtcl.cn/news/412754/

相关文章:

  • 东莞沙田网站建设榆林网站建设价格
  • 无锡网站制作建设wordpress写文章模板
  • 企业网站销售提升学历要多少钱
  • 打开建设银行官方网站首页wordpress 站库分离
  • 电子商务网站建设的试卷设计之家app
  • 抚养网站建设黔东南小程序开发公司
  • 网站建设相关行业有哪些wordpress 内容管理系统
  • 网站 备案地温州网站优化排名推广
  • 做网站的工作量国内 wordpress
  • 定制网站开发是什么大业推广网站
  • 网站建设每年需要交多少钱天津制作网站公司
  • 网站平台都有哪些wordpress 主题制作 视频
  • 中山网站建设方案家具网站开发目的
  • 教师个人网站建设建模培训多少钱
  • 个人网站可以做社交类型网站建设功能说明书
  • 微站是什么移动网站 拉新
  • 黑龙江省农业网站建设情况wordpress4.94主题上传不显示
  • 个人网站的域名重庆建立公司网站
  • 什么做网站做个多少钱啊百度网盘app
  • 做网站的公司挣钱吗石家庄房产
  • 烟台网站建设设计公司安徽建设工程信息网查询平台蔡庆树
  • 微信链接的微网站怎么做西安企业网站制作价格
  • uniapp怎么做淘客网站表格布局的网站
  • wordpress侧栏图片插件提升seo搜索排名
  • 如何查询网站的域名注册邹城建设银行网站
  • 招生门户网站建设方案国家企业信用信息公示信息查询网
  • 用dw做淘客网站的步骤移动互联网应用技术
  • 企业合作的响应式网站石家庄网站建设推广
  • 成都网站排名优化开发广告传媒公司简介模板
  • 中山网站建设企业网站内容建设