当前位置: 首页 > news >正文

网站建设页面要求石家庄网站制作找谁

网站建设页面要求,石家庄网站制作找谁,seo综合查询爱站,什么是友情链接?引言 在推荐系统中#xff0c;用户历史行为序列是极其重要的信息源。用户最近的点击、点赞、收藏、转发等行为能够有效反映其即时兴趣#xff0c;无论是在召回、粗排还是精排阶段#xff0c;合理利用这些行为序列都能显著提升推荐效果。本文将系统介绍用户行为序列建模的几…引言 在推荐系统中用户历史行为序列是极其重要的信息源。用户最近的点击、点赞、收藏、转发等行为能够有效反映其即时兴趣无论是在召回、粗排还是精排阶段合理利用这些行为序列都能显著提升推荐效果。本文将系统介绍用户行为序列建模的几种经典方法简单平均法、DIN模型深度兴趣网络以及SIM模型基于搜索的用户兴趣建模。 1. 简单平均法Last-N Average 基本思想 Last-N 特征是指用户最近的 nnn 次交互如点击、点赞等的物品 ID。对这些物品 ID 进行嵌入Embedding得到 nnn 个向量然后对这些向量取平均将得到的均值向量作为用户的一种特征表示。该方法计算简单易于实现可广泛应用于召回双塔模型、粗排三塔模型以及精排模型中。 数学表达如下 设用户最近 nnn 次交互的物品嵌入向量为 v1,v2,…,vn\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_nv1​,v2​,…,vn​则用户特征向量 u\mathbf{u}u 为 u1n∑i1nvi\mathbf{u} \frac{1}{n} \sum_{i1}^{n} \mathbf{v}_i un1​i1∑n​vi​ 实践经验 除了使用物品 ID 嵌入外还可以结合类目等特征进行嵌入拼接这样通常比仅使用 ID 嵌入效果更好。不过取平均是一种较为基础的操作目前更主流的方法是使用注意力机制尽管这会带来更大的计算开销。 注不同公司的系统基础设施水平存在差异实践中需根据实际情况选择适合的方案。 2. DIN模型引入注意力机制 动机 简单平均法对所有历史行为一视同仁忽略了用户兴趣的动态变化。DINDeep Interest Network通过引入注意力机制对用户历史行为进行加权平均权重由候选物品与历史行为的相似度决定。 模型结构 对于每个候选物品计算其与用户 Last-N 个历史行为物品的相似度记为 aia_iai​i1,…,ni1,\dots,ni1,…,n以这些相似度为权重对历史行为物品的嵌入向量进行加权求和得到用户兴趣表示。 数学表达如下 u∑i1nai⋅vi\mathbf{u} \sum_{i1}^{n} a_i \cdot \mathbf{v}_i ui1∑n​ai​⋅vi​ 其中 aia_iai​ 是候选物品与第 iii 个历史物品的相似度可以通过内积、余弦相似度或更复杂的网络计算。 其实本质上是注意力机制 适用范围 适用于精排模型。不适用于双塔或三塔模型因为注意力机制需要同时看到用户历史行为和候选物品而双塔模型在用户塔中无法获取候选物品信息。 参考文献Zhou et al. Deep Interest Network for Click-Through Rate Prediction. In KDD, 2018. 3. SIM模型处理长期行为序列 动机 DIN 模型的计算复杂度与行为序列长度 nnn 成正比因此通常只能处理几百个最近的行为难以利用更长期的用户历史。SIMSearch-based Interest Modeling模型通过两阶段搜索机制在保留长期兴趣的同时控制计算量。 主要目的是保留用户的长期兴趣 DIN 注意力层的计算量 ∝\propto∝ n用户行为序列的长度只能记录最近几百个物品否则计算量太大缺点关注短期兴趣遗忘长期兴趣 增加用户行为序列可以显著推荐系统的各项指标但是让行为序列变长是不划算 目标保留用户长期行为序列n很大而且计算量不会过大。 DIN对LastN向量做加权平均权重是相似度 如果LastN物品与候选物品差异很大则权重接近零 快速排除掉与候选物品无关的LastN物品降低注意力层的计算量 SIM模型 工业界公认SIM模型是有效的 保留用户长期行为记录n的大小可以是几千对于每个候选物品在用户LastN记录中做快速查找找到k个相似物品比如k 100.把LastN变成TopK然后输入到注意力层SIM模型减少计算量从n降低到K 两阶段机制 第一阶段搜索Search 从用户长期行为序列例如几千个历史物品中快速检索出与候选物品最相关的 kkk 个物品例如 k100k100k100。具体方法有两种 Hard Search根据候选物品的类目筛选出同类目的历史物品。实现简单无需训练。Soft Search将物品表示为嵌入向量通过最近邻搜索如 KNN找出与候选物品最相似的 kkk 个历史物品。效果更好但对工程基础设施要求较高。 第二阶段注意力聚合 将筛选出的 kkk 个物品输入注意力层类似 DIN计算加权和作为用户兴趣表示。 时间信息的利用 SIM 模型通常引入时间信息来增强长期行为序列的表征 记录用户与每个历史物品交互的时刻距今的时间间隔 δ\deltaδ。对 δ\deltaδ 进行离散化如划分为 1天、7天、30天、1年等区间并嵌入为向量 d\mathbf{d}d。将物品嵌入 v\mathbf{v}v 与时间嵌入 d\mathbf{d}d 拼接共同作为历史行为的表征。 x[v;d]\mathbf{x} [\mathbf{v}; \mathbf{d}] x[v;d] 为什么SIM需要使用时间信息 DIN 仅处理短期行为时间跨度小时间因素影响不显著。SIM 处理长期行为时间越久远的行为重要性通常越低引入时间信息可以带来显著提升。 结论 长序列长期兴趣优于短序列近期兴趣。注意力机制优于简单平均。Soft Search 优于 Hard Search但取决于工程基础。使用时间信息对效果有提升。 参考文献Qi et al. Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction. In CIKM, 2020. 总结 用户行为序列建模是推荐系统的核心环节。从简单平均到注意力机制DIN再到基于搜索的长期兴趣建模SIM每一步演进都在更好地平衡效果与计算效率。实践中需根据业务需求、数据规模和基础设施条件选择合适的方法并灵活引入时间等辅助信息以进一步提升模型性能。 Reference 王树森 bilibili推荐系统
http://www.zqtcl.cn/news/714144/

相关文章:

  • 北京做网站推广多少钱丽水网站建设公司排名
  • 淄博网站关键词优化安丘网站建设公司
  • 教育建设网站wordpress 创建模板文件
  • 门户网站开发视频教学百度关键词怎么刷上去
  • 做网站搞流量挂联盟广告变现新媒体营销心得体会
  • 网站做信息流网站如何做担保交易平台
  • php网站后台访问统计分析互联网营销师题库
  • 提供建站服务的网络公司的比较注册网站域名后免费建站
  • 颍上建设网站长江商学院 网站建设
  • 做酒店销售上哪个网站好东莞出租车公司
  • 如何在记事本中做网站链接好看的wordpress文章模板下载
  • 做二手衣服的网站有哪些安县移动网站建设
  • 学习资料黄页网站免费美丽乡村 网站建设
  • 仲恺住房和城乡建设局网站上海wordpress
  • 网站整体结构国内现货正规交易平台
  • 正规的网站制作开发平度建设网站
  • 建筑网站在哪里找松岗网站
  • 网站开发后台框架贸易网站建站
  • 定州做网站宝安设备网站设计
  • 高端网站制作技术吉利汽车新能源品牌
  • 阿里云大学 网站建设常州网警
  • 做的网站访问不了lovefort表白网站制作
  • 自己如何做公司网站视频seo快速排名软件首页
  • 一站式做网站技术兰州网站设计哪个平台好
  • 网站按钮psdwordpress哪个主题
  • 阜宁网站制作哪家好建瓯建设局网站
  • 青岛网站建设团队营销网站建设的公司
  • 企业网站 dede phpcms 帝国食品网站建设建议
  • 网站建设友情链接怎样交换毕业设计网站开发的中期报告
  • 在线音乐制作网站google 网站打不开