当前位置: 首页 > news >正文

深圳市建设局网站网站控制面板地址

深圳市建设局网站,网站控制面板地址,国家军事网,个人主页的html设计省流:优先选择WeightedRanker 以rag为例,优先选择bm25全文检索,其次选择向量检索 Milvus混合搜索中的重排机制 Milvus通过hybrid_search() API启用混合搜索功能#xff0c;结合复杂的重排策略来优化多个AnnSearchRequest实例的搜索结果。本主题涵盖了重排过程#xff0c;…省流:优先选择WeightedRanker  以rag为例,优先选择bm25全文检索,其次选择向量检索 Milvus混合搜索中的重排机制 Milvus通过hybrid_search() API启用混合搜索功能结合复杂的重排策略来优化多个AnnSearchRequest实例的搜索结果。本主题涵盖了重排过程解释其重要性以及Milvus中不同重排策略的实现。 概述 下图说明了Milvus中混合搜索的执行过程并强调了重排在这一过程中的作用。 混合搜索中的重排是一个关键步骤它整合了来自多个向量字段的结果确保最终输出具有相关性并准确排序。目前Milvus提供以下重排策略 WeightedRanker这种方法通过计算不同向量搜索得分或向量距离的加权平均值来合并结果。它根据每个向量字段的重要性分配权重。 RRFRanker这种策略基于不同向量列中的排名来合并结果。 加权评分 (WeightedRanker) WeightedRanker策略根据每个向量字段的重要性为每个向量检索路径的结果分配不同权重。当不同向量字段的重要性各不相同时应用此重排策略允许通过分配更高的权重来强调某些向量字段。例如在多模态搜索中文本描述可能比图像中的颜色分布更为重要。 WeightedRanker的基本过程如下 检索期间收集分数从不同的向量检索路径收集结果及其分数。 分数归一化将每个路径的分数归一化到[0,1]范围内其中接近1的值表示更高的相关性。由于不同度量类型的分数分布不同这种归一化非常重要。例如IP的距离范围是[-∞,∞]而L2的距离范围是[0,∞]。Milvus使用arctan函数将值转换到[0,1]范围内为不同的度量类型提供标准化基础。 权重分配为每个向量检索路径分配权重w。用户指定权重这些权重反映了数据源的可靠性、准确性或其他相关指标。每个权重范围为[0,1]。 分数融合计算归一化分数的加权平均值以得出最终分数。然后根据这些从高到低的分数对结果进行排序生成最终排序结果。 要使用此策略应用WeightedRanker实例并通过传入多个数值参数来设置权重值。 from pymilvus import WeightedRanker ​ # 使用WeightedRanker以指定权重组合结果 rerank WeightedRanker(0.8, 0.8, 0.7) 请注意 每个权重值范围从0最不重要到1最重要影响最终的聚合分数。 在WeightedRanker中提供的权重值总数应等于您之前创建的AnnSearchRequest实例的数量。 值得注意的是由于不同度量类型的测量方式不同我们将召回结果的距离归一化使其位于[0,1]区间内其中0表示不同1表示相似。最终分数将是权重值和距离的总和。 倒数排名融合 (RRFRanker) RRF是一种数据融合方法它基于排名的倒数来合并排名列表。当没有明确的重要性优先级时这是平衡每个向量字段影响的有效方法。当您希望对所有向量字段给予同等考虑或者当对每个字段的相对重要性存在不确定性时通常使用这种策略。 RRF的基本过程如下 检索期间收集排名多个向量字段的检索器检索并排序结果。 排名融合RRF算法对每个检索器的排名进行加权和合并。公式如下 这里表示不同检索路径的数量rank()是由第个检索器检索到的文档的排名位置是平滑参数通常设置为60。 综合排名基于组合分数对检索到的结果进行重新排序以生成最终结果。 要使用此策略应用RRFRanker实例。 from pymilvus import RRFRanker ​ # 默认k值为60 ranker RRFRanker() ​ # 或指定k值 ranker RRFRanker(k100) RRF允许在不指定明确权重的情况下平衡各字段的影响。多个字段一致认可的顶级匹配项将在最终排名中优先考虑。 总结与建议 总结 Milvus混合搜索通过重排策略优化多向量检索的结果提高搜索质量 目前支持两种主要重排策略加权评分(WeightedRanker)和倒数排名融合(RRFRanker) WeightedRanker适用于明确知道各向量字段重要性的场景允许用户手动设置权重 RRFRanker适用于各向量字段重要性相近或不确定的场景无需手动设置具体权重 建议 对于多模态搜索如图像文本如果知道某一模态更重要建议使用WeightedRanker 当不确定各向量字段相对重要性时RRFRanker是更简单、更稳健的选择 使用WeightedRanker时建议进行权重调优实验找到最适合应用场景的权重组合 对于高精确度要求的应用可考虑结合两种重排策略或自定义重排逻辑 记得考虑不同度量类型如IP、L2等的分数分布差异理解Milvus的归一化处理机制
http://www.zqtcl.cn/news/270001/

相关文章:

  • 东莞网站上排名建设银行网站登录不进去
  • 陕西建设厅八大员官方网站服装公司做哪个网站
  • 福建省住房和城乡建设厅网站站群 网站如何做
  • 网站换稳定服务器网页制造与网站建设论文
  • wordpress 产品目录seo技术是干什么的
  • 做里番网站犯法吗中建八局第一建设有限公司资质
  • 怎么制作网站教程电商seo建站优化价格表
  • 黄平网站建设网站建设公司广告 晴天娃娃
  • 中山市 有限公司网站建设网站建设 福步 2018
  • 英语网站开发中国桥梁建设公司排名
  • php做的网站怎么运行公司网站备案查询
  • jsp 响应式网站模板设计类网站策划案
  • 建设银行网站怎么注销网银百度广告联盟
  • flash建网站教程天津市建设工程评标专家网
  • 合格的网站设计师需要会什么软件seo 深圳
  • 公司网站建设费用账务处理软文300字案例
  • 门户型网站特点网站营销推广的公司
  • wordpress gif主题seo兼职怎么收费
  • 商城免费建站系统手机端首页尺寸多少
  • 网站上存储播放视频怎么做wordpress 作品集 相册
  • 建设网工程信息南昌官网seo厂家
  • 上海网站seo牛巨微网页设计模板html代码个人介绍
  • 网站 架构 设计公司网站建设费怎么做账
  • 合肥电脑网站建站萍乡手机网站建设
  • 优化seo网站西安wordpress 做购物网站
  • 广州建设档案馆网站稿定设计app免费版官方
  • 橙色企业网站源码建设工程投标文件在哪个网站有发布
  • 服务器可以做网站吗深圳高端网站建设创新
  • 企业平台网站建设方案大连网络广告
  • 如何给网站做宣传新手怎么建立自己网站