当前位置: 首页 > news >正文

网站建设数据库搭建设计做的好看的网站有哪些

网站建设数据库搭建,设计做的好看的网站有哪些,html网站开发中的应用,wordpress主题信息怎么修改目录 背景 Scalar index 简介 属性过滤 扫描数据段 相似性搜索 返回结果 举例说明 1. 属性过滤 2. 扫描数据段 3. 相似性搜索 实际应用中的考虑 Scalar Index 方式 Auto indexing Inverted indexing 背景 继续Milvus的很细设计#xff0c;前面主要阐述了Milvu…目录 背景 Scalar index 简介 属性过滤 扫描数据段 相似性搜索 返回结果 举例说明 1. 属性过滤 2. 扫描数据段 3. 相似性搜索 实际应用中的考虑 Scalar Index 方式 Auto indexing  Inverted indexing 背景 继续Milvus的很细设计前面主要阐述了Milvus 在 vector simalairity 上的处理策略及index 方式。今天主要讲下scalar index。应该说对于所有的 db 实现scalar index 都是需要的无论是否是 关系型数据库还是是否采用 k-v 存储等模式有的东西是触类旁通的。Milvus 在处理scalar index 时并不是孤立处理而是结合了 bitset 提前过滤 vector similarity 共同应对user  query 提出的挑战。下面进入正题。 Scalar index 简介 向量相似性搜索过程中Milvus 使用了属性过滤条件expr来扫描每个数据段segment并将过滤结果bitset一种位集合用于高效表示哪些元素满足条件与查询向量data一起应用于相似性搜索中。这种方式可以极大地提高搜索效率因为它允许Milvus在执行耗时的相似性计算之前先通过简单的属性过滤快速排除掉大量不满足条件的数据点。 具体来说过程如下 属性过滤 用户定义了一个或多个属性过滤条件expr这些条件用于筛选数据集中满足特定属性要求的向量。这些条件可以基于向量的元数据如时间戳、地理位置、分类标签等来定义。 扫描数据段 Milvus遍历或索引每个数据段应用这些属性过滤条件。对于每个数据段它会生成一个bitset这个bitset中的每一位代表数据段中对应位置的向量是否满足过滤条件。 相似性搜索 在得到过滤后的bitset后Milvus只针对那些标记为“满足条件”的向量进行相似性搜索。这意味着它不再需要计算所有向量的相似性而只需计算那些经过初步筛选、更有可能与查询向量相似的向量的相似性。 返回结果 最后Milvus根据相似性得分对满足条件的向量进行排序并返回最相似的向量及其相关信息如ID、相似度分数等给用户。 这种结合属性过滤和相似性搜索的方法使得Milvus在处理大规模向量数据集时能够更加高效和准确地响应用户的查询需求。它特别适用于那些既需要基于内容的相似性搜索又需要基于属性快速筛选的场景如推荐系统、图像检索、文档聚类等领域。 这里有一点要说明你使用milvus基本决定了你的 collection 世界中一定是 vector scalar 共存的case原因很简单如果仅有scalar我相信你使用 mysqlsqlserver甚至oracle 足以小的应用你甚至使用sqlite估计也行因为你的 sql  query 足以胜任user 各种需求。你之所以选择向量数据库肯定是要么有LLM的vector 需求要么有picaudio甚至video 的需求。还是那句话使用场景决定了product 的选择。所以你的collection 多半可能是  一个多个 vector embeddding 多个 attibute 的vector 说明。 举例说明 假设我们有一个电商平台该平台使用Milvus来存储商品的图像特征向量并希望为用户提供基于图像相似性的商品推荐功能。同时商品还具有一些属性信息如价格、品牌、类别等。 1. 属性过滤 用户查询用户希望找到一款与某张图片相似但价格不超过5000元且品牌为“Huawei”的商品。 属性过滤条件 价格 5000品牌 Huawei 在Milvus中这些属性信息会与图像特征向量一起存储但它们是分开处理的。当用户发起查询时Milvus首先会应用这些属性过滤条件来筛选出满足条件的商品。 2. 扫描数据段 数据段扫描 Milvus会将存储的商品数据分为多个数据段segment每个数据段包含一部分商品的特征向量和属性信息。当属性过滤条件被应用时Milvus会遍历或索引这些数据段检查每个商品是否满足过滤条件。对于满足条件的商品Milvus会生成一个bitset其中每个位对应一个商品满足条件的商品对应的位被设置为1不满足的则被设置为0。 3. 相似性搜索 相似性搜索 在得到过滤后的bitset后Milvus只针对那些标记为“满足条件”的商品特征向量进行相似性搜索。用户提供的查询图片首先被转换为特征向量。Milvus使用适当的相似性度量如余弦相似度来计算查询向量与满足条件的商品特征向量之间的相似性。根据相似性得分Milvus对商品进行排序并返回最相似的几个商品给用户。 实际应用中的考虑 性能优化Milvus通过高效的索引结构和算法来加速数据段的扫描和相似性搜索过程确保即使在处理大规模数据集时也能提供快速响应。多模态支持Milvus不仅支持图像特征向量的存储和检索还支持文本、音频等多种模态的数据为跨模态检索提供了可能。可扩展性Milvus支持分布式部署可以随着数据量的增长而水平扩展以满足更高并发和更大存储容量的需求。 Scalar Index 方式 Auto indexing  你不用对你的scalar attribute 做任何辅助说明Milvus 使用 auto indexing 的方式完成Scalar Indexing 的索引。 实际上你看了Milvus 的源码之后你会发现实际上 Auto indexing 就是 底层用的 inverted indexing。这里可能milvus 为了扩展将inverted indexing 作为了 default 的 scalar indexing 来使用。 所以本质上来说要看下 Inverted indexing。 Inverted indexing 倒排索引如果你曾经是比较资深的programmmer你应该不会陌生。我那时候还没有ElasticSearch用的是Lucene后来有了ElasticSearch 和 Solr但是万变不离其宗其核心还是倒排索引。说直白点就是把一个句子拆分为词组的 tomkenizer 并 标识这些词在哪些句子中出现或是标识出现的概率。Milvus的 inverted indexing 出自一个开源库Tantivy。应该说 Tantivy 的实现并不是ElasticSerach 或是 Solr但是其思想有些类似有兴趣的可以去看下源码。github 地址 Tantivy Github 源码地址 再次说明了成功是站在巨人的肩上其实Milvus 用了不少其他中间件来保证自己的功能特性前面介绍过的就有etcdmysqlrockMQpluster etc。现在又看到了 Tantivy。你可能会问为什么Milvus 不使用 ElasticSearch或Solr那肯定是那啥License等问题但从技术的角度来说Tantivy也足够优秀。或许有一天 Tantivy 的知名度会超过 ElasticSearch 也不一定。 我们看个例子 这就是倒排索引只不过不同人不同版本实现时倒排信息的精度有差别这里是focus 在句子层面。不过对于 Milvus的使用足以。 在单个查询比如上面的例子品牌’huawei‘那根据倒排索引直接锁定包含’huawei‘品牌attribute的 document 或 segment。 在区间查询比如还是上面的例子价格5000, 那还是根据倒排索引直接锁定 价格 attribute的document 或segment。 或许区间的例子还不够透彻因为range 的是数据。你查找的品牌获取不止一种如果 brand in [huawei, apple] 首先会经过类似alpha的字母排序之后通过倒排索引查询会比暴力查询效率高很多。
http://www.zqtcl.cn/news/547869/

相关文章:

  • 凡科做网站视频网站哪家好
  • 查询网站是否正规营销策略国内外文献综述
  • 做网页用的网站wordpress用户角色权限管理
  • 怎么查网站备案的公司wordpress 无刷新评论
  • 学前心理学课程建设网站百度极速版下载
  • 佛山做营销型网站建设深圳宝安区租房
  • 做汽车团购的网站建设营销方案有哪些
  • 做设计的网站网络公关什么意思
  • 一般课程网站要怎么做做钓鱼网站软件下载
  • 济南网站建设92jzh收不到wordpress的邮件
  • 一键优化在哪里打开新手怎么入行seo
  • 网站建设的费用明细创建公司网站需要注意什么
  • 微网站怎么做的好宣传片拍摄服务
  • 抚州网站开发机构wordpress开源
  • 企业营销网站建设不属于网页制作工具
  • 呼和浩特网站建设信息建服装类网站需要考虑的因素
  • 百度站长平台工具南京开发app的公司
  • 济南如何挑选网站建设公司设计 网站 现状
  • 网站开发建设流程图wordpress 插件 简码
  • 信宜网站开发公司阿里指数app下载
  • AAP网站开发需要多少钱网站核验通知书
  • 网站续费模板wordpress安装到ESC
  • 网站网址大全做商品条形码的网站
  • php购物网站开发成品各大网站收录提交入口
  • 怎么办个人网站网络管理系统中故障管理的目标是
  • 想做网站的客户在哪找下载网站系统源码
  • 网站建设是固定资产还是列费用soho做网站
  • 学校建设评建工作网站应用中心软件
  • 网站建设公司如何拓宽业务跨境进口网站怎么做
  • 邢台企业建站速卖通网站怎样做店面的二维码