海洋网络做网站不负责,wordpress安装后,免费推广,中英文双语网站建设数据库管理152期 2024-02-20 数据库管理-第152期 Oracle Vector DB AI-04#xff08;20240220#xff09;1 常用的向量检索方法聚类图搜索哈希量化 2 Oracle Vector DB中的索引索引#xff08;默认#xff09; 索引#xff08;高级#xff09;3 EMBEDDINGSSQL EMBE… 数据库管理152期 2024-02-20 数据库管理-第152期 Oracle Vector DB AI-04202402201 常用的向量检索方法聚类图搜索哈希量化 2 Oracle Vector DB中的索引索引默认 索引高级3 EMBEDDINGSSQL EMBEDDINGS 函数OONX 总结 数据库管理-第152期 Oracle Vector DB AI-0420240220 作者胖头鱼的鱼缸尹海文 Oracle ACE Associate: DatabaseOracle与MySQL 网思科技 DBA总监 10年数据库行业经验现主要从事数据库服务工作 拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证 墨天轮MVP、认证技术专家ITPUB认证专家OCM讲师 圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号非著名社恐社交恐怖分子 公众号胖头鱼的鱼缸CSDN胖头鱼的鱼缸尹海文墨天轮胖头鱼的鱼缸ITPUByhw1809。 除授权转载并标明出处外均为“非法”抄袭。 由于上一篇的一些“误操作”导致公众号发文删了当天重发没有办法触发群发效果所以可能有些人会发现没看过03。
1 常用的向量检索方法
聚类
K-Means 和 Faiss
图搜索
Hierarchical Navigable Small Worlds (HNSW)
哈希
局部敏感哈希Locality Sensitive HashingLSH
量化
Product Quantization (PQ)有损压缩
2 Oracle Vector DB中的索引
在Oracle Vector DB中可以在Vector数据类型列上创建vector index来提升向量检索的性能
索引默认
create vector index vector_idx on vector_table (data_vector)
organization [inmemory neighbor graph | neighbor partition]距离计算欧几里德 向量索引的选择取决于organization子句:
In-Memory Neighbor Graph organizationHNSWNeighbor Partition organizationIVF
索引高级
可以指定向量索引类型参数、距离函数、精度等:
create vector index vector_idx on vector_table (data_vector) organization neighbor partition parameters (num_centroids 1024);3 EMBEDDINGS
在Oracle Vector DB除直接通过外部导入向量外也内建支持多种向量生产方式
SQL EMBEDDINGS 函数
原生支持生成向量数据
select id, image from cat_images order by VECTOR_DISTANCE(img_vec, EMBEDDING(resnet_50 USING :input_img)) fetch first 2 rows only;OONX
Open Neural Network eXchange embedding 模型
DECLAREmodel_source BLOB : NULL;
BEGINmodel_source :DBMS_CLOUD.get_object( credential_name OBJ_STORE_CRED,object_uri https://objectstorage…bucketname/o/resnet50bundle.onnx’);DBMS_DATA_MINING.import_onnx_model( model_name resnet50,model_data model_source,metadata JSON({ function : embedding })
);
END;总结
本期简单讲解了一下Oracle Vector索引以及内建向量EMBEDDING能力。 老规矩知道写了些啥。