当前位置: 首页 > news >正文

专门做产品测评的网站soso网站提交入口

专门做产品测评的网站,soso网站提交入口,仿百度 wordpress,浙江省两学一做网站llamaIndex 做索引是默认存在内存中#xff0c;由于索引需要通过网络调用 API#xff0c;而且索引是比较耗时的操作#xff0c;为了避免每次都进行索引#xff0c;使用向量数据库进行 Embedding 存储以提高效率。首先将 Document 解析成 Node#xff0c;索引时调用 Embedd…llamaIndex 做索引是默认存在内存中由于索引需要通过网络调用 API而且索引是比较耗时的操作为了避免每次都进行索引使用向量数据库进行 Embedding 存储以提高效率。首先将 Document 解析成 Node索引时调用 Embedding API 生成 Node 的 Embedding 并存入 Chroma 向量数据以便后续查询方便。 本文使用的 JinaAI的 Embedding ModelDocument 解析 Node 用的是默认方式按段落、句子进行切分对于纯文本这样处理是可以如果有图和表格就要选用其他的策略。要注意的点是如果不指定 Chroma Embedding 的模型 默认使用的是 all-MiniLM-L6-v2 Embedding 模型这样就会导致搜索时数据非常不准确topk 都出不来。相似度算法设置为 CosineChroma 默认的算法是 L2。 代码中使用的文档是官方的例子paul_graham_essay.txt代码只做了 Retrieve 这步这步是 RAG 的核心。如果用中文把模型改成 cn 既可JinaAI 这个 Embedding 模型Ollama 也提供如果需要大量索引可以在本地搭建一个JinaAI 免费 Token 数有限。 import chromadbfrom llama_index.embeddings.jinaai import JinaEmbedding from llama_index.core import VectorStoreIndex, SimpleDirectoryReader from llama_index.vector_stores.chroma import ChromaVectorStore from llama_index.core import StorageContext from llama_index.core import Settings from chromadb.utils import embedding_functions## 访问 https://jina.ai 直接获取 API key jinaai_api_key xxxxembed_model JinaEmbedding(api_keyjinaai_api_key,modeljina-embeddings-v2-base-en, )documents SimpleDirectoryReader(./data).load_data()db chromadb.PersistentClient(path./chroma_db)# create collection chroma_collection db.get_or_create_collection(quickstart, embedding_function embedding_functions.JinaEmbeddingFunction(api_keyjinaai_api_key,model_namejina-embeddings-v2-base-en),metadata{hnsw:space: cosine} )# assign chroma as the vector_store to the context vector_store ChromaVectorStore(chroma_collectionchroma_collection) storage_context StorageContext.from_defaults(vector_storevector_store) Settings.embed_model embed_model# create your index index VectorStoreIndex.from_documents(documents, show_progressTrue, storage_contextstorage_context )search_query_retriever index.as_retriever(similarity_top_k5)nodes search_query_retriever.retrieve(what programming lanugage author used?)print(len(nodes))
http://www.zqtcl.cn/news/991259/

相关文章:

  • 用.net做视频网站的案例做网站需要视频衔接怎么做
  • 网站搭建规划模板wordpress博客点赞
  • 怎么在wordpress免费注册博客网站百度广告代理
  • 网站建设与管理考试怎么让网站分享有图片
  • 做渠道的网站有哪些方面广州网站建设咨询电话
  • 如何查看网站做没做竞价湘潭做网站 搜搜磐石网络
  • 郑州免费建站搭建网页平台
  • 长沙网站优化对策企业官网wordpress主题下载
  • 昆山网站设计网站建设亻金手指下拉
  • 行业数据网站建设培训网站
  • 商业设计网站推荐制作网站报价
  • 建设网站的企业邮箱红酒哪个网站做的好
  • 图片链接生成网站国外做珠宝的网站有哪些
  • 企业网站建设管理及推广手机微信网页版登录
  • 六盘水市住房和城乡建设局网站标签云wordpress
  • dedecms可以做什么网站织梦做的网站在手机上显示
  • 温州建设小学的网站吐鲁番seo快速排名
  • 翼城网站建设重庆平台网站建设多少钱
  • 短视频网站的动画是怎么做的外贸一般用什么平台
  • 北京建站开发企业网站建设平台
  • 建设网站建设什么征琴他达拉非
  • 详情页制作网站广州建设工程招标信息网
  • wordpress 响应速度慢长沙seo排名扣费
  • 网站首页二级下拉框怎么做酒店网站建设方案
  • 公众号流量投放网络优化工程师有前途吗
  • 电影网站app怎么做的网站关键词是什么
  • 成都做网站建设公司建设网站总结报告
  • 个人网站要备案嘛免费响应式模板网站
  • 淘宝网站内站建设免费个人网站怎么建立
  • 网站运营经验分享ppt沉默是金粤语谐音歌词