当前位置: 首页 > news >正文

最专业网站建设wordpress分享插件下载

最专业网站建设,wordpress分享插件下载,网站备案背景幕布是什么,怎么开发wordpress子主题LangChain学习文档 【LangChain】向量存储(Vector stores)【LangChain】向量存储之FAISS 概要 存储和搜索非结构化数据的最常见方法之一是嵌入它并存储生成的嵌入向量#xff0c;然后在查询时嵌入非结构化查询并检索与嵌入查询“最相似”的嵌入向量。向量存储负责存储嵌入数…LangChain学习文档 【LangChain】向量存储(Vector stores)【LangChain】向量存储之FAISS 概要 存储和搜索非结构化数据的最常见方法之一是嵌入它并存储生成的嵌入向量然后在查询时嵌入非结构化查询并检索与嵌入查询“最相似”的嵌入向量。向量存储负责存储嵌入数据并为您执行向量搜索。 内容 本篇讲述与 VectorStore 相关的基本功能。使用向量存储的一个关键部分是创建要放入其中的向量这通常是通过嵌入创建的。因此建议您在深入研究之前熟悉文本嵌入模型接口。 有许多很棒的向量存储选项以下是一些免费、开源且完全在本地计算机上运行的选项。查看许多出色的托管产品的所有集成。 文本嵌入模型接口 我们想要使用 OpenAIEmbeddings因此我们必须获取 OpenAI API 密钥。 import os import getpassos.environ[OPENAI_API_KEY] getpass.getpass(OpenAI API Key:) 下面展示三个嵌入文本模型接口。 Chroma 本篇讲述使用Chroma向量数据库该数据库作为一个库在本地计算机上运行。 pip install chromadb我们想要使用 OpenAIEmbeddings因此我们必须获取 OpenAI API 密钥。 from langchain.document_loaders import TextLoader from langchain.embeddings.openai import OpenAIEmbeddings from langchain.text_splitter import CharacterTextSplitter from langchain.vectorstores import Chroma# 加载文档将其分割成块嵌入每个块并将其加载到向量存储中。 raw_documents TextLoader(../../../state_of_the_union.txt).load() text_splitter CharacterTextSplitter(chunk_size1000, chunk_overlap0) documents text_splitter.split_documents(raw_documents) # 注意这里 db Chroma.from_documents(documents, OpenAIEmbeddings())FAISS 本演练使用 FAISS 矢量数据库该数据库利用 Facebook AI 相似性搜索 (FAISS) 库。 pip install faiss-cpufrom langchain.document_loaders import TextLoader from langchain.embeddings.openai import OpenAIEmbeddings from langchain.text_splitter import CharacterTextSplitter from langchain.vectorstores import FAISS# 加载文档将其分割成块嵌入每个块并将其加载到向量存储中。 raw_documents TextLoader(../../../state_of_the_union.txt).load() text_splitter CharacterTextSplitter(chunk_size1000, chunk_overlap0) documents text_splitter.split_documents(raw_documents) db FAISS.from_documents(documents, OpenAIEmbeddings())Lance 本笔记本展示了如何使用与基于 Lance 数据格式的 LanceDB 矢量数据库相关的功能。 pip install lancedbfrom langchain.document_loaders import TextLoader from langchain.embeddings.openai import OpenAIEmbeddings from langchain.text_splitter import CharacterTextSplitter from langchain.vectorstores import LanceDBimport lancedb # 基于 Lance 数据格式 db lancedb.connect(/tmp/lancedb) table db.create_table(my_table,data[{vector: embeddings.embed_query(Hello World),text: Hello World,id: 1,}],modeoverwrite, )# 加载文档将其分割成块嵌入每个块并将其加载到向量存储中。 raw_documents TextLoader(../../../state_of_the_union.txt).load() text_splitter CharacterTextSplitter(chunk_size1000, chunk_overlap0) documents text_splitter.split_documents(raw_documents) # 创建嵌入的向量存储 db LanceDB.from_documents(documents, OpenAIEmbeddings(), connectiontable)相似性搜索 query 总统对科坦吉·布朗·杰克逊说了些什么 docs db.similarity_search(query) print(docs[0].page_content)结果 今晚。我呼吁参议院 通过《投票自由法案》。通过约翰·刘易斯投票权法案。当你这样做的时候通过《披露法案》这样美国人就可以知道谁在资助我们的选举。今晚我要向一位毕生为这个国家服务的人表示敬意斯蒂芬·布雷耶法官——退伍军人、宪法学者、即将退休的美国最高法院法官。布雷耶法官感谢您的服务。总统最重要的宪法责任之一是提名某人在美国最高法院任职。四天前当我提名巡回上诉法院法官科坦吉·布朗·杰克逊时我就这样做了。我们国家最顶尖的法律头脑之一他将继承布雷耶大法官的卓越遗产。通过向量进行相似性搜索(Similarity search by vector) 还可以使用similarity_search_by_vector 与给定嵌入向量相似的文档进行搜索该向量接受嵌入向量作为参数而不是字符串。 embedding_vector OpenAIEmbeddings().embed_query(query) docs db.similarity_search_by_vector(embedding_vector) print(docs[0].page_content)查询相同所以结果也相同。 Tonight. I call on the Senate to: Pass the Freedom to Vote Act. Pass the John Lewis Voting Rights Act. And while you’re at it, pass the Disclose Act so Americans can know who is funding our elections.Tonight, I’d like to honor someone who has dedicated his life to serve this country: Justice Stephen Breyer—an Army veteran, Constitutional scholar, and retiring Justice of the United States Supreme Court. Justice Breyer, thank you for your service.One of the most serious constitutional responsibilities a President has is nominating someone to serve on the United States Supreme Court.And I did that 4 days ago, when I nominated Circuit Court of Appeals Judge Ketanji Brown Jackson. One of our nation’s top legal minds, who will continue Justice Breyer’s legacy of excellence.异步操作(Asynchronous operations) 向量存储通常作为需要一些 IO 操作的服务一般是单独运行的因此它们可能会被异步调用。这会带来性能优势因为您不必浪费时间等待外部服务的响应。如果您使用异步框架例如 FastAPI这一点也可能很重要。 Langchain 支持向量存储上的异步操作。所有方法都可以使用其异步对应方法进行调用前缀 a 表示异步。 Qdrant 是一个向量存储它支持所有异步操作因此将在本节中使用它。 # 单独执行安装 pip install qdrant-client # 引入模块 from langchain.vectorstores import Qdrant异步创建向量存储(Create a vector store asynchronously) db await Qdrant.afrom_documents(documents, embeddings, http://localhost:6333) (相似性搜索)Similarity search query 总统对科坦吉·布朗·杰克逊说了些什么 docs await db.asimilarity_search(query) print(docs[0].page_content)结果 今晚。我呼吁参议院 通过《投票自由法案》。通过约翰·刘易斯投票权法案。当你这样做的时候通过《披露法案》这样美国人就可以知道谁在资助我们的选举。 今晚我要向一位毕生为这个国家服务的人表示敬意斯蒂芬·布雷耶法官——退伍军人、宪法学者、即将退休的美国最高法院法官。布雷耶法官感谢您的服务。 总统最重要的宪法责任之一是提名某人在美国最高法院任职。 四天前当我提名巡回上诉法院法官科坦吉·布朗·杰克逊时我就这样做了。我们国家最顶尖的法律头脑之一他将继承布雷耶大法官的卓越遗产。通过向量进行相似性搜索(Similarity search by vector) embedding_vector embeddings.embed_query(query) docs await db.asimilarity_search_by_vector(embedding_vector)最大边际相关性搜索 (MMR)(最大边际相关性搜索 (MMR)) 最大边际相关性优化了所选文档之间查询的相似性和多样性。异步 API 也支持它。 query 总统对科坦吉·布朗·杰克逊说了些什么 found_docs await qdrant.amax_marginal_relevance_search(query, k2, fetch_k10) for i, doc in enumerate(found_docs):print(f{i 1}., doc.page_content, \n)结果 1. 今晚。我呼吁参议院 通过《投票自由法案》。通过约翰·刘易斯投票权法案。当你这样做的时候通过《披露法案》这样美国人就可以知道谁在资助我们的选举。 今晚我要向一位毕生为这个国家服务的人表示敬意斯蒂芬·布雷耶法官——退伍军人、宪法学者、即将退休的美国最高法院法官。布雷耶法官感谢您的服务。 总统最重要的宪法责任之一是提名某人在美国最高法院任职。 四天前当我提名巡回上诉法院法官科坦吉·布朗·杰克逊时我就这样做了。我们国家最顶尖的法律头脑之一他将继承布雷耶大法官的卓越遗产。 2.我们无法改变我们之间的分歧。但我们可以改变我们前进的方式——在 COVID-19 和我们必须共同面对的其他问题上。 最近在威尔伯特·莫拉警官和他的搭档杰森·里维拉警官的葬礼几天后我访问了纽约市警察局。 他们当时正在接听 9-1-1 的电话一名男子用偷来的枪开枪打死了他们。 莫拉警官当时 27 岁。 里维拉警官当时22岁。 这两位多米尼加裔美国人都在同一条街道上长大后来他们选择担任警察巡逻。 我与他们的家人交谈告诉他们我们永远欠他们的牺牲我们将继续履行他们的使命恢复每个社区应有的信任和安全。 我已经研究这些问题很长时间了。 我知道什么是有效的投资于预防犯罪和社区警察他们会遵守规则了解社区并且能够恢复信任和安全。总结 本篇主要讲述的内容其实都在这幅图里 加载数据通过embed转成向量存储查询条件进行embed在3的基础上再进行向量存储库的搜索 参考地址 https://python.langchain.com/docs/modules/data_connection/vectorstores/
http://www.zqtcl.cn/news/492444/

相关文章:

  • 相城建设监理有限公司网站网页设计中html代码
  • 做农产品网站高端汽车
  • 工信部网站首页wordpress网站搬家vps
  • wordpress 淘客插件长沙排名优化公司
  • 网站首页怎么制作过程如何自己创作一个游戏
  • 自己做企业网站在哪学习建网站
  • 门户网站建设 突出服务学习电子商务网站建设与管理的收获
  • 做网站排名大概要多少免费做个人网站
  • 哈尔滨网站建设效果wordpress主题 手机app
  • 收录网站源码海外域名怎么打开
  • 荥阳网站建设上海十大营销策划公司
  • 在网站挂广告一个月多少钱巫溪网站建设
  • 网站备案名称的影响吗济南网站建设招聘
  • 南城区网站建设公司y2学年做的租房网站
  • 温州网站建设咨询网站源码下载后怎么布置
  • 邢台网站推广wordpress文章数据库位置
  • wordpress 快站wordpress 安装主题 主机名
  • 老网站改版启用二级域名网站建设服务是什么意思
  • 网站建设营销话术外销网站
  • 找个人给我做电影网站好主题网站开发介绍
  • 运城公司网站建设苏州网站建设苏州
  • 湖北省住房和建设厅网站首页网站用免费空间好不好
  • 网站建设公司案例做网站小图标大全
  • 美食网站主页怎么做网络营销推广的作用
  • 上海建站价格wordpress表白系统
  • 唐山 建设工程信息网站中天钢铁 网站建设
  • 公司没有备案了网站摄影素材网站
  • 正规的网店平台有哪些北京公司排名seo
  • 网页制作素材库哪个网站上海门户网站开发
  • 做网站 分辨率应该是多少做阿里巴巴网站要多少钱