网站建设研究课题,重庆公司网站制作公司,phpstudy配置网站,wordpress默认在 2023 年 Stack Overflow 开发者调查中#xff0c;Postgres 顶替了 MySQL 被评为最受欢迎的数据库。一个重要因素应该是 Postgres 支持扩展#xff1a;可扩展的架构 Postgres 仍然由社区拥有#xff0c;Postgres 生态近年来蓬勃发展。
扩展可以看作是内置功能#xff0c…在 2023 年 Stack Overflow 开发者调查中Postgres 顶替了 MySQL 被评为最受欢迎的数据库。一个重要因素应该是 Postgres 支持扩展可扩展的架构 Postgres 仍然由社区拥有Postgres 生态近年来蓬勃发展。
扩展可以看作是内置功能能给数据库增加额外功能。在本文中我们分享五个可以给你 Postgres 带来 AI 功能的扩展。
pgvector pgvector 是一个向量相似性搜索工具专为 Postgres (支持 Postgres 11) 设计还可以用于存储嵌入向量。
它在 2021 年就开源了不过热度在 2023 年开始增加。如果你想用向量数据库那么其实 Postgres 就可以满足需求了pgvector 支持
向量与你的其他数据一起存储支持精确和近似最近邻搜索L2 距离、内积和余弦距离任何有 Postgres 客户端的语言
如果你用的就是 Postgres可以直接安装 pgvector如果你用的是 Postgres 服务或应用程序其中有些已经内置了pgvector例如 Aiven, Neon, Supabase, Postgres.app 等。
PostgresML PostgresML 是个支持将机器学习 (Machine Learning) 模型集成到 Postgres 中的扩展并在今年 5 月获得了 470 万美元的种子轮。它通过使用 SQL 查询来进行文本和数据的训练和推断极大地降低了应用程序开发的复杂性。 如果贵司没有复杂的机器学习工作负载毕竟不是所有人都是人工智能巨头但还是想构建自己的机器学习模型可以从新鲜数据中进行学习这是一个很好的入门方式。
有意思的是他们组织下还有另一个开源项目PgCat是个 PostgreSQL 连接池/代理于 2022 年 2 月开源或许 PgCat 不够性感PostgresML 整体转向了 AI向量数据库
MADlib Apache MADlib 是一个用于 SQL 的大数据机器学习工具。它的代码库最早在 2016 年左右发布到 GitHub但最初的版本早在 2011 年就已经发布直至今年还在迭代更新。 SQL 在处理较大或非结构化数据集上无法很好推理、预测或因果分析的观念已经是过去式了。MADlib 是一个数据库内机器学习库你可以在存储你数据的数据库 (Postgres) 中进行高级机器学习包括各种数据分析任务包括回归和分类。
冷知识MADlib 的 MAD 代表 Magnetic (磁性), Agile (敏捷) 和 Deep (深度)。 接下来的几个项目还挺有趣的不过要用的话自担风险 pg_embedding pg_embedding 是 Neon 今年 7 月发布的一个产品发布的时候称比 pgvector 快 20 倍。不过它使用了 HNSW 索引进行高维相似性搜索比 pgvector 添加 HNSW 支持要早。 但是几个月后的九月份他们就加了一条注释表示不再维护 pg_embedding。看起来是真的没有「购买还是构建」的纠结使用已有的是显而易见的选择。 pg_gpt pg_gpt 是个实验性的 Postgres 扩展它在 Postgres 内部使用 OpenAI 的 GPT API你可以用自然语言向数据库提问。pg_gpt 背后的组织是 CloudQuery主业是开源的 ELT 平台。 该插件通过传输部分数据库 schema不包含数据的部分发送到 OpenAI GPT API因此不建议在生产数据库中使用但如果比如公开的 schema那可以试试这个工具。例如如果想查找过去一个月在 Hacker News 上提到 Sam Altman 的热门提交这是一种方法当然也可以直接用 Search Hacker News 。
总结
今年我们见证了科技界拥抱人工智能并在 AI 领域里找到自己的立足之地。幸好 Postgres 足够开放支持扩展我们有幸得以享用想这些扩展可以为我们的 Postgres 添加 AI 功能而无需迁移到新的数据库。 更多资讯请关注 Bytebase 公号Bytebase