0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

增强AI能力:谷歌云在托管数据库中集成向量搜索

jf_WZTOguxH 来源:AI前线 2023-07-19 15:38 次阅读

谷歌云最近在 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 中增加了对 pgvector 的支持。这个扩展为托管数据库带来了向量搜索操作,允许开发人员存储大型语言模型(LLM)生成的向量嵌入并执行相似性搜索。

Cloud SQL 和 AlloyDB 现在可以与 Vertex AI 上的生成性 AI 服务配对,帮助创建能够感知应用程序和用户状态的 AI 应用程序。谷歌高级产品经理 Sandhya Ghai 和产品经理 Bala Narasimhan 解释说:

向量嵌入是一种数值表示,通常用于将复杂的用户生成内容(如文本、音频视频)转换为易于存储、操作和索引的形式。这些表示由嵌入模型生成,如果两个内容在语义上相似,它们各自的嵌入就会在嵌入向量空间中彼此相邻。然后,向量嵌入会被索引,被用于基于相似性进行有效的数据过滤。

例如,开发人员可以使用 Vertex AI 的预训练模型在文本和图像之间生成嵌入,并将它们存储并索引到数据库中,简化查找相似记录的过程。

用户现在可以使用 CREATE EXTENSION 命令在现有的数据库中安装 pgvector 扩展:

postgres=> CREATE EXTENSION IF NOT EXISTS vector;
CREATE EXTENSION


postgres=> CREATE TABLE embeddings(
 id INTEGER,
 embedding vector(3)
);
CREATE TABLE


postgres=> INSERT INTO embeddings
    VALUES
        (1, '[1, 0, -1]'),
        (2, '[1, 1, 1]'),
        (3, '[1, 1, 50]');
INSERT03

正如 Ghai 和 Narasimhan 所解释的那样,这一新功能还可以帮助开发人员利用预训练的 LLM:

我们需要了解的是,LLM 没有状态的概念……嵌入允许你将大型上下文(如文档或历史聊天记录)存储在数据库中,并过滤它们,以便查找最相关的信息。然后,你可以将最相关的聊天历史记录或文档片段输入模型来模拟长期记忆和业务特定知识。

谷歌云发布了一个 Colab Notebook 和一个视频,用 pgvector、开源框架 LangChain 和 LLM 构建 AI 驱动的应用程序。谷歌高级软件工程师 Saket Saurabh 演示了如何在示例 Python 应用程序中添加生成式 AI 功能,他写道:

pgvector 扩展还引入了用于对向量执行相似性匹配的新运算符,你可以用它查找语义上相似的向量。这样的运算符有两个:
‘<->’:返回两个向量之间的欧几里得距离…… ‘<=>’:返回两个向量之间的余弦距离

在过去的几个月中,谷歌云并不是唯一一个瞄准向量数据库的云供应商,Amazon RDS for PostgreSQL 也支持 pgvector 扩展,微软还展示了如何将 Azure Data Explorer(ADX)作为向量数据库,并讨论了几种连接到向量数据库的连接器


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 连接器
    +关注

    关注

    98

    文章

    14501

    浏览量

    136484
  • AI
    AI
    +关注

    关注

    87

    文章

    30818

    浏览量

    268974
  • 数据库
    +关注

    关注

    7

    文章

    3798

    浏览量

    64372

原文标题:增强AI能力:谷歌云在托管数据库中集成向量搜索

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    托管可以操作数据库吗?安全性如何

    托管可以操作数据库托管环境中,开发者可以通
    的头像 发表于 12-11 13:35 61次阅读

    数据库主机哪个好一点?

    、可扩展性和成本效益,但主机更侧重于计算能力数据库则侧重于数据安全性和易管理性。以下UU
    的头像 发表于 12-04 13:50 114次阅读

    数据库服务器哪个便宜一些?

    服务器的价格区间相对更广泛,因为用户可以根据实际需求选择不同配置和性能的服务器。而数据库的价格则更多地依赖于数据库类型和规格。相同配置
    的头像 发表于 11-12 10:55 178次阅读

    数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

    试图恢复数据库,发现有数个ndf文件大小变为0KB。 虽然NDF文件大小变为0KB,但是NDF文件磁盘上还可能存在。可以尝试通过扫描&拼接数据库碎片来恢复NDF文件,然后修复数据库
    的头像 发表于 10-31 13:21 209次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—通过拼接<b class='flag-5'>数据库</b>碎片恢复SQLserver<b class='flag-5'>数据库</b>

    服务器还需要租用数据库吗?

    如果你的应用程序需要处理大量的数据,并且这些数据需要高效的查询和分析能力,那么租用专业的数据库服务可能是更好的选择。这些服务通常提供了更高的性能、更好的可扩展性和更强的
    的头像 发表于 10-31 10:50 100次阅读

    数据库可以租用吗?完整租用流程来了

    数据库是可以租用的,这是一种合法且便捷的数据存储和管理方式。数据库服务提供商提供的各种服
    的头像 发表于 10-28 09:54 164次阅读

    科技报到:大模型时代下,向量数据库的野望

    科技报到:大模型时代下,向量数据库的野望
    的头像 发表于 10-14 17:18 251次阅读

    一文详解企业上数据库是干嘛的

    业上数据库是企业将其数据库系统从传统的本地数据中心迁移到由第三方服务提供商管理的远程服务器上的过程。这样做的目的通常是为了提高
    的头像 发表于 09-13 11:49 327次阅读

    DTCC2024前瞻:天翼数据库专家共话TeleDB发展蓝图

    数据库是IT基础设施领域重要的组成部分,天翼紧跟数据库行业技术方向与创新趋势,强化核心技术的自研实力,助力企业释放数据价值。8月22日-
    的头像 发表于 08-19 14:53 354次阅读
    DTCC2024前瞻:天翼<b class='flag-5'>云</b><b class='flag-5'>数据库</b>专家共话TeleDB发展蓝图

    甲骨文推出HeatWave GenAI,集成数据库内大模型

    甲骨文公司近期宣布了一项重大技术创新——HeatWave GenAI的正式问世,这标志着数据库与人工智能的深度融合迈出了关键一步。作为甲骨文HeatWave服务的重要升级,GenAI集成
    的头像 发表于 07-03 14:54 546次阅读

    大模型卷价格,向量数据库“卷”什么?

    被大模型“带飞”这一年,向量数据库才刚刚写下序言
    的头像 发表于 05-23 09:24 1771次阅读
    大模型卷价格,<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>“卷”什么?

    搭载英伟达GPU,全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

    美国硅谷圣何塞召开的 NVIDIA GTC 大会上,全球领先的向量数据库公司 Zilliz 发布了 Milvus 2.4 版本。这是一款革命性的向量
    的头像 发表于 04-01 14:33 473次阅读
    搭载英伟达GPU,全球领先的<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>公司Zilliz发布Milvus2.4<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>

    与NVIDIA深度参与GTC,向量数据库大厂Zilliz与全球顶尖开发者共迎AI变革时刻

    近日,备受关注的 NVIDIA GTC 已拉开序幕。来自世界各地的顶尖 AI 开发者齐聚美国加州圣何塞会议中心,共同探索行业未来,全球领先的向量数据库公司 Zilliz 也不例外。作为去年被
    的头像 发表于 03-26 11:01 409次阅读

    谷歌Vertex AI搜索医疗保健领域正式推出

    谷歌公司近日宣布,其Vertex AI搜索功能在医疗保健领域正式亮相,并已成功与MedLM以及医疗保健数据引擎(HDE)完成集成。这一创新功
    的头像 发表于 03-22 14:08 617次阅读

    腾讯向量数据库“卷”到哪一步了?

    被大模型“带飞”这一年,向量数据库才刚刚写下序言
    的头像 发表于 01-15 09:49 1581次阅读
    腾讯<b class='flag-5'>云</b>把<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>“卷”到哪一步了?