近日,腾讯云正式发布国内首个AI原生(AI Native)的自研向量数据库(Tencent Cloud Vector DB),预计8月上线腾讯云官网。
该数据库是腾讯自研、基于内部多年运营积累的分布式向量数据库,已经过腾讯海量业务场景验证,日均处理向量检索千亿次,支持“标量+向量”的混合检索,具有高性能、大容量等特点,支持全内存索引。主要面向大模型训练,让企业原先花一个月时间才能完成的大模型接入,缩短到三天时间。
腾讯云数据库副总经理罗云指出,向量数据库已经在QQ浏览器、腾讯视频、腾讯游戏、QQ音乐、搜狗输入法等上百个业务场景应用,每日调用量超千亿次。其中,支撑QQ音乐人均听歌时长提升3.2%,QQ浏览器成本降低37.9%,腾讯视频有效曝光人均时长提升1.74%。
其还自研了分布式向量数据库核心引擎Olama,原ElasticFaiss。据了解,Olama最早于2019年4月进行孵化,目前可支持十亿级别的单行向量数据索引、查询QPS达到百万、响应延迟在20毫秒。
向量数据库源自腾讯集团每日处理千亿次检索的向量引擎(OLAMA),单索引支持10亿级向量规模,更适用于AI运算、检索,数据接入AI的效率也比传统方案提升10倍。综合


