当前位置:首页 > 报告详情

5 腾讯大数据基于 StarRocks 的向量检索探索.pdf

上传人: 哆哆 编号:186221 2024-11-01 36页 3.29MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了向量检索技术在腾讯大数据中的应用,以StarRocks数据库为例,详细解析了向量检索的原理、优化方法以及在腾讯的实践案例。文章指出,向量检索技术在新型应用中需求不断涌现,如听歌识曲、以图搜图等,而Embedding技术的成熟使得非结构化数据可以转化为高维向量,进而通过最近邻查询实现相似内容的查找。面临高维空间查询的效率问题,文章提出使用近似最近邻查询(Approximate Nearest Neighbor Search, ANNS)来提升查询效率。StarRocks实现向量检索的原理及优化包括:基本功能的开发完成,形成内部索引库TenANN,支持向量、倒排等多种类型的索引,以及通过表达式构筑SQL,优化时构建对应的执行计划等。在腾讯的实践案例中,StarRocks向量检索在不同的业务场景中均展现出优势,如在RAG场景中使用方便、耗时低,在千万至亿级数据量中成本低、耗时低、运维成本低等。面对高并发场景和大数据量的挑战,文章提出了一系列规划,如实现Serving / HSAP、Tablet级别索引、算法优化等。
"StarRocks如何实现高并发向量检索?" "腾讯如何运用StarRocks向量检索技术解决大数据挑战?" "StarRocks向量检索在腾讯实践案例中表现如何?"
客服
商务合作
小程序
服务号
折叠