1、决胜全球:向量数据库如何成为AI出海产品的隐形引擎李成龙|Zilliz李成龙Zilliz首席开源布道师 Milvus 开源社区负责人Zilliz 首席开源布道师,Milvus 开源社区负责人,全球最受欢迎的开源向量数据库Milvus Committer,加入 Zilliz 后活跃在 Milvus 社区,并协助全球数千家开源用户共同探索 AI 落地解决方案,对于主流Embedding 算法、LLMs 应用及 RAG 架构具有丰富的经验,先后完成了 Milvus 以图搜图系统,视频检索系统等案例。目 录CONTENTSI.向量检索背景II.向量数据库核心技术解析III.出海案例实践IV.总结与展望
2、向量检索背景PART 01AI 应用爆发,但底层都在做同一件事ChatGPT式问答AI 搜索个性化推荐图片视频搜索AI Agent功能有限-如缺乏过滤、混合搜索、范围搜索可扩展性受限 向量数据大幅增长后性能受到挑战成本效益低-不是100%准确且硬件兼容性很重要而且LLM发展迅速,这些方案很难跟上但为什么不使用数据库+向量插件呢?您需要一个高性能的向量索引来搜索高维数据但您还需要:CRUD、数据新鲜度、持久性、可用性、可扩展性、数据管理、备份、迁移还有:部署、可观测性、多租户、安全性为什么我们需要一个向量数据库?Milvus全球最受欢迎的开源向量数据库与超过10000家企业用户打磨6年,是全球范
3、围内最成熟的分布式向量数据库Enterprise users1000+stars43Kdocker pulls70Mforks3.8K向量数据库核心技术解析PART 02向量数据库核心能力动态Schemaadd field丰富的数据类型支持百万级用户多租户能力支持Float,Sparse,Binary等多种向量数据即增即查,实时落盘支持修改和删除标签+向量存储独家过滤性能优化基于磁盘的ANN索引MMap存储GPU支持Intel+ARM CPU支持支持数据离线倒入支持索引池化混合查询关键词+向量检索RBAC支持TLS,数据加密架构演架构演讲-单机版向量数据库架构演进云原生分布式向量数据库向量索引
4、内存索引磁盘索引基于倒排基于树基于图DiskANNIVFFlat IVFSQ8 IVFPQFlatANNOYHNSW向量索引类型索引的评价指标1.查询性能(QPS)2.召回率(Recall)3.构建索引时间4.索引占空间大小Picking,Evaluating,&Tuning the Index to your use caseIVF+QuantizationDiskANNCAGRA(GPU)NOTE:Points farther from center indicate better performance(Higher Accuracy,Lower Latency,Higher Throu
5、ghput,Faster Index Time,Lower Cost)HNSWScANNIVF_FLAT最佳实践如何选择索引类型Latency:HNSW GPU Cagra ScaNN IVF_PQ IVF_FLAT DiskANN FLATThroughput:GPU Cagra HNSW ScaNN DiskANN IVF_PQ IVF_FLAT FLATRecall:FLAT GPU Cagra HNSW DiskANN ScaNN IVF_FLAT IVF_PQCost:GPU Cagra HNSW ScaNN IVF_FLAT=FLAT IVF_PQ DiskANN HNSW MMa
6、p最佳实践如何提升性能Evaluate:always start from:https:/ the right vector index Tune the index parameters Check Segment size-Default 512M,change to 2GB or 4GB based on the cluster size Build right scalar index if filtering Use clustering compaction when filtering can be applied Deploy prometheus and tracing,tu