当前位置:首页 > 报告详情

李成龙-决胜全球向量数据库如何成为AI出海产品的隐形引擎.pdf

上传人: 明**** 编号:1195302 2026-04-16 37页 5.52MB

1、决胜全球:向量数据库如何成为AI出海产品的隐形引擎李成龙|Zilliz李成龙Zilliz首席开源布道师 Milvus 开源社区负责人Zilliz 首席开源布道师,Milvus 开源社区负责人,全球最受欢迎的开源向量数据库Milvus Committer,加入 Zilliz 后活跃在 Milvus 社区,并协助全球数千家开源用户共同探索 AI 落地解决方案,对于主流Embedding 算法、LLMs 应用及 RAG 架构具有丰富的经验,先后完成了 Milvus 以图搜图系统,视频检索系统等案例。目 录CONTENTSI.向量检索背景II.向量数据库核心技术解析III.出海案例实践IV.总结与展望

2、向量检索背景PART 01AI 应用爆发,但底层都在做同一件事ChatGPT式问答AI 搜索个性化推荐图片视频搜索AI Agent功能有限-如缺乏过滤、混合搜索、范围搜索可扩展性受限 向量数据大幅增长后性能受到挑战成本效益低-不是100%准确且硬件兼容性很重要而且LLM发展迅速,这些方案很难跟上但为什么不使用数据库+向量插件呢?您需要一个高性能的向量索引来搜索高维数据但您还需要:CRUD、数据新鲜度、持久性、可用性、可扩展性、数据管理、备份、迁移还有:部署、可观测性、多租户、安全性为什么我们需要一个向量数据库?Milvus全球最受欢迎的开源向量数据库与超过10000家企业用户打磨6年,是全球范

3、围内最成熟的分布式向量数据库Enterprise users1000+stars43Kdocker pulls70Mforks3.8K向量数据库核心技术解析PART 02向量数据库核心能力动态Schemaadd field丰富的数据类型支持百万级用户多租户能力支持Float,Sparse,Binary等多种向量数据即增即查,实时落盘支持修改和删除标签+向量存储独家过滤性能优化基于磁盘的ANN索引MMap存储GPU支持Intel+ARM CPU支持支持数据离线倒入支持索引池化混合查询关键词+向量检索RBAC支持TLS,数据加密架构演架构演讲-单机版向量数据库架构演进云原生分布式向量数据库向量索引

4、内存索引磁盘索引基于倒排基于树基于图DiskANNIVFFlat IVFSQ8 IVFPQFlatANNOYHNSW向量索引类型索引的评价指标1.查询性能(QPS)2.召回率(Recall)3.构建索引时间4.索引占空间大小Picking,Evaluating,&Tuning the Index to your use caseIVF+QuantizationDiskANNCAGRA(GPU)NOTE:Points farther from center indicate better performance(Higher Accuracy,Lower Latency,Higher Throu

5、ghput,Faster Index Time,Lower Cost)HNSWScANNIVF_FLAT最佳实践如何选择索引类型Latency:HNSW GPU Cagra ScaNN IVF_PQ IVF_FLAT DiskANN FLATThroughput:GPU Cagra HNSW ScaNN DiskANN IVF_PQ IVF_FLAT FLATRecall:FLAT GPU Cagra HNSW DiskANN ScaNN IVF_FLAT IVF_PQCost:GPU Cagra HNSW ScaNN IVF_FLAT=FLAT IVF_PQ DiskANN HNSW MMa

6、p最佳实践如何提升性能Evaluate:always start from:https:/ the right vector index Tune the index parameters Check Segment size-Default 512M,change to 2GB or 4GB based on the cluster size Build right scalar index if filtering Use clustering compaction when filtering can be applied Deploy prometheus and tracing,tu

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
明日何其多
明**...

该用户很懒,什么也没介绍

客服
商务合作
小程序
服务号
折叠