李成龙-决胜全球向量数据库如何成为AI出海产品的隐形引擎.pdf

编号:1195302 PDF 37页 5.52MB 下载积分:VIP专享
下载报告请您先登录!

1、决胜全球:向量数据库如何成为AI出海产品的隐形引擎李成龙|Zilliz李成龙Zilliz首席开源布道师 Milvus 开源社区负责人Zilliz 首席开源布道师,Milvus 开源社区负责人,全球最受欢迎的开源向量数据库Milvus Committer,加入 Zilliz 后活跃在 Milvus 社区,并协助全球数千家开源用户共同探索 AI 落地解决方案,对于主流Embedding 算法、LLMs 应用及 RAG 架构具有丰富的经验,先后完成了 Milvus 以图搜图系统,视频检索系统等案例。目 录CONTENTSI.向量检索背景II.向量数据库核心技术解析III.出海案例实践IV.总结与展望

2、向量检索背景PART 01AI 应用爆发,但底层都在做同一件事ChatGPT式问答AI 搜索个性化推荐图片视频搜索AI Agent功能有限-如缺乏过滤、混合搜索、范围搜索可扩展性受限 向量数据大幅增长后性能受到挑战成本效益低-不是100%准确且硬件兼容性很重要而且LLM发展迅速,这些方案很难跟上但为什么不使用数据库+向量插件呢?您需要一个高性能的向量索引来搜索高维数据但您还需要:CRUD、数据新鲜度、持久性、可用性、可扩展性、数据管理、备份、迁移还有:部署、可观测性、多租户、安全性为什么我们需要一个向量数据库?Milvus全球最受欢迎的开源向量数据库与超过10000家企业用户打磨6年,是全球范

3、围内最成熟的分布式向量数据库Enterprise users1000+stars43Kdocker pulls70Mforks3.8K向量数据库核心技术解析PART 02向量数据库核心能力动态Schemaadd field丰富的数据类型支持百万级用户多租户能力支持Float,Sparse,Binary等多种向量数据即增即查,实时落盘支持修改和删除标签+向量存储独家过滤性能优化基于磁盘的ANN索引MMap存储GPU支持Intel+ARM CPU支持支持数据离线倒入支持索引池化混合查询关键词+向量检索RBAC支持TLS,数据加密架构演架构演讲-单机版向量数据库架构演进云原生分布式向量数据库向量索引

4、内存索引磁盘索引基于倒排基于树基于图DiskANNIVFFlat IVFSQ8 IVFPQFlatANNOYHNSW向量索引类型索引的评价指标1.查询性能(QPS)2.召回率(Recall)3.构建索引时间4.索引占空间大小Picking,Evaluating,&Tuning the Index to your use caseIVF+QuantizationDiskANNCAGRA(GPU)NOTE:Points farther from center indicate better performance(Higher Accuracy,Lower Latency,Higher Throu

5、ghput,Faster Index Time,Lower Cost)HNSWScANNIVF_FLAT最佳实践如何选择索引类型Latency:HNSW GPU Cagra ScaNN IVF_PQ IVF_FLAT DiskANN FLATThroughput:GPU Cagra HNSW ScaNN DiskANN IVF_PQ IVF_FLAT FLATRecall:FLAT GPU Cagra HNSW DiskANN ScaNN IVF_FLAT IVF_PQCost:GPU Cagra HNSW ScaNN IVF_FLAT=FLAT IVF_PQ DiskANN HNSW MMa

6、p最佳实践如何提升性能Evaluate:always start from:https:/ the right vector index Tune the index parameters Check Segment size-Default 512M,change to 2GB or 4GB based on the cluster size Build right scalar index if filtering Use clustering compaction when filtering can be applied Deploy prometheus and tracing,tu

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(李成龙-决胜全球向量数据库如何成为AI出海产品的隐形引擎.pdf)为本站 (明日何其多) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠