《A5--宋鑫--SQL Agent在去哪网的落地实践.pdf》由会员分享,可在线阅读,更多相关《A5--宋鑫--SQL Agent在去哪网的落地实践.pdf(36页珍藏版)》请在三个皮匠报告上搜索。
1、宋鑫去哪儿网 高级Java开发工程师 宋鑫宋鑫去哪儿网 Java高级开发工程师2022年加入去哪儿网,目前在基础架构下基础平台团队,主要参与负责测试环境管理,全链路压测平台。对AI Agent有深入了解,2025年开始探索AI Agent在企业中的应用与实践。去哪儿AI hackathon大赛金奖。GOPS大会金牌讲师。目录目录CONTENTS项目背景0102 方案演进与设计落地效果与经验总结03未来展望04PART 01PART 01项目项目背景背景项目背景项目背景-传统传统流程流程项目背景项目背景-存在的问题存在的问题 底表数据庞大 数据管理混乱 脏数据多查数难 产运 SQL 能力有限 复
2、杂 SQL 编写困难 已有 SQL 改造复杂 SQL 到执行复制粘贴等待执行流程冗长复杂。用户交互界面复杂,体验差。取数难使用难类别类别人均跑数人均跑数个数个数跑数失败跑数失败率率人均跑数人均跑数小时小时P60_人均人均跑数时长跑数时长P90_人均人均跑数时长跑数时长P95_人均人均跑数时长跑数时长国内机票18813.03%411122252去哪儿全司35313.01%1020192383项目背景项目背景-提效空间提效空间低效率高效率两大问题:问题1:数据问题问题2:SQL 产生的问题PART 02PART 02方案演进方案演进与设计与设计数据是数据是基石基石业务团队数据治理概览SQL Age
3、ntSQL Agent的的初探初探流程图初次探索存在的问题初次探索存在的问题“丢三落四”的现象严重!单Agent既要生成SQL,还要优化SQL。优化经常遗忘用户问题表述中,经常携带行业黑话(术语)。提示工程提示工程 分阶段提示先生成初版 SQL,再在第二轮对初版 SQL 进行优化。显式约束提醒在 Prompt 中列出必须保留的字段/注意的条件清单,让模型每次优化都必须校验。优化前后的对比要求让 Agent 输出优化前后的 SQL 对照表,并标记改动点。Agent拆分+术语库首次拆分首次拆分-优化优化 Agent Agent生成 Agent单 Agent优化 Agent拆分后的流程图存在的问题存
4、在的问题生成的SQL还是有小概率语法错误。工具一次性调用不满足场景。任务复杂,没有任务规划引入React机制先思考,再行动,观察结果,再继续思考,直到解决问题。引入引入ReactReact机制机制Agent 引入 React 机制Agent 流程图+React 效果图还有哪些问题还有哪些问题?SQL 是明确且具体的,而语言到 SQL 的映射是含义模糊的。Agent与用户交互能力薄弱。不像个“人”。不够贴近用户,要到不常用的平台去使用。再次拆分+公司 IM 工具作为入口生成 Agent 同时承担两种不同的认知任务(规则确认&SQL 生成)规则映射规则映射-引入问题细化引入问题细化AgentAge
5、nt细化 Agent生成 Agent生成 AgentAgent 流程图+细化 Agent Prompt+细化Agent效果图神奇的现象神奇的现象用户问题:查询昨日积分第二名的代理商现象用户问题本身的歧义性早期结论:AI天然的不稳定性吧本质增加改写增加改写 Agent Agent改写 Agent 流程图+改写 Agent Prompt+改写 Agent 效果图不断成长与学习的不断成长与学习的 Agent Agent目的:提高稳定性与学习新知识手段引入 RAG知识库设计知识库设计初版知识库业务知识库示例表结构信息示例知识库设计知识库设计知识库设计V2.0:无用信息过多,模型负担大用户表述有黑话(行
6、业术语)表的默认条件缺少瘦身补充术语库补充默认条件知识库设计知识库设计知识库设计V2.0术语库示例表结构信息示例瘦身后的表结构信息默认补充条件示例知识库设计知识库设计知识库设计V3.0:表可关联字段多存在常用且复杂的SQL多表关联知识库模板SQL知识库设计知识库设计SQL 模板示例多表关联示例知识库设计V3.0:SQL 模板+多表关联 整体架构一览整体架构一览迭代方案与迭代方案与运营机制运营机制PART 03PART 03落地效果与经验落地效果与经验总结总结落地效果落地效果大