当前位置:首页 > 报告详情

谢苑珍-分解以提升注意力:通过工作流范式提升text-to-SQL的落地性能 (1).pdf

上传人: Fl****zo 编号:719174 2025-06-22 43页 12.35MB

1、演讲嘉宾:谢苑珍分解以提升注意力:通过工作流范式提升text-to-SQL的落地性能AI+BI 智能驱动峰会出品:腾讯PCG大数据平台部OlaChat个人介绍AI+BI 智能驱动峰会OlaChat 本硕毕业于中山大学,毕业后即加入腾讯,现任高级算法研究员 发表期刊会议(KBS,ACL,WSDM,CIKM等)论文8篇 目前主要从事大模型在数据分析领域的前沿探索和落地OlaChat-智能BI背景010204目录03DEA-SQL方案介绍(Text-to-SQL)Text-to-SQL落地建设OlaChat能力一览AI+BI 智能驱动峰会OlaChat01OlaChat-智能BI背景AI+BI 智能

2、驱动峰会OlaChatOlaChat:LLM+Agent 携手助力智能数据分析AI+BI 智能驱动峰会数据中台中的数据诉求反馈:找不到数据、理解数据成本较高和使用数据不够高效。集中于找数据和分析数据两大部分挑战一:怎么设计一个完善的贴合数据分析领域的Agent/工作流/系统,支撑在业界的智能化使用?(智能化)挑战二:如何丰富功能,保证每个功能可持续迭代优化?(丰富性)挑战三:如何落地并保证业务在实际场景中的使用效果?(落地性)业务痛点面临挑战传统传统BI 智能智能BI技术方向选型目标与优化大方向解法一:拟人思维Agent提升数据洞察效能【数据分析】解法二:工具箱的设计,提供丰富的工具能力,子工

3、具为子agent独立开发【SQL智能】解法三:多产品形态,原子能力嵌入【业务赋能】解决思路智能BI系统:期望人人都是分析师,降低使用门槛。OlaChat数据分析数据分析Agent:利用:利用创新认知思维框架赋能数据分析,助力工作减能数据分析,助力工作减负(S1)AI+BI 智能驱动峰会目标提高用户找数据用数据的效率,降低数据消费的门槛,打造一套人人可用的面向数仓的智能数据分析引擎,实现自然语言到数据洞察的一站式解决方案。技术选型:React,autogpt,hugginggpt,auto_cot等,稳定性弱,无法较好做实际落地使用。实现思路:拟人化Agent,贴近人类推理等能力(大模型理解,小

4、模型精钻稳定和专项任务准确率)挑战一:如何提升LLM在推理任务中的准确率?拟合人类的认知架构框架挑战二:如何激励 LLM 像人类一样进行主动学习?错误(困难)样本学习(即从由专家编写好解决方案的历史错误的题目或经典难题中学习和进化)挑战三:LLM如何灵活利用人类进化中形成的多样思维模式来提升推理能力?多思维有效推理框架+决策模块贡献:1)第一项尝试通过学习人类认知框架来系统地提高 LLMs 解决问题能力的工作。结果表明,这种对齐人类认知的方法可以提高 LLMs 在许多方面的表现,例如对意图理解、知识运用和推理准确性等。2)将人类推理的各种方法总结成思维链(CoT)模板,从而最大限度地发挥 LL

5、M 在不同场景下的推理效果。创新性地设计了一种高效的主动学习机制和投票机制,以提高解决复杂案例的准确性和鲁棒性。OlaGPT:Empowering LLMs With Human-like Problem-Solving AbilitiesOlaGPT PaperOlaGPT CodeOlaChat拟人思维Agent提升数据洞察效能提升数据洞察效能(实践篇)AI+BI 智能驱动峰会OlaChatOlaChat Data Agent图:基于MCP协议框架AI+BI 智能驱动峰会OlaChatSQL智能:核心功能建设&多种落地形态(S2-S3)AI+BI 智能驱动峰会相关数据均为非业务数据即测试数

6、据,仅供展示所用02DEA-SQL方案介绍AI+BI 智能驱动峰会OlaChatText-to-SQL的定义与背景AI+BI 智能驱动峰会定义:Text-to-SQL是一种将自然语言(如英语、中文等)直接转换为结构化查询语言(SQL)的技术。背景:1)大型语言模型正在蓬勃发展。Agent 框架可以释放大型模型的潜力。2)减轻数据分析和查询负担的需求。Text-to-SQL 是提高用户查找和使用数据效率、降低数据消费门槛的方法之一。OlaChatText2SQL:现有学术方案不适用于业务场景,高高质量数据有限-先先Agent后微后微调AI+BI 智能驱动峰会方案简介优点优点不足不足DAIL-阿里

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了腾讯PCG大数据平台部OlaChat在智能数据分析领域的研究和应用。核心内容包括: 1. 谢苑珍提出通过工作流范式提升Text-to-SQL的落地性能,降低数据分析门槛。 2. OlaChat采用LLM+Agent模式,解决数据分析中的找数据、理解数据成本高和用数据不高效的问题。 3. DEA-SQL方案通过模仿人类思维,分解任务,提高LLM在复杂任务中的注意力,实现自然语言到SQL的转换,比现有方案提升2-3个百分点。 4. 实验表明,合理的工作流范式和分解方法可提高模型在Text-to-SQL任务中的执行准确率。 关键数据引用: - DEA-SQL在Spider-Realistic数据集上表现更稳定,性能优于其他LLM方案。 - 模型在减少无关信息的同时,通过分类、提示、生成、自我纠正和主动学习等模块,有效提升性能。 - 在实际应用中,通过调整少量样本数量和过滤层,可以在时间和令牌消耗上实现较好的平衡。
"如何提升数据分析效率?" "智能BI技术如何助力业务?" "Text-to-SQL落地有哪些挑战?"
客服
商务合作
小程序
服务号
折叠