《李卓豪-从 Copilot 到 DataAgent:企业级智能数据开发治理平台的技术演进和实践.pdf》由会员分享,可在线阅读,更多相关《李卓豪-从 Copilot 到 DataAgent:企业级智能数据开发治理平台的技术演进和实践.pdf(39页珍藏版)》请在三个皮匠报告上搜索。
1、从Copilot 到 DataAgent:企业级智能数据开发治理平台的技术演进和实践李卓豪网易智企.数帆数据开发治理平台技术负责人目录010203040605背景与演进历程:从Copilot到DataAgent核心技术架构实现关键能力的技术实现落地挑战与评估体系未来展望从Copilot到DataAgent背景与演进历程数据开发治理平台在数据价值链路中的定位和业务痛点数据应用产品:ChatBI、智能问数数据开发治理:EasyDataNDH:Hadoop&AI 支撑底座指标、表、模型映射集群任务诊断Cli、SkillsAI浪潮下需求痛点新项目实施,数据建设初始化效率有不断提升的需求:企业存量数据标
2、准词典挖掘、批量数据入仓、核心字段发现等初始化效率低对于持续稳定发展的业务,基线不断地添加新任务,如何高效的保障基线产出,系统性降低风险是核心业务关注,能否智能重构数仓数仓基线优化存储计算资源不断消耗,每年都需要运动式的治理,上任务容易下任务难资源持续优化新人如何快速的熟悉数据架构、安全可靠地工作;如何专注数据设计自身,而不是数据存储、计算引擎特性研发效率提升1自然语言实现短链路典型单一场景,比如具体表权限申请、数据服务API创建ChatAPI2通过模型微调实现数据开发、自助分析取数SQL补全,提升研发效率SQL提示补全3进一步开发提效,SQL生成、优化、纠错、数据质量任务、词典提取、找表Co
3、pilot4模版业务场景数仓智能化一键构建AutoETLCopilot探索:提升开发效率业务自建Ai应用OpenAPI&MCP面向解决具体问题用户自定义的工作流程场景Skills更好的产品体验、企业安全端到端场景需求 内嵌DataAgent数据开发的vibe coding数据开发的sddCli ToolsP全场景端到端CDAAgent技术爆发:从开发到全场景的范式跃迁核心技术架构实现Copilot 架构业务层DifyCopilot(辅助开发)代码生成代码纠错代码解释Agent(自主决策)SQL Copilot代码补全治理 Copilot质量规则标准分词智能找数元数据 Copilot生成补全安全
4、 Copilot敏感识别分类分级运维 Copilot失败诊断任务优化智能数据集成与调度智能质量监控与修复智能数据治理与审计智能数据查询与分析知识库管理LLM管理供应商模型安全管理访问审计访问控制系统知识业务、行业知识监控分析反馈收集配额控制埋点统计行为分析接入层OpenAPIWebAPI应用层离线开发自助分析任务运维数据地图数据质量数据标准前端交互数据层RDSESPG接入层ED库KafkaOpenAPIMCP基建层云厂商 LLMLLM 插件OpenAI LLM网易有灵 LLMAI APP 插件DifyCozeCoreAgentMCP ClientSDK任务数据表数据标签数据函数数据知识库业务数
5、据用户评价召回评价评价体系Copilot架构Copilot能力跃进:从通用LLM到企业知识增强LLM LLM 的局限的局限?幻觉风险幻觉风险生成不存在的字段、SQL语法错误!语境缺失语境缺失不懂内部术语、表关系、业务规则T T知识滞后知识滞后无法感知最新业务变更和数据X X输出随机输出随机相同问题每次答案不一样知识增强知识增强 CopilotCopilot用户查询输入用户查询输入意图理解解析意图理解解析知识检索知识检索 (RAG)(RAG)LLMLLM 增强生成增强生成企业级精准回答企业级精准回答知识库知识库知识库核心价值知识库核心价值MM记忆沉淀记忆沉淀历史SQL、最佳实践复用C C语境感知
6、语境感知表关系、业务术语理解R R规范统一规范统一标准定义、口径一致性S S效率提升效率提升秒级响应、降低重复工作知识增强跃迁知识增强跃迁!知识库架构离线开发UDFES离线开发自助分析点赞代码UDF代码元数据样例数据分区信息数据源表数据主题域分层指标维度标签度量主键治理标签备注业务数据数仓加工Dify加工知识库管理SQL片段表元数据指标UDF系统函数系统常量加工数据登记数据系统知识库SQL模板SQL片段专业术语业务流程业务知识库行业知识库知识库向量数据库SQL块内部术语业务规则时间参数多表关系计算逻辑多表关系知识评价知识召回知识存储ESEasyCopilot知识加工向量化用户评价命中评价相似度