当前位置:首页 > 报告详情

分论坛A - 佰聆 - 数据探索智能体研发实践分享.pdf

上传人: c** 编号:955148 2025-10-27 10页 2.08MB

1、数据提炼价值,算法建模未来数据探索智能体研发实践分享2025年10月姜 磊 佰聆数据股份有限公司沉淀400+AI算法模型,5大国际先进核心技术已获87项发明专利,技术创新能力强佰聆数据:企业级数字智能领航者实施1000+数字智能项目丰富的企业级数据运营和AI应用建设经验服务100+特大型企业级用户,覆盖全国涵盖电力、政府、金融、运营商、制造业等行业业务覆盖30+省级行政区超30个省市部署本地技术服务团队,服务能力辐射全国国家级专精特新“小巨人”企业第八届吴文俊人工智能科技进步奖工信部大数据产业发展试点示范项目工信部工业互联网试点示范项目工信部工业互联网平台创新领航应用案例电力大数据分析市场份额

2、第一10年+始终专注数字智能领域核心团队毕业于清华大学、伊利诺伊大学等国内外知名高校,在SAS、Accenture、Oracle等外企拥有多年管理经验佰聆数据股份有限公司是国内领先的数字智能解决方案提供商。公司依托数据科学和人工智能技术,结合自主研发的算法模型及分析工具,为企业级客户提供涵盖AI智能体开发应用、数据分析及机器学习、数据资产管理、数据要素运营等专业化解决方案,助力企业激发数据要素潜能,以新质生产力赋能企业高质量发展。预训练模型先验知识+迁移学习深度学习复杂算法+简单特征机器学习简单算法+复杂特征2014201620172020202120222023至今生成式大模型思维链+强化学

3、习技术发展历程:从机器学习到生成式大模型2023-2025年,佰聆与多个大型企事业单位的生产、调度、营销、审计等部门客户开展大模型应用需求交流和探讨,梳理出各类大模型应用方向需求占比(如下图),其中“数据问答”需求最多,凸显了数字化时代业务人员期望更加便捷的数据访问需求。目前企业级大模型应用的典型需求:数据问答数据问答40%知识问答23%流程自动化16%文本比对14%创作助手7%创作助手供电方案生成、宣传文案生成、会议纪要生成、统计图表生成、代码生成等场景文本比对符合性识别(供应商文件审查、报告校验)、归类性识别(工单分类、知识归类)、相关性识别(企业内规外法比对、项目查新)等场景流程自动化智

4、慧办电、伴随式竣工验收、智能派单、报销自动化、工作计划自动编排等场景知识问答信息检索、规程问答、政策解读、现场作业知识推荐、系统使用助手等场景数据问答业务数据问答、数据处理/治理脚本生成、审计模型生成等场景目前各类数据问答方案面临的技术挑战:准确率及性能无法满足企业级应用要求由于大模型底层机制仍然存在模糊性、随机性等幻觉问题,导致目前基于Text-to-SQL、Text-to-DSL等各种技术路线的数据问答应用,在准确性和性能上仍无法完全满足企业级应用要求。截至2025年9月底,在BIRD-SQL基准测试中,排名第一的Agentar-Scale-SQL模型执行准确率仅为81.67%(人类数据开

5、发人员为92.96%)数据来源:https:/bird-bench.github.io/安全性方面:大模型生成的SQL/脚本往往未考虑企业级严格精细的数据访问权限控制。性能方面:大模型推理依赖大量算力资源,增加响应时间,且生成复杂逻辑SQL/脚本后性能优化能力不足,导致“一问就死”。难以保证100%准确难以满足企业级安全及性能要求更严重的是:由于技术限制,大模型无法“反省”自己的答案是否正确,即使在结果错误的情况下,仍能“一本正经”地作答,导致用户无法辨别统计结果的准确性,在试用一段时间后迅速丧失对功能的信任。技术挑战应用现状生成SQL的准确性SQL的复杂程度简单图表生成 数据自助查询数据探索

6、辅助SQL开发终极智能分析助手在现有依赖人工的数字化开发模式下,业务人员和技术团队协作,在设计、开发过程中对问题需求的意图、语义、统计口径等各种细节进行人工核实和纠错,以填补从数据底座到上层应用之间的鸿沟,这种人为“脑补”使得企业底层数据治理和语义对齐等各种问题被屏蔽;而在基于大模型的应用模式下,由于需要大模型不依赖人工而自动生成结果,导致这些问题被迅速暴露出来。同时,相对于互联网上的公共信息,企业内部信息具有专业性、定向性、碎片化等特点,导致垂直领域大模型训练非常困难。业务挑战:企业“底层数据”与“日常业务”存在语义对齐的巨大鸿沟人工处理现有基于人力的数字化开发/信息分析模式这一切,对于大模

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据标记内容,全文主要内容概括如下: - 佰聆数据股份有限公司作为企业级数字智能领航者,拥有丰富的AI算法模型和专利技术,服务众多大型企业。 - 文章探讨了企业级大模型应用的典型需求,如数据问答、知识问答、流程自动化等,并分析了当前技术挑战,如准确率、安全性和性能问题。 - 提出了基于原子分析点的数据探索技术路线,通过AI智能问数模式提升准确性和安全性。 - 强调了企业“隐性知识”梳理和沉淀对智能体应用的重要性,以及传统技术与大模型的结合使用。 - 文章还提到,大模型应用需要大量“脚手架”支持,如人机协同机制,以确保稳定性和可信度。
企业级应用难题" 企业级应用挑战" 企业知识沉淀关键"
客服
商务合作
小程序
服务号
折叠