《亮数据:2026年AI数据采集趋势:网络数据基础架构的崛起研究报告(28页).pdf》由会员分享,可在线阅读,更多相关《亮数据:2026年AI数据采集趋势:网络数据基础架构的崛起研究报告(28页).pdf(28页珍藏版)》请在三个皮匠报告上搜索。
1、2026 年 AI 数据采集趋势网络数据基础架构的崛起执行摘要开发 AI 系统的企业正面临一个高速变化、成败攸关的发展环境。在此情势下,实时获取公共网络数据已不再是一种竞争优势,而是一种必备能力。2026 年 2 月,Vanson Bourne 调查了 500 名 AI 系统开发企业的从业者,重点关注当前的 AI 应用、工具及近期发展趋势。与往年有关 AI 公共网络数据的调研结果一致,几乎所有企业都表示实时数据对其 AI 系统不可或缺,且数据消耗量仍在持续攀升。今年的调查结果显示,实时数据使用量平均增长了 132%。这一增长趋势与支撑所有 AI 运行的必要基础网络数据基础架构层日益重要的发展趋
2、势相呼应。旧网络必须与新网络互联,智能体必须具备信息交互和检索能力,最新数据必须能被预测模型或基础模型访问,并可用于机器人训练。每个数据检索节点都依赖于网络数据基础架构。但这一关键网络数据层正日益难以访问,严重影响了 AI 项目的发展。鉴于当前面临的各种挑战以及未来一年限制可能进一步收紧的趋势,拥有可靠的数据合作伙伴已成为企业取得成功的一大优势。目录智能体采用情况网络执行基础模型机器人监管摩擦和技术封锁挑战智能体采用情况智能体部署面临 AI 数据基础架构瓶颈只有依托传输更快、质量更可靠的数据,AI 系统才能顺利实现从开发到生产的转变。扩展 AI 系统面临的最大挑战基础架构和运营成本高难以获得可
3、靠、最新的外部数据内部集成和编排方式较复杂面临人才/技能缺口未来 12 个月的核心数据需求:提升可靠性和数据质量提高数据采集/检索速度访问更多实时数据强化合规、治理与法律保障访问更大规模(更多数量)的数据访问更广泛(全面)的网页数据源97%的企业综合利用各种 AI 智能体连接实时网络数据各种智能体的 3 大主要优势数据增强智能体的优势提升数据准确性或质量提供更精准的客户、供应商或市场洞察加速决策流程深度研究智能体的优势提高研究结果的准确性与质量提供更精准的战略、市场或竞争洞察加速从研究问题到可执行洞察的转化过程AI 部署依赖实时网络数据访问大多数受访企业都已通过各种方式,在不同功能领域应用 A
4、I,且这些应用通常相辅相成。例如,使用智能体检索基础模型或预测模型所需的数据它构成了五大依赖实时公共网络数据访问的热门用例之一。按功能划分的热门用例商业洞察/市场研究/客户洞察/趋势分析运营优化(欺诈检测、流程改进、合规监控)提升网页搜索/浏览/互联网用户体验训练 AI/机器学习应用97%都需实时网络数据访问智能体依赖实时网络连接来支持各大业务领域目前,60%的 AI 产品都致力于将业务用例与连接至实时网络的拟人化智能体紧密结合,这正是大多数业务用例的核心需求。据 AI 产品采用者表示,他们平均会在 5 个业务职能领域部署连接实时网络的智能体。研究与知识检索客户支持销售或营销运营产品或价格监控
5、员工工作流程辅助网络安全与 IT 运营机器人或物理实体自动化网络搜索已采用 计划采用 无采用计划网络执行面向未来网络的建设:关键基础架构需求支撑未来网络发展的 AI 网络基础架构有三大不可或缺的支柱。AI 行业的领导者普遍认为实时数据访问与检索能力最为关键,其重要性高于可管理扩展、延迟与可靠性的基础架构,以及治理与合规体系。实时数据访问与检索用于管理扩展、延迟与可靠性的基础架构治理和合规性调查结果两层网络的兴起能够可靠且合规地在开放网络上运行的基础架构已成为 AI 发展的重要推动力。使用 AI 智能体进行网络搜索两层网络的兴起的企业认同“两层网络”正在兴起智能体网络人类网络目前使用智能体进行网
6、络搜索转向智能体网络:时间线预测网络正从“人类网络”向“智能体网络”演进,企业在利用这一趋势提升效率,确立竞争优势。以下是 AI 行业的领导者对这一转变速度的判断:不到 2 年2-5 年5 年以上不确定网络访问成为智能体运行的关键所有企业都意识到,实时数据的重要性受多重因素驱动。企业需要实时网络访问的 6 大原因提升 AI 输出结果的可信度应对实时市场变化带来的竞争压力应对不断提升的客户期望信息瞬息万变,静态训练数据跟不上步伐降低对频繁再训练周期的依赖需要从公开网络获取最新信号基础模型数据量快速增长,超出企业内部基础架构的处理能力过去 12 个月里,企业用于训练模型的数据量较前一年平均增长了