《华为云:2026智能体平台 AgentArts 智能体运营运维报告(245页).pdf》由会员分享,可在线阅读,更多相关《华为云:2026智能体平台 AgentArts 智能体运营运维报告(245页).pdf(245页珍藏版)》请在三个皮匠报告上搜索。
1、智能体平台智能体平台 AgentArts智能体运营运维智能体运营运维文档版本文档版本01发布日期发布日期2026-06-16华为云计算技术有限公司华为云计算技术有限公司 版权所有版权所有 华为云计算技术有限公司华为云计算技术有限公司 2026。保留一切权利。保留一切权利。非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。商标声明商标声明和其他华为商标均为华为技术有限公司的商标。本文档提及的其他所有商标或注册商标,由各自的所有人拥有。注意注意您购买的产品、服务或特性等应受华为云计算技术有限公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务
2、或特性可能不在您的购买或使用范围之内。除非合同另有约定,华为云计算技术有限公司对本文档内容不做任何明示或暗示的声明或保证。由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不构成任何明示或暗示的担保。华为云计算技术有限公司华为云计算技术有限公司地址:贵州省贵安新区黔中大道交兴功路华为云数据中心 邮编:550029网址:https:/ 01(2026-06-16)版权所有 华为云计算技术有限公司i目目 录录1 智能体观测智能体观测.11.1 观测介绍.11.2 数据上报.61.2.1 数据上报概述.61.2.2 上报 Age
3、ntArts 中的智能体数据.91.2.3 上报高代码智能体数据.131.2.4 上报第三方智能体 Trace、Metric 数据.171.2.4.1 功能介绍.171.2.4.2 数据上报准备.191.2.4.3 Trace 数据上报.211.2.4.4 Metric 数据上报.311.2.4.5 OpenTelemetry 字段映射.411.3 查看应用指标信息.481.3.1 查看业务指标信息.481.3.2 查看运营指标信息.511.4 查看应用调用链信息.541.5 查看会话分析信息.621.6 查看高代码应用运行数据.651.6.1 查看高代码智能体运行时数据信息.651.6.2
4、查看沙箱工具数据信息.671.6.3 查看网关数据信息.691.7 查看第三方智能体上报的 Trace、Metric 数据.701.8 人工标注 Trace 数据.741.9 数据回流.781.9.1 Trace 数据回流.782 智能体评估智能体评估.862.1 评估介绍.862.2 示例:快速完成一次智能体评估.902.3 示例:基于离线任务进行评估.982.4 评测集.1102.4.1 人工创建单轮评测集.1102.4.2 人工创建多轮评测集.1152.4.3 AI 合成评测集.119智能体平台 AgentArts智能体运营运维目 录文档版本 01(2026-06-16)版权所有 华为云
5、计算技术有限公司ii2.4.4 回流 Trace 数据至评测集.1272.4.5 回流评估结果至评测集.1312.4.6 维护评测集.1362.5 评估器.1392.5.1 评估器介绍.1392.5.2 自定义评估器.1402.5.2.1 创建模型判定评估器.1402.5.2.2 创建自适应判定评估器.1462.5.3 维护评估器.1502.5.4 预置评估器.1522.5.4.1 预置评估器概览.1522.5.4.2 预置评估器.1532.5.4.2.1 正确性.1532.5.4.2.2 AI 味检查.1552.5.4.2.3 任务完成度.1562.5.4.2.4 轨迹质量.1572.5.4
6、.2.5 不敏感性.1602.5.4.2.6 争议性.1612.5.4.2.7 创意性.1622.5.4.2.8 参考答案遵从度.1632.5.4.2.9 工具参数正确性.1652.5.4.2.10 工具选择质量.1672.5.4.2.11 幻觉现象.1682.5.4.2.12 性别歧视.1692.5.4.2.13 恶意性.1702.5.4.2.14 指令遵从度.1722.5.4.2.15 拒答检测.1732.5.4.2.16 格式检查.1742.5.4.2.17 语种一致性.1752.5.4.2.18 文本可用性.1762.5.4.2.19 安全风险漏放.1782.5.4.2.20 有害性.