1、不只OpenClaw Agent 面临的暗黑挑战与安全测评体系姓名:王利伟职位:知道创宇AI事业部GMClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600目录(Agenda)潘潘多多拉拉魔魔盒盒:Agent 的暗黑时刻01总总体体框框架架:Agent 安全总体框架02度度量量安安全全:10 大核心 Agent 专属安全 Benchmark 全景图03落落地地生生根根:企业级安全实践与方案04洞洞见见未未来来:走向自治Agent 身份、权限与安全的
2、终极形态05ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600为什么是 OpenClaw?为什么是今天?核核心心观观点点:从从“被被动动”到到“主主动动”的的进进化化传传统统大大模模型型:只只防防“嘴嘴”仅依赖输出过滤,被动防御内容风险OpenClaw Agent:长长出出了了“手手”和和“脑脑”具备Skills 工工具具调调用用与Memory 长长期期记记忆忆拥有自主执行能力,风险延伸至操作层安安全全挑挑战战升升级级:实实战战的的警警钟钟防防
3、火火墙墙失失效效:当 AI 具备自主调用外部工具、执行多步决策的能力时,传统的内容审核机制已无法应对操作层面的渗透。实实战战视视角角:今天我们不讲枯燥的理论,直接剖析黑客是如何在真实场景中利用 Agent 的特性进行“策反”与攻击的。Agent 时时代代的的安安全全边边界界正正在在重重塑塑,我我们们需需要要重重新新定定义义防防御御体体系系。ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600从 LLM 安全到 Agent 安全:OpenClaw
4、的定位LLM 安安全全:基基础础防防线线核核心心范范畴畴:聚焦文本输入输出,关注提示词注入、内容过滤与偏见公平性。特特点点:静态、被动,局限于模型本身能力边界。Agent 安安全全:广广阔阔战战场场核核心心范范畴畴:扩展至工具调用、记忆与协作,涉及权限、环境隔离与身份认证。特特点点:动态、主动,全链路交互的复杂维度。OpenClaw 安安全全定定位位:Agent 安全体系的一个子集,专注于特定框架下的安全实践。关关注注点点:解决 Skills、Planner、Memory 等特有环节的安全问题。核核心心结结论论:Agent 安安全全 LLM 安安全全Agent 安全是 LLM 安全的超集。它不
5、仅包含模型本身的安全,更涵盖了其与外部世界交互的全链路安全。OpenClaw 安全正是在这一更广阔的 Agent 安全体系下,针对特定框架的实践与应用。ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600Agent 攻击手法精选(一):欺骗大脑(指令与上下文层)Tool-Invocation Spoofing工具调用伪造原原理理:攻击者通过精心构造的提示词,伪装成系统指令或用户意图,诱骗Agent调用其权限范围内的工具,执行非预期的操作。Indi
6、rect Prompt Injection间接注入/借刀杀人原原理理:恶意指令并非直接来自用户,而是隐藏在Agent需要处理的外部数据(如网页内容、文档)中。当Agent读取并处理这些数据时,被其中的隐藏指令所控制。核核心心风风险险点点:利用Agent对指令的高度信任机制,突破安全边界。防御重点在于对指令来源的验证和输入内容的清洗。ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600Agent 攻击手法精选(二):瓦解防线(身份与记忆层)Role