1-王利伟.pdf-三个皮匠报告

1、不只OpenClaw Agent 面临的暗黑挑战与安全测评体系姓名：王利伟职位：知道创宇AI事业部GMClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600目录(Agenda)潘潘多多拉拉魔魔盒盒：Agent 的暗黑时刻01总总体体框框架架：Agent 安全总体框架02度度量量安安全全：10 大核心 Agent 专属安全 Benchmark 全景图03落落地地生生根根：企业级安全实践与方案04洞洞见见未未来来：走向自治Agent 身份、权限与安全的

2、终极形态05ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600为什么是 OpenClaw？为什么是今天？核核心心观观点点：从从“被被动动”到到“主主动动”的的进进化化传传统统大大模模型型：只只防防“嘴嘴”仅依赖输出过滤，被动防御内容风险OpenClaw Agent：长长出出了了“手手”和和“脑脑”具备Skills 工工具具调调用用与Memory 长长期期记记忆忆拥有自主执行能力，风险延伸至操作层安安全全挑挑战战升升级级：实实战战的的警警钟钟防防

3、火火墙墙失失效效：当 AI 具备自主调用外部工具、执行多步决策的能力时，传统的内容审核机制已无法应对操作层面的渗透。实实战战视视角角：今天我们不讲枯燥的理论，直接剖析黑客是如何在真实场景中利用 Agent 的特性进行“策反”与攻击的。Agent 时时代代的的安安全全边边界界正正在在重重塑塑，我我们们需需要要重重新新定定义义防防御御体体系系。ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600从 LLM 安全到 Agent 安全：OpenClaw

4、的定位LLM 安安全全：基基础础防防线线核核心心范范畴畴：聚焦文本输入输出，关注提示词注入、内容过滤与偏见公平性。特特点点：静态、被动，局限于模型本身能力边界。Agent 安安全全：广广阔阔战战场场核核心心范范畴畴：扩展至工具调用、记忆与协作，涉及权限、环境隔离与身份认证。特特点点：动态、主动，全链路交互的复杂维度。OpenClaw 安安全全定定位位：Agent 安全体系的一个子集，专注于特定框架下的安全实践。关关注注点点：解决 Skills、Planner、Memory 等特有环节的安全问题。核核心心结结论论：Agent 安安全全 LLM 安安全全Agent 安全是 LLM 安全的超集。它不

5、仅包含模型本身的安全，更涵盖了其与外部世界交互的全链路安全。OpenClaw 安全正是在这一更广阔的 Agent 安全体系下，针对特定框架的实践与应用。ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600Agent 攻击手法精选（一）：欺骗大脑（指令与上下文层）Tool-Invocation Spoofing工具调用伪造原原理理：攻击者通过精心构造的提示词，伪装成系统指令或用户意图，诱骗Agent调用其权限范围内的工具，执行非预期的操作。Indi

6、rect Prompt Injection间接注入/借刀杀人原原理理：恶意指令并非直接来自用户，而是隐藏在Agent需要处理的外部数据（如网页内容、文档）中。当Agent读取并处理这些数据时，被其中的隐藏指令所控制。核核心心风风险险点点：利用Agent对指令的高度信任机制，突破安全边界。防御重点在于对指令来源的验证和输入内容的清洗。ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon2026ClawCon202600Agent 攻击手法精选（二）：瓦解防线（身份与记忆层）Role

1-王利伟.pdf

相关报告