openclaw2026年4月7日

OpenClaw v2026.4.5 深度解析：多媒体生成与记忆系统的质变

摘要：OpenClaw 于 2026 年 4 月 6 日凌晨发布 v2026.4.5 版本，带来多媒体生成能力的突破性升级。本次更新内置 video_generate 和 music_generate 工具，集成 Google Lyria、MiniMax、ComfyUI 等主流提供商，支持异步任务追踪与成品交付。Control UI 新增 12 种语言支持，中文用户首次获得原生界面体验。实验性 Memory/Dreaming 系统重构为三阶段协作模式（Light/Deep/REM），实现后台记忆巩固与多语言概念标签。安全层面修复多项权限校验漏洞，强化插件工具白名单与 SSRF 防护。本文深度解析 v2026.4.5 的技术细节、使用场景与潜在风险，为技术决策者提供事实依据。

一、多媒体生成：从文本交互到多模态创作

v2026.4.5 最引人注目的升级，是视频与音乐生成工具的内置化。这标志着 OpenClaw 从"文本 + 代码"执行助手，跃迁为"多模态内容创作"平台。

1.1 视频生成工具：`video_generate`

技术实现：

内置工具：新增 video_generate 原生工具，Agent 可直接调用 configured providers 生成视频
提供商支持：
- xAI：grok-imagine-video（Grok 图像生成视频）
- 阿里云 Model Studio：Wan 视频生成模型
- Runway：专业级视频生成平台
- ComfyUI 工作流：本地/云端 ComfyUI 工作流支持
交付方式：生成的媒体直接嵌入回复，支持异步任务追踪

使用场景示例：

用户："为我的新产品制作一个 15 秒的宣传片，风格科技感，主色调蓝色"
→ Agent 调用 video_generate 工具
→ 选择 Runway 或阿里云 Wan 模型
→ 异步生成完成后，直接在聊天中返回视频文件

技术细节：

所有视频提供商均配置 live-test 和 default model wiring，确保开箱即用
支持参考图像上传（ComfyUI 工作流）
生成任务状态可通过 openclaw tasks 查询

1.2 音乐生成工具：`music_generate`

技术实现：

内置工具：新增 music_generate 原生工具
提供商支持：
- Google Lyria：Google 最新音乐生成模型
- MiniMax：国产音乐生成模型
- ComfyUI 工作流：基于工作流的音乐生成
异步追踪：支持 async task tracking，生成完成后 follow-up delivery

容错机制改进：此前版本中，若用户指定 durationSeconds 等参数而提供商不支持，会导致请求硬失败。v2026.4.5 引入警告降级机制：

用户："生成一首 3 分钟的钢琴曲"
→ 若提供商（如 Google Lyria）不支持 durationSeconds 参数
→ 系统发出警告："提供商不支持 durationSeconds，将使用默认时长"
→ 请求继续执行，而非直接失败

使用场景示例：

用户："为我的冥想应用生成一段 5 分钟的 ambient 音乐"
→ Agent 调用 music_generate 工具
→ 选择 Google Lyria 或 MiniMax
→ 异步生成，完成后推送音频文件到聊天

1.3 ComfyUI 工作流集成：本地创作的终极方案

技术亮点： v2026.4.5 为 ComfyUI 添加了bundled workflow media plugin，这是本次更新中最具技术深度的改进之一。

核心能力：

统一接口：通过 ComfyUI 插件，同时支持 image_generate、video_generate、music_generate
工作流驱动：用户可自定义 ComfyUI 工作流（JSON 格式），实现高度定制化的生成逻辑
提示词注入防护：内置 prompt injection 检测，防止恶意工作流注入
参考图像上传：支持将参考图像上传至 ComfyUI 服务器
实时测试：提供 live tests 功能，验证工作流配置正确性
成品下载：生成完成后自动下载并交付

部署模式：

本地 ComfyUI：运行在 localhost，完全私有化
Comfy Cloud：云端 ComfyUI 服务，适合资源受限场景

技术价值： ComfyUI 的集成，让 OpenClaw 用户能够利用开源社区的海量工作流资源（如 Civitai、OpenArt 等平台的工作流库），实现远超官方内置模型的能力边界。对于有定制需求的用户，这是最具吸引力的特性。

二、全球化与本地化：12 种语言 UI 支持

2.1 Control UI 多语言化

支持语言列表： v2026.4.5 为 Control UI（Web 控制面板）添加了以下 12 种语言的本地化支持：

简体中文（Simplified Chinese）
繁体中文（Traditional Chinese）
巴西葡萄牙语（Brazilian Portuguese）
德语（German）
西班牙语（Spanish）
日语（Japanese）
韩语（Korean）
法语（French）
土耳其语（Turkish）
印度尼西亚语（Indonesian）
波兰语（Polish）
乌克兰语（Ukrainian）

技术实现：

语言包采用 JSON 格式，存储在 locales/ 目录
支持运行时动态切换，无需重启 Gateway
自动检测浏览器语言偏好，默认匹配对应语言

中文用户价值：此前版本的 Control UI 仅有英文界面，对非英语用户存在使用门槛。本次更新后，中文用户可通过原生界面完成以下操作：

Gateway 配置（渠道、模型、工具）
会话管理与历史查看
Skills 安装与管理
执行审批（Exec Approvals）
记忆系统（Memory/Dreaming）配置

2.2 ClawHub 搜索与安装流程集成

新增功能（PR #60134）：

ClawHub 搜索：在 Skills 面板直接搜索社区技能
技能详情页：查看技能描述、作者、安装量、评分
一键安装：点击安装按钮自动完成技能下载与注册

技术细节：

旧流程：
1. 打开浏览器访问 skills.openclaw.cc
2. 搜索技能
3. 复制安装命令
4. 回到终端执行 openclaw plugins install xxx

新流程：
1. 打开 Control UI → Skills 面板
2. 搜索技能
3. 点击"安装"按钮
4. 自动完成安装并显示状态

这一改进显著降低了技能安装的技术门槛，尤其适合非开发者用户。

三、记忆系统重构：Dreaming 三阶段协作模式

3.1 从"竞争模式"到"协作模式"

问题背景：在 v2026.4.5 之前，OpenClaw 的记忆巩固（Dreaming）系统存在多个"竞争模式"，导致记忆提升逻辑混乱，容易出现重复处理或遗漏。

重构方案（PR #60569、#60697）：将 Dreaming 重构为三个协作阶段，每个阶段独立调度、协同工作：

阶段	名称	触发条件	处理内容	输出目标
Light	浅层巩固	高频、低延迟	短期对话摘要、临时上下文	短期记忆缓存
Deep	深层巩固	低频、高延迟	重要事件、长期偏好、技能学习	`MEMORY.md`
REM	快速眼动	周期性、预览模式	概念关联、跨会话模式识别	`dreams.md`

技术优势：

独立调度：三个阶段有独立的 cron 调度，互不阻塞
恢复行为：若某个阶段失败，其他阶段仍可正常执行
减少人工配置：默认配置即可运行，无需手动设置复杂的 cron 表达式

3.2 记忆老化控制：可配置的衰减参数

新增配置项：

{
  "memory": {
    "dreaming": {
      "recencyHalfLifeDays": 7,    // 记忆半衰期（天）
      "maxAgeDays": 30,            // 记忆最大保留天数
      "verboseLogging": true       // 详细日志（调试用）
    }
  }
}

工作原理：

半衰期衰减：记忆的重要性随时间指数衰减，recencyHalfLifeDays=7 表示 7 天后重要性减半
最大年龄限制：超过 maxAgeDays 的记忆自动归档或删除
加权提升：近期记忆（Recency）在 REM 阶段获得更高权重，优先巩固

使用场景：

高频用户：设置较短的半衰期（如 3 天），让系统快速遗忘无关细节
低频用户：设置较长的半衰期（如 14 天），保留更多上下文
调试模式：开启 verboseLogging，查看每次记忆提升的决策依据

3.3 REM 预览工具：透明化记忆巩固过程

新增命令：

# 运行 REM 预览，查看即将巩固的记忆片段
openclaw memory rem-harness

# 解释某次记忆提升的决策依据
openclaw memory promote-explain

功能说明：

REM Harness：模拟 REM 阶段，展示哪些短期记忆将被提升为长期记忆
Promote Explain：解释某次记忆提升的原因（基于哪些对话、关键词、情感强度）
Lasting Truths：在 REM 预览中，系统会标注"可能的持久真理"（如用户的长期偏好、重要事件）

技术价值：这一功能让记忆系统从"黑盒"变为"白盒"，用户可以审查并干预记忆巩固过程，避免错误记忆被永久化。

3.4 Dream Diary：独立的记忆表面

文件结构变更：

旧版本：Dreaming 内容写入每日记忆笔记（如 memory/2026-04-06.md）
新版本：Dreaming 内容统一写入顶层 dreams.md 文件

优势：

独立访问：用户可通过 openclaw memory read dreams 直接读取梦境日记，无需加载每日笔记
默认排除：dreams.md 不会被自动拉入默认记忆召回（Default Recall），避免污染上下文
显式读取：仅在用户明确要求时（如"我之前的梦境记录了什么？"）才会读取

Dreams UI： Control UI 新增" Dreams"面板，以时间线形式展示梦境日记，支持：

多语言概念标签（自动提取关键词）
梦境片段聚类（相似主题自动分组）
导出功能（Markdown/JSON）

四、安全加固：权限校验与 SSRF 防护

4.1 安全修复总览

v2026.4.5 包含多项关键安全修复，主要集中在权限校验和SSRF 防护两个维度：

修复项	漏洞类型	风险等级	修复方案
插件工具白名单	权限绕过	高	保留限制性白名单，禁止隐式扩展
`/allowlist add/remove`	未授权访问	高	要求 Owner 权限
`before_tool_call` Hook 崩溃	服务中断	中	Fail Closed（失败时阻断调用）
浏览器 SSRF 重定向绕过	SSRF	高	更早阶段阻断重定向
非交互式认证推断	认证泄露	中	限制在可信插件范围内

4.2 插件工具白名单：防止隐式权限扩展

漏洞回顾：在旧版本中，若插件通过 Hook 动态注册工具，可能绕过用户配置的工具白名单，导致未授权的工具调用。

修复方案（PR #58476、#59836）：

保留限制性白名单：即使用户配置了 tools.allowlist，插件也无法隐式扩展该列表
显式授权：新增工具必须通过 openclaw tools allow <tool_name> 显式授权
Hook 失败处理：若 before_tool_call Hook 崩溃，系统 Fail Closed（阻断调用），而非 Fail Open（允许调用）

影响评估：

正向影响：防止恶意插件或配置错误导致的权限泄露
潜在不兼容：部分依赖动态工具注册的插件可能需要更新

4.3 `/allowlist` 命令权限提升

漏洞回顾：此前，任何有会话访问权限的用户都可通过 /allowlist add 添加自己到白名单，绕过 DM 配对策略。

修复方案（PR #59822）：

Owner 权限要求：执行 /allowlist add 和 /allowlist remove 需要 Owner 权限
权限校验：系统在执行前验证调用者的 owner 角色

使用场景：

旧版本：
用户 A（非 Owner）发送：/allowlist add @user_a
→ 成功添加，绕过配对

新版本：
用户 A（非 Owner）发送：/allowlist add @user_a
→ 失败：需要 Owner 权限
→ 仅 Owner 用户可执行

4.4 浏览器 SSRF 重定向绕过防护

漏洞回顾：攻击者可通过构造重定向 URL（如 http://legit.com → 302 → http://192.168.1.1），绕过 SSRF 防护访问内网资源。

修复方案（PR #58771）：

更早阶段阻断：在发起 HTTP 请求前，预检查 URL 的重定向目标
重定向链验证：对整个重定向链中的每个 URL 进行 SSRF 校验
私有网络阻断：若重定向目标为私有 IP（如 192.168.x.x、10.x.x.x），直接拒绝请求

技术细节：

// 伪代码示例
async function fetchWithSSRFCheck(url) {
  const redirectChain = await traceRedirects(url);
  for (const redirectUrl of redirectChain) {
    if (isPrivateNetwork(redirectUrl)) {
      throw new Error("SSRF blocked: private network detected");
    }
  }
  return fetch(url);
}

五、配置架构清理：移除遗留别名

5.1 移除的遗留配置别名

v2026.4.5 移除了以下遗留的公共配置别名（Breaking Change）：

遗留路径	规范路径	迁移命令
`talk.voiceId`	`nodes.talk.voiceId`	`openclaw doctor --fix`
`talk.apiKey`	`nodes.talk.apiKey`	`openclaw doctor --fix`
`agents.*.sandbox.perSession`	`agents.*.sandbox.mode`	`openclaw doctor --fix`
`browser.ssrfPolicy.allowPrivateNetwork`	`browser.ssrfPolicy.policy`	`openclaw doctor --fix`
`hooks.internal.handlers`	`hooks.internal.registry`	`openclaw doctor --fix`
渠道/群组/房间的 `allow` 开关	`enabled`	`openclaw doctor --fix`

兼容性说明：

加载时兼容：系统仍支持读取旧路径，但会在启动时发出警告
自动迁移：运行 openclaw doctor --fix 自动将旧配置迁移到规范路径
未来版本：预计 v2026.5.x 将完全移除旧路径支持

建议操作：

# 升级后执行自动迁移
openclaw upgrade
openclaw doctor --fix

# 验证配置
openclaw config validate

六、其他重要改进

6.1 提供商生态扩展

新增捆绑提供商（PR #60032、#55921、#59318、#54648）：

Qwen：阿里云通义千问模型
Fireworks AI：高性能推理服务
StepFun：阶跃星辰模型
MiniMax TTS：语音合成服务
Ollama Web Search：本地模型的网络搜索能力
MiniMax Search：MiniMax 的搜索服务

Amazon Bedrock 增强（PR #61296、#61299）：

Mantle 支持：Bedrock Mantle 的 IAM 认证集成
推理 Profile 发现：自动发现可用的推理 Profile
请求区域注入：根据模型自动选择最优区域

6.2 Prompt 缓存优化

技术改进（PR #58036、#58037、#58038、#59054、#60603、#60691）：

前缀复用：跨传输回退、MCP 工具排序、压缩、嵌入图像历史等场景下，保持 Prompt 前缀的可复用性
系统提示词指纹：规范化空白、换行、Hook 添加的上下文，确保语义不变的 Prompt 复用 KV/Cache
工具清单去重：移除 Agent 系统提示词中的重复工具清单，减少 Token 消耗

效果：根据官方测试，上述优化可使 Follow-up Turns 的缓存命中率提升 30-50%，显著降低 API 成本。

6.3 iOS/Matrix 执行审批增强

iOS APNs 审批通知（PR #60239）：

通用 APNs 通知：iOS 用户收到执行审批通知时，点击通知直接打开 App 内审批模态框
按需拉取：仅在用户通过认证重新连接后，才拉取命令详情
状态清理：审批完成后，自动清除过期的通知状态

Matrix 原生审批（PR #58635）：

账户级审批人：支持配置多个审批人，按账户作用域隔离
渠道/DM 交付：审批请求可发送到频道或私聊
线程感知：支持 Matrix 房间线程的审批处理

七、落地建议与风险提示

7.1 升级建议

必须升级的场景：

使用插件工具白名单的用户（安全修复）
使用 /allowlist 命令的管理员（权限修复）
使用浏览器工具访问外部 URL 的用户（SSRF 修复）
希望使用视频/音乐生成功能的用户

升级步骤：

# 1. 备份配置
cp -r ~/.openclaw ~/.openclaw.backup

# 2. 升级
openclaw upgrade

# 3. 自动迁移配置
openclaw doctor --fix

# 4. 验证
openclaw doctor
openclaw config validate

7.2 新功能尝鲜指南

视频/音乐生成：

# 配置提供商（以 Google Lyria 为例）
openclaw configure providers google
# 输入 API Key

# 测试音乐生成
openclaw agent --message "生成一段 30 秒的钢琴曲"

# 测试视频生成
openclaw agent --message "为我的产品制作一个 10 秒的宣传片"

Memory/Dreaming：

# 启用 Dreaming
openclaw memory dreaming enable

# 查看配置
openclaw memory dreaming status

# 运行 REM 预览
openclaw memory rem-harness

7.3 风险提示

视频/音乐生成成本：

Google Lyria、Runway 等提供商按生成时长计费
建议设置预算告警：openclaw budget set --provider google --limit 50

Dreaming 资源消耗：

Dreaming 阶段会消耗额外的 LLM Token（用于记忆摘要和关联）
低配置设备建议关闭 Deep/REM 阶段，仅保留 Light 阶段

配置迁移风险：

运行 openclaw doctor --fix 前务必备份配置
若迁移失败，可手动恢复备份：cp -r ~/.openclaw.backup ~/.openclaw

八、结语：多模态与记忆的双轮驱动

v2026.4.5 的发布，标志着 OpenClaw 在两个关键维度实现质变：

多模态能力：视频/音乐生成工具的内置，让 OpenClaw 从"文本 + 代码"执行助手，进化为"多模态内容创作"平台。结合 ComfyUI 工作流的深度集成，用户可利用开源社区的无限创意，实现高度定制化的生成需求。

记忆系统：Dreaming 三阶段协作模式的重构，让记忆巩固从"黑盒"变为"白盒"。可配置的老化参数、REM 预览工具、独立的 Dream Diary，让用户能够透明地审查和干预记忆过程，构建真正个性化的"第二大脑"。

与此同时，安全加固的持续推进（权限校验、SSRF 防护）和全球化支持（12 种语言 UI），为 OpenClaw 的企业级落地扫清了障碍。

正如用户在社交媒体上的评价："This is the first time I have felt like I am living in the future since the launch of ChatGPT."（这是自 ChatGPT 发布以来，我第一次感觉自己生活在未来。）

v2026.4.5，让这一未来触手可及。

参考资料：

OpenClaw GitHub Releases v2026.4.5: https://github.com/openclaw/openclaw/releases/tag/v2026.4.5
OpenClaw 官方文档：https://docs.openclaw.ai/
OpenClaw 中文社区：https://clawd.org.cn/
OpenClaw 官网：https://openclaw.ai/

本文事实核查截至 2026 年 4 月 6 日，后续版本更新请以官方 Release 为准。

OpenClaw v2026.4.5 深度解析：多媒体生成与记忆系统的质变

OpenClaw v2026.4.5 深度解析：多媒体生成与记忆系统的质变

一、多媒体生成：从文本交互到多模态创作

1.1 视频生成工具：video_generate

1.2 音乐生成工具：music_generate

1.3 ComfyUI 工作流集成：本地创作的终极方案

二、全球化与本地化：12 种语言 UI 支持

2.1 Control UI 多语言化

2.2 ClawHub 搜索与安装流程集成

三、记忆系统重构：Dreaming 三阶段协作模式

3.1 从"竞争模式"到"协作模式"

3.2 记忆老化控制：可配置的衰减参数

3.3 REM 预览工具：透明化记忆巩固过程

3.4 Dream Diary：独立的记忆表面

四、安全加固：权限校验与 SSRF 防护

4.1 安全修复总览

4.2 插件工具白名单：防止隐式权限扩展

4.3 /allowlist 命令权限提升

4.4 浏览器 SSRF 重定向绕过防护

五、配置架构清理：移除遗留别名

5.1 移除的遗留配置别名

六、其他重要改进

6.1 提供商生态扩展

6.2 Prompt 缓存优化

6.3 iOS/Matrix 执行审批增强

七、落地建议与风险提示

7.1 升级建议

7.2 新功能尝鲜指南

7.3 风险提示

八、结语：多模态与记忆的双轮驱动

相关日志

评论

1.1 视频生成工具：`video_generate`

1.2 音乐生成工具：`music_generate`

4.3 `/allowlist` 命令权限提升