帖子

OpenClaw 小龙虾 2026.5.18 更新说明

一句话总结

2026.5.18 是一次偏大型的稳定性与运行时收敛版本。核心方向是:Gateway 启动与重启速度、Codex app-server / native Codex 路由稳定性、Subagent 完成投递、QA-Lab 运行时一致性门禁、Mac App 设置体验、Telegram/Feishu/Discord/WhatsApp 等通道投递可靠性、Memory QMD 检索、插件 SDK 与 CLI 修复、媒体生成/理解链路安全与兼容性


统计概览

类别 数量/说明
原始 changelog 行数 204 行
主要区块 Changes / Fixes
版本性质 大型维护版本,偏稳定性、兼容性和 QA 门禁
重点模块 Gateway、Codex、Subagents、QA-Lab、Mac app、Telegram、Feishu、Memory、CLI、Plugins、Media、Browser
需要关注 Node.js 22 最低小版本提升到 22.19;Pi packages / proxyline / tokenjuice 等依赖更新

核心亮点

1. Gateway 启动、重启和诊断更稳

  • Gateway 重启 trace 会归因启动探针、配置、运行时和资源数量成本,便于定位慢启动原因。
  • Gateway 启动日志和 plugin-service startup 与 channel sidecars 并行,减少重启 ready 延迟,同时保留 /readyz sidecar gating。
  • update-check 延后到 readiness 之后启动,避免包更新检查阻塞 sidecar-ready。
  • 普通 unmanaged SIGUSR1 / config restart 保持进程内重启,不再 detach-spawn 孤儿子进程,改善自定义 supervisor 的 PID 跟踪。
  • restart shutdown 会先 drain pending replies 和 active chat runs,再关闭 sockets/channels,减少重启期间回复丢失。
  • protocol mismatch 诊断增强,Control UI 和 Gateway 会暴露协议版本,日志也给出客户端协议范围和 doctor/status 提示。

2. Codex app-server 与 Codex-native 路由集中修复

  • Codex app-server 会在 queued runs 前 hydrate 当前 inbound 图片附件,让 Discord 等渠道图片能作为 native vision input 进入 Responses-backed agents。
  • native code mode 不再被强制限定为 code-mode-only,OpenClaw dynamic tool turns 能通过 app-server tool bridge 完成。
  • 沙盒允许出网时,Codex code-mode turns 会保留网络访问能力。
  • per-agent code-mode config 会被 schema、runtime catalog activation 和 model payload filtering 正确尊重。
  • Codex app-server 会在转录和 trajectory artifacts 中保留 native command output 与 native tool calls/results,方便调试复盘。
  • oversized native Codex thread 会在 resume 前轮转,并限制 dynamic tool-result 文本进入 native Codex sessions,避免旧的大上下文污染后续回合。
  • OpenAI 模型解析到 openai-codex 时,会走 Codex provider 并注入 OpenClaw 保存的 OAuth profile,减少 “No API key found for openai-codex” 误报。
  • GPT-5 final replies 不再被硬编码简短化,避免长回复被合成省略号截断。

3. Subagents 完成投递和注册可靠性提升

  • subagent 初始 registry save 必须成功后才报告 spawn accepted,避免注册失败导致未跟踪任务。
  • completion announcements 会回到 originating run session,保留 sandbox-peer controller ownership。
  • session-backed parent runs 在 child wait timeout 但 child 尚未最终 settled 时仍保持 active,避免晚到的子代理完成结果丢失。
  • queued completion handoffs 会等到进入 parent transcript 后才标记 announced,避免父任务忙碌时提前清理。
  • keep-mode completion payload 在 final-delivery retry exhaustion 后仍保持 pending,方便 requester recovery。
  • group/channel subagent completions 会按需走 message-tool-only handoffs,并减少 requester wake 失败造成的完成投递丢失。
  • run-mode keep subagent registry entries 会在 session sweep TTL 后继续保留,便于清理后仍能查看 kept runs。
  • Feishu 绑定 subagent delivery origins,确保子代理完成结果回到同一个 DM 或话题。

4. QA-Lab 运行时一致性门禁更严格

  • 新增 first-hour 20-turn 和可选 100-turn runtime parity 场景,并为 standard / soak QA gate 增加 tier metadata。
  • openclaw qa suite --runtime-parity-tier 接入 standard Codex-vs-Pi tier,release checks 独立覆盖 required lane。
  • 增加 Codex Pi-shaped Read vocabulary canary、plugin hook crash、manifest contract error、WebChat direct-reply self-message routing 等 live-only 自检场景。
  • 增加 runtime tool fixture scenarios 和 coverage report,覆盖 Codex-native workspace tools、OpenClaw dynamic tools 和 optional plugin-backed tools。
  • runtime tool coverage 缺少 required exercise 时会失败,不再把 parity envelope drift 当成覆盖缺失。
  • runtime token-efficiency report 会区分 Codex savings 与 regressions,仅在 Codex 比 Pi 明显更耗 token 时失败。
  • live runtime parity 报告缺少 assistant-message usage 时会失败,避免 0 vs 0 的无效通过证明。
  • Docker harness 端口绑定到 loopback-only,且 bootstrap payload 不再泄露 Control UI bearer token。

5. Mac App 设置体验大幅调整

  • Settings 页面重做为一致的 card layout,导航缓存,Permissions / Voice / Skills / Cron / Exec / Debug 等页面间距更稳定。
  • Settings sidebar 始终可见,移除冗余 titlebar hide/show control;后续又把 toggle 移到 native titlebar。
  • General / Connection panes 采用更干净的状态面板、card rows 和远程 Gateway 字段布局。
  • 优先使用 private / Tailscale / LAN Gateway endpoint,保留 legacy loopback tunnel 配置,并在隧道失败时显示 SSH stderr。
  • Dashboard / Chat / Canvas / Settings 快捷入口加入 Dock icon menu。
  • Channels settings 打开更快:延后 config-schema work,避免 startup channel probes,缓存 channel status rows。
  • Cron Jobs settings 修复 SwiftUI metadata crash。
  • Config settings 改为浅层 schema lookup 和按需加载选中路径,避免一次渲染完整 config schema。

6. 通道回复与媒体投递更可靠

  • group/channel visible replies 默认恢复自动 final delivery;message_tool opt-in 保留给 ambient/shared rooms 和 tool-reliable models。
  • live preview updates 后仍保留 final payload delivery,避免只留下 preview draft。
  • Discord progress-mode preview streams 会发送 final replies,不再把最终可见消息去重掉。
  • Telegram forum topic、audio preflight、skipped-message hook、generated media completions 都会保留 topic origin,减少回到基础群的问题。
  • Telegram HTTP 421 Misdirected Request 会用 fresh fallback transport 重试。
  • Telegram topic send 遇到 message thread not found 会 fail closed,而不是退回基础 chat。
  • Telegram long polling 保持在 getUpdates hard guard 下,避免高 timeoutSeconds 的空闲 bot 误判断连并重启循环。
  • WhatsApp 强制文档发送会保留图片/GIF/视频原始字节,PDF/CSV 无文件名时会按 MIME 类型命名。
  • Signal 混合大小写 group ID 会在路由和 session persistence 中保留。

重点模块整理

Gateway / Sessions / Restart

  • Gateway/ACPX restart traces 增加启动成本归因,不改变 readiness 行为。
  • pnpm test:restart:gateway benchmark 工具可收集重复重启 readiness、downtime、trace 和 resource-slope 证据。
  • hot-reload 某个 channel restart 失败时,会继续重启剩余 channels,同时报告聚合失败并回滚 plugin pre-replace stops。
  • Gateway secrets runtime 拆分轻量状态与 auth-store cache,无 SecretRef 时走 startup fast path。
  • Gateway auth 对 same-host trusted-proxy caller 恢复 documented local direct gateway.auth.password fallback,同时仍拒绝 token fallback 和 forwarded-header 非可信路径。
  • Gateway/webchat 隐藏 internal runtime-context 和其他 display: false transcript messages。
  • Gateway/sessions 在 configured-only session list 中保留 ACP/acpx 和 runtime child sessions。

Agents / Runtime / Tools

  • 内置工具描述和 schema hints 被缩短,覆盖 media、messaging、sessions、cron、Gateway、web、image/PDF、TTS、nodes、plan tools,同时保留 routing guardrails。
  • fixes 默认应倾向清晰、有边界的重构、lean internals,以及明确 plugin SDK/API deprecation path。
  • video_generate reference-audio 参数仅在已注册 video provider 支持 audio inputs 时显示。
  • music_generate 会接管 song、jingle、beat、anthem、instrumental 请求,避免只回复歌词。
  • failed async image/music/video generation completions 在 requester-session handoff 失败时会直接投递 provider error,避免静默卡住。
  • provider conversation-state rejection 会转为清晰的 message-channel error,不再自动 reset 或泛化为 runner failure。
  • message tool 在 tools.alsoAllow 或 runtime allowlist 显式允许时,会保留给 embedded runs。

Codex / OpenAI / Provider

  • openai-codex GPT-5.1、GPT-5.2、GPT-5.3 model refs 不再被 config validation 拒绝。
  • 明确请求但未注册的 Codex harness 会 fail closed,不再悄悄尝试配置的 model fallbacks。
  • legacy oauthRef backed OAuth profiles 在 openclaw doctor --fix 迁移回 inline credentials 期间仍可用。
  • OpenAI streams 在 Responses chunks 密集时通过 setTimeout(0) yield,让 abort timers 能及时触发。
  • deterministic tool payload ordering 被保留,改善 OpenAI Responses 与 chat completions 的 prompt-cache reuse。
  • GitHub Copilot 会丢弃无法 replay 的 unsafe native Responses reasoning items,避免 invalid_request_body。
  • GitHub Copilot API 请求改为 identity-encoded,避免 Business account gzip 错误 payload 被当 JSON 解析。
  • Google provider 保留并恢复 Gemini 3 tool-call thought signatures;同时丢弃 compaction-truncated Gemini thought signatures,避免 malformed Base64 影响下一轮。
  • Xiaomi MiMo 会将 reasoning_content replay 成 provider-required thinking blocks。
  • Together video-generation 请求会走 Together v2 video API;模型兼容配置接受 thinkingFormat: "together"
  • Moonshot/Kimi 余额耗尽的 HTTP 429 会被归类为 billing,而不是普通 rate limit。

CLI / Config / Plugins

  • Node.js 22 最低小版本提升到 22.19。
  • @openclaw/proxyline 更新到 0.3.3,Pi packages 更新到 0.75.1。
  • Docker/Podman 新增 OPENCLAW_IMAGE_APT_PACKAGES 作为 runtime-neutral image build arg,OPENCLAW_DOCKER_APT_PACKAGES 保持 legacy fallback。
  • defineToolPluginopenclaw plugins build/validate/init 新增,用于 typed simple tool plugins、manifest metadata、tool declarations 与 context factories。
  • openclaw plugins doctor 会在 configured runtime 缺少 owner plugin 时警告,并复用 doctor --fix 的安装映射。
  • broken discovered plugins 如果没有被 active config 引用,不再导致 openclaw config validate 失败。
  • SecretRef diagnostics 发送到 stderr,避免 JSON stdout 被污染。
  • openclaw sessions list 成为 openclaw sessions 的别名。
  • openclaw infer image describe --file 接受 HTTP(S) URL,并走 guarded media path。
  • CLI/help 将 gateway、doctor、status、health help registration 与 action/runtime imports 解耦,受限终端下 --help 更轻。
  • CLI/update 的 Gateway recovery hints 会按 systemd、LaunchAgent、Scheduled Task 或通用 service manager 分平台显示。
  • CLI/update 在 package swap 期间延迟 doctor-time plugin package installs,避免重复 reinstall failure。
  • bundled memory CLI 作为 package entry 发布,使 package-installed openclaw memory commands 正常注册。
  • Plugin SDK 打包 openclaw/plugin-sdk/zod,避免 pnpm global install 缺少 package-local zod symlink。
  • legacy before_agent_start hooks 默认 15 秒超时,避免插件 handler 挂起阻塞 agent startup。

Skills

  • repo-local Codex closeout review skill 和 helper 改名为 autoreview,保留 Codex-first fallback 行为。
  • 新增 meme-maker skill:支持模板搜索、本地 SVG/PNG 渲染、Imgflip hosted rendering 和 Know Your Meme provenance links。
  • 新增 node inspector debugging、fused diagram generation、throwaway spike workflow skills。
  • Obsidian skill 改为面向官方 obsidian CLI,并要求注册 binary,不再使用第三方 obsidian-cli
  • 新增 Python debugging skill:覆盖 pdbbreakpoint()、post-mortem inspection 和 debugpy remote attach。
  • bundled skill prompts 与 metadata 收紧,skill descriptions 增加引号,刷新当前 CLI/API 指引,并更新 embedded sherpa-onnx runtime downloads。

Memory / QMD

  • Memory/QMD 对原始带连字符 query 保留 lexical search,同时规范化 semantic QMD sub-search,避免日期和 dashed identifiers 回退到 builtin index。
  • Memory-core 区分 sqlite-vec 加载失败与缺少 semantic vector embeddings 的 degraded warning,让诊断指向真实问题。
  • Memory-core 启动时扫描 persisted memory source sessions,比对磁盘 transcript 与 index,只标记缺失、新er 或大小变化文件 dirty,支持增量同步。
  • memory-triggered compaction 在 core tools 不可用时,会解释当前只暴露 read 和 append-only write。

Browser / Media / TTS

  • Browser snapshots 会展示 pending 和 recently handled modal dialogs;打开 modal 的 action 会返回 blockedByDialogbrowser dialog --dialog-id 可回答 pending dialogs。
  • Browser/CDP 在 NO_PROXY 大小写场景下保留 loopback proxy bypass,并在 attach failure 诊断中隐藏 home-relative Chrome MCP profile path。
  • Browser CLI 保留 browser-level options 到 nested commands,长时间 wait/download/dialog hooks 能按声明窗口保持打开。
  • Browser plugin 信任 managed Chrome CDP diagnostics,避免冷启动 HTTP probes 竞态造成误报启动失败。
  • Media metadata probing 不再对无法识别图片字节调用外部 decoder delegates,真实处理错误后也不继续 fallback chain。
  • Sharp 随 root package 安装;不可用时会 fallback 到 sips、Windows native imaging、ImageMagick、GraphicsMagick 或 ffmpeg。
  • Messages/TTS 会在 message-tool sends 进入 core/gateway/plugin delivery 前应用 TTS directives,避免原始 tag 泄露。

Feishu / Channel Context

  • Feishu session thread setup 返回绑定的 subagent delivery origins,子代理完成结果能回到相同 DM 或 topic。
  • Feishu DM、group、broadcast turns 会刷新 inbound session delivery context,避免后续回复继承 stale WebChat routing。
  • Feishu SecretRef top-level credentials 会被识别为 configured default account,不再误判为 app secret 缺失。
  • direct-message last-route 写入改为 per-channel-peer isolated sessions,避免污染 agent main session 的 channel delivery context。
  • stale webchat context 下,message tool 优先使用 non-webchat session-key routes,确保 message-tool-only replies 发回原始渠道。

Telegram / Discord / QQBot

  • Telegram generated media completions 会保留 requester-agent handoff 中的 topic IDs。
  • /btw 和 read-only status commands 不再中止 active runs,timed-out spool tombstones 也不保留 raw update payload。
  • Telegram stalled isolated-ingress handlers 会转入 tombstones,并在重启前 abort same-lane reply work,后续 same-chat updates 能继续 drain。
  • Telegram raw update verbose logs 会递归脱敏 identifiers 和 user metadata。
  • Telegram group reply chain 保留 replied-to bot messages、captions 和 media metadata。
  • Telegram/Ollama 会把当前图片附件传给 native PI/Ollama vision turns。
  • Discord/OpenAI realtime voice follow-up turns 持续可听,并预缓冲 assistant playback,减少开头卡顿。
  • QQBot C2C typing indicators 缩短为 10 秒窗口,每 5 秒续期,并保留 final passive-reply slot。
  • Cron/Discord explicit announce runs 保持 message-tool-only source-reply mode,避免 scheduled turns 同时自动可见回复而重复发。

Android / Voice

  • Android Talk Mode 改为 realtime Gateway relay voice sessions,支持 streaming mic input、realtime audio playback、tool-result bridging 和屏幕转录。
  • Android 在 Gateway TLS thumbprint 变化时会提示用户确认,展示旧/新 SHA-256 指纹,支持预期证书轮换。

升级关注点

  1. 确认 Node.js 版本:此版本提高 Node.js 22 line 最低要求到 22.19,升级前建议确认运行环境。
  2. 关注 Codex OAuth / openai-codex 路由:本版修复了多处 openai-codex、OAuth profile、Codex harness、GPT-5.x validation 问题,升级后建议跑一次 openclaw config validate 和常用模型探针。
  3. 检查 Gateway restart 行为:Gateway restart、ready latency、update-check、SIGUSR1/config restart、pending reply drain 都有变化,升级后可重点观察 restart trace 和 supervisor 行为。
  4. 通道场景建议实测:Feishu subagent completion、Telegram topic/media、Discord final reply、WhatsApp document send 都属于投递路径修复,最好用真实小消息验证闭环。
  5. Mac App 用户值得更新:Settings、Connection、Channels、Cron Jobs、Config panes 都有大量体验和崩溃修复。
  6. QA-Lab 门禁更严格:如果本地或 CI 依赖 QA-Lab,需要注意 runtime parity、tool coverage、token-efficiency、assistant-message usage 缺失会更容易 fail closed。

简要结论

这版不是单点小修,而是一次面向“长期运行”和“多运行时一致性”的维护版本。对鸣人的环境来说,最值得关注的是:Gateway 重启链路是否更快更可诊断、Feishu 子代理完成投递是否稳定、Codex OAuth / GPT-5.x 路由是否保持正确、Memory QMD 的 dashed/date 查询是否改善,以及 Mac App / Control UI 协议错配诊断是否更清晰

升级后建议至少执行:

node -v
openclaw config validate
openclaw status
openclaw models list

如果有通道插件在跑,再各发一条 Feishu / Telegram / Discord 测试消息,确认 final reply 和媒体投递路径正常。

https://www.fireself.cn/post/Kwp8KVVz

未登录无法操作

评论 0

列表为空,暂无内容
须弥技术

专业PHP开发,运维技术社区

打开 App