Skip to content

开篇钩子

你有没有想过这样一个场景:你在 WhatsApp 上收到一条来自老板的消息「帮我查一下上周的服务器宕机原因」,你拿起手机,@ 了一个机器人,三分钟后收到一份完整的分析报告——包括日志摘要、根因分析、修复建议,以及一个 GitHub PR 链接。你甚至不需要打开电脑。

这不是科幻。这就是 OpenClaw——一个你自托管在自己服务器上的个人 AI 助手,它能接入 WhatsApp、Telegram、Slack、Discord、Signal、iMessage、WeChat(微信)、QQ、Microsoft Teams、Google Chat、Matrix 等 20+ 个平台,让你随时随地通过消息跟你的 AI 助手对话。

我在一台 4GB 内存的 VPS 上跑 OpenClaw 跑了两个月,它已经成了我日常工作中不可或缺的「第二大脑」。但这个过程并不全是美好的——从安装到稳定运行的路上踩了不少坑。

核心体验

安装与首次启动

bash
npm install -g openclaw@latest
openclaw onboard --install-daemon

安装过程比想象中顺利。openclaw onboard 是一个交互式引导程序,会带着你完成 Gateway 配置、选择模型、设置通道、配置安全策略。整个过程大概 15 分钟。

前提是你必须用 Node 24(或 Node 22.19+)。我一开始在 Node 20 上安装,折腾了半小时各种诡异报错,看了文档才发现版本要求。这个门槛应该被写在大字报上。

OpenClaw 使用 Gateway 架构——一个中心控制面管理所有会话、通道、工具和事件。Gateway 可以安装为 launchd(macOS)或 systemd(Linux)用户服务,开机自启动。启动后,你可以通过 openclaw dashboard 打开浏览器控制面板,或者通过配置的通道直接和 AI 对话。

最推荐新手使用的通道是 Telegram——配置最简单(只需要创建 Bot 获取 Token),文档最全,权限控制最灵活。

多通道统一入口的真实体验

在我的部署中,OpenClaw 同时连接了 Telegram、WhatsApp 和 Slack。这意味着:

  • 在办公室的 Mac 上,我通过 Slack 和它对话
  • 在通勤地铁上,我通过 Telegram 手机 App 发消息
  • 在家里,我通过 WebChat(浏览器控制面板)进行深度交互
  • 所有对话共享同一个 AI 上下文和会话历史

这种体验有一种微妙的「连续感」——你不需要在不同的工具之间切换身份。上午在 Slack 上让它分析一个 Bug,下午在 Telegram 上问「之前那个 Bug 的修复进展如何?」它能回忆起上午的对话并给状态更新。

但有一个体验上的瑕疵:不同通道的消息格式和渲染能力不同。Slack 支持丰富的 Block Kit 格式,Telegram 支持 Markdown V2,WhatsApp 只支持极有限的格式化。AI 助手在 Telegram 上发了一段精美的 Markdown 表格,到了 WhatsApp 上就变成了无法阅读的纯文本。这一点在同时使用多个通道时会让人沮丧。

安全模型:DM 配对机制

OpenClaw 连接的是真实的聊天平台,安全是头等大事。默认的 DM 策略是 Pairing Mode——未知的发送者会收到一个简短的配对码,他们的消息不会被 AI 处理。你需要手动运行:

bash
openclaw pairing approve telegram ABCD1234

来授权这个用户的 DM 权限。对于群聊,可以设置 requireMention: true,这样只有 @ 了机器人的消息才会被处理。

这个设计很聪明——它让 OpenClaw 默认安全,但高级用户可以解锁完全的公开访问。不过有一个安全隐患:微信的接入存在封号风险。微信的 EULA 明确禁止自动回复机器人,大量使用 OpenClaw 的微信插件可能导致账号被限制。GitHub 上的 Issues 里有好几个用户报告过这个问题。

功能深挖

Agent 路由与多工作区

OpenClaw 的一个强大但容易忽视的功能是 Multi-Agent Routing——你可以把不同的通道/账号/联系人路由到不同的 Agent 工作区。

比如:

json5
{
  agents: {
    defaults: {
      workspace: "~/.openclaw/workspace",
      model: "claude-4"
    },
    routing: [
      {
        match: { channel: "slack", peer: "work-team" },
        workspace: "~/.openclaw/workspace-work",
        model: "gpt-5"
      },
      {
        match: { channel: "whatsapp", peer: "+1234567890" },
        workspace: "~/.openclaw/workspace-personal",
        sandbox: { mode: "docker" }
      }
    ]
  }
}

这样你的工作群聊用的是专用工作区(有公司的代码库上下文),个人 DM 用的是沙箱隔离的独立工作区,两边的代码和数据完全隔离。

Sandbox 沙箱模式

对于非 main 会话(比如群聊中的匿名用户),OpenClaw 支持 Docker 沙箱执行。Agent 的代码执行、文件操作都被限制在 Docker 容器里,无法影响宿主机文件系统。SSH 和 OpenShell 后端也作为备选可用。

沙箱默认允许 bashprocessreadwriteedit 等基本工具,但禁止 browsercanvascrongateway 等高级工具。

这个功能对于开放给团队使用的场景是必须的——你绝对不希望同事在群聊里的一句「帮我清理一下 /tmp 目录」真的清掉了你服务器上的东西。

Voice Wake + Talk Mode

如果你在 macOS 或 iOS 上使用了 OpenClaw 配套的 App,你可以启用 Voice Wake——喊一声唤醒词(默认是 "Hey Claw"),然后通过语音跟 AI 对话。Android 上甚至支持连续的 Talk Mode(基于 ElevenLabs 语音合成)。

坦白说这个功能在编码场景下用处不大(你不太会在办公室大喊「Hey Claw 帮我重构这个函数」),但在以下场景非常实用:

  • 做饭时口述一个待办事项,OpenClaw 自动创建 Jira Ticket
  • 开车时口述会议纪要,AI 自动整理成文档
  • 半夜灵感来了,对着手机说一段代码思路,醒来时 AI 已经帮你生成了初稿

Live Canvas:AI 驱动的可视化工作区

OpenClaw 最有想象力的功能是 Live Canvas——一个 AI 驱动的可视化工作区。你发文字指令,AI 在 Canvas 上创建图表、流程、代码架构图、甚至交互式的 UI 原型。

Canvas 支持 **A2UI(Agent-to-User Interface)**协议,意味着 Agent 可以动态构建界面元素。我试过让它画我的微服务架构图——我只描述了服务名称和调用关系,它自动生成了带箭头的拓扑图,标注了每个服务的端口和协议。

不过 Canvas 目前只能在 macOS app 上使用,移动端的体验还在 Beta 阶段。

真实评测

优点

  • 自托管,数据完全由你掌控,没有第三方能读取你的对话。
  • 376k GitHub Star,社区极其活跃,55k+ commit,更新迭代速度惊人。
  • 20+ 通道支持,几乎覆盖所有主流聊天平台,包括微信和 QQ。
  • 多 Agent 路由 + 工作区隔离,一个实例服务多个场景。
  • 沙箱执行,开放给团队使用也很安全。
  • Voice Wake + Talk Mode + Live Canvas,远超普通聊天机器人的交互方式。
  • MIT 开源,代码完全透明。
  • 赞助商包括 OpenAI、GitHub、NVIDIA、Vercel,项目可持续性有保障。

缺点

  • Node 24 要求严格,老版本 Node 上各种报错。
  • 通道配置繁琐——Telegram 最简单,WhatsApp 和微信的配置堪称噩梦级。微信还有封号风险。
  • 运维成本:虽然一键安装,但长期运行需要维护(升级、监控、故障恢复),不是「装完就忘」的工具。
  • Markdown 渲染跨通道不一致,不同平台的展示效果差异大。
  • Token 消耗不低:多通道 + 长上下文 + Agent 模式,每月的 API 费用需要认真管理。
  • 中文文档不够:虽然支持微信/QQ,但大部分文档和社区讨论都是英文。

Reddit 上的一条高赞评论总结得很好:「OpenClaw 是我用过最强大的个人 AI 助手,但它也是最 '需要维护' 的个人 AI 助手。如果你享受折腾的过程,它是完美的。如果你想要开箱即用,选 ChatGPT。」

横向对比

特性OpenClawChatGPT DesktopClaude Code自建 Bot
自托管支持不支持本地运行支持
通道数量20+Web + App终端 + IDE取决于实现
Agent 能力完整有限完整取决于实现
多工作区支持有限Sub-agents需自己实现
语音交互Voice WakeVoice Mode需自己实现
Canvas支持需自己实现
微信支持支持(有风险)不支持不支持需自己实现
安装复杂度中等
开源MIT取决于实现

OpenClaw 的独特价值在于:它是唯一一个将「自托管」+「多通道」+「Agent 能力」+「开放生态」结合在一起的工具。 没有任何商业产品能给你 20+ 通道的覆盖范围和完全的数据控制权。

适用人群

推荐给: 全栈开发者、注重数据主权的技术用户、需要多平台统一 AI 入口的团队、技术社群运营者、想自己搭建客服机器人的企业、喜欢折腾的黑客。

不建议: 不想花时间运维的非技术用户、只需要单一平台 AI 助手的普通用户、对微信封号风险敏感的用户。

上手建议

  1. 从 Telegram 开始——配置最简单,文档最全,5 分钟就能跑通。搞定后再逐步添加其他通道。
  2. 安全配置不能跳过:至少在初期设置 dmPolicy: "pairing",群聊设置 requireMention: true
  3. 用 Docker 跑沙箱agents.defaults.sandbox.mode: "non-main" 可以隔离非主会话的执行环境。
  4. 设置用量告警openclaw doctor 可以检查安全配置和 DM 策略问题,定期跑一次。
  5. 不要在生产环境追最新版:OpenClaw 的 dev 分支更新极其频繁,用 stable 发布版更稳定。切换通道:openclaw update --channel stable
  6. 加入 Discord 社区(discord.gg/clawd),遇到配置问题时比翻文档更快。
  7. 微信插件谨慎使用:如果必须用微信,使用单独的小号,不要用主号冒险。

基于 VitePress 构建 | 部署于 Cloudflare Pages