cover

别再纠结 Prompt 了，AI 已经开始自己写“操作系统”了

最近 Anthropic 的工程师 Thariq（Claude Code 的核心开发者）抛出了一个挺硬核的观点：Skills 才是 AI Agent 的终极抽象。

说实话，刚看到这种“大词”我本能地想翻白眼，觉得又是大厂程序员在造新概念。但当我把这几周折腾 Claude Code 的经历复盘了一下，我发现这可能不是在故弄玄虚，而是我们真的撞到了一个分水岭：AI 正在从一个“只会聊天的盒子”，变成一个“有手有脚的操作系统”。

从“外挂”到“本能”：AI 的三次进化

回看这两年，AI 的进化路径其实挺有意思：

复读机阶段（Chatbot）： 你问它答，干活还得你自己复制粘贴。
工具人阶段（Tool Use）： 给它接几个 API（查天气、搜网页）。这时候它有“手”了，但很笨，每次用工具都要反复确认，速度慢得像 2G 时代。
操作系统阶段（Skills / OS 架构）： 这就是我们现在聊的。它不再是“调用工具”，而是“拥有技能”。

在 Claude Code 的体系里，这被归纳成了 9 大类核心技能：文件系统操作、Bash 命令执行、渐进式披露、记忆存储……

本质上，你不是在给 AI 下指令，你是在给它提供一套标准化的“工具箱”。有了这套 Skills，AI 就不再是一个只会瞎猜的概率机器，而是一个有工程素养的“数字员工”。（虽然有时候这个员工也会写出让你想撞墙的 Bug，但起码它知道该去哪儿翻文档了。）

极速沙箱：给 AI 盖个“防爆间”

如果 Skills 是软件，那它跑在哪儿？这里就涉及到一个很关键的概念：沙箱（Sandbox）。

之所以要用沙箱，是因为 AI 运行代码就像让一个“力大无穷但脑回路清奇”的实习生去操作你的服务器。如果没有沙箱，它手滑执行一个 rm -rf /，或者被投毒的包（比如前两天的 LiteLLM 事件）偷走了你的 API Key，你就彻底崩了。沙箱就是一个“防爆间”，它在里面怎么折腾，火都烧不到外面。

但传统的 Docker 容器太重了，起个容器要等 500ms，反馈延迟直接就把体验搞崩了。

所以 Cloudflare 最近发的 Dynamic Workers 挺吓人的。他们用 V8 isolates 技术，把启动速度直接干到了 1-5ms，比传统容器快了 100 倍。现在的基建逻辑已经变了：极速启动的微沙箱 + 结构化的 Skills 抽象 = 一个高性能的 AI 运行时。

80% 的时间在 Plan，20% 在执行

Claude Code 的创造者 Boris 提了个建议：“计划对了，代码就对了。”

现在的核心工作流变成了：80% 的时间花在 Plan（计划），20% 的时间交给 Agent 执行。 你的角色从“码农”变成了“架构师”或者“监制”。你不需要盯着每一行代码怎么写，而是通过 plan.md 这种锚点，在多个 Agent 之间进行任务编排。

Boris 甚至建议大家不要串行工作。因为 Agent 是可以并行的。你可以同时开 5 个实例：一个在改 Bug，一个在写测试，一个在重构。这种“并行开发”的效率，以前单兵作战的时候简直不敢想。

反对的声音：这玩意儿真的靠谱吗？

当然，这种“Agent 统治一切”的叙事听着很爽，但现实里泼冷水的人也不少。

首先是安全问题。 前两天 LiteLLM 在 PyPI 上刚被投了毒，搞得一堆开发者心惊肉跳。这种“自动驾驶”的开发模式，风险其实比手动写代码大得多。

其次是成本。 OpenAI 的 Sora 最近传闻被砍，很大一部分原因就是 GPU 成本太高。Agent 这种“并行开发”模式，本质上是在用 Token 换时间。如果你同时开 10 个 Agent 帮你干活，月底的账单可能会让你怀疑人生。

最后是“管理地狱”。 有人吐槽说，以前是写代码累，现在是“管 Agent”累。如果你要调度 48 个 Agent 组成的虚拟工作室，你可能得先去考个 PMP（项目管理认证）。

核心竞争力正在易主

虽然坑很多，但趋势就在这儿。

未来的顶尖开发者可能不再是那个算法背得最熟的人，而是那个能定义出最精简 Skills 集、构建出最稳健 Plan 锚点，并且能防住 Agent“造反”的人。

AI 已经拿到了操作系统的钥匙。至于我们？可能以后真的只需要负责“出主意”和“修 Bug”了。

从对话框到 OS：为什么说 Skills 才是 AI Agent 的终极抽象？