从对话框到 OS:为什么说 Skills 才是 AI Agent 的终极抽象?

- Published on
- /7 mins read/––– views

别再纠结 Prompt 了,AI 已经开始自己写“操作系统”了
最近 Anthropic 的工程师 Thariq(Claude Code 的核心开发者)抛出了一个挺硬核的观点:Skills 才是 AI Agent 的终极抽象。
说实话,刚看到这种“大词”我本能地想翻白眼,觉得又是大厂程序员在造新概念。但当我把这几周折腾 Claude Code 的经历复盘了一下,我发现这可能不是在故弄玄虚,而是我们真的撞到了一个分水岭:AI 正在从一个“只会聊天的盒子”,变成一个“有手有脚的操作系统”。
从“外挂”到“本能”:AI 的三次进化
回看这两年,AI 的进化路径其实挺有意思:
- 复读机阶段(Chatbot): 你问它答,干活还得你自己复制粘贴。
- 工具人阶段(Tool Use): 给它接几个 API(查天气、搜网页)。这时候它有“手”了,但很笨,每次用工具都要反复确认,速度慢得像 2G 时代。
- 操作系统阶段(Skills / OS 架构): 这就是我们现在聊的。它不再是“调用工具”,而是“拥有技能”。
在 Claude Code 的体系里,这被归纳成了 9 大类核心技能:文件系统操作、Bash 命令执行、渐进式披露、记忆存储……
本质上,你不是在给 AI 下指令,你是在给它提供一套标准化的“工具箱”。有了这套 Skills,AI 就不再是一个只会瞎猜的概率机器,而是一个有工程素养的“数字员工”。(虽然有时候这个员工也会写出让你想撞墙的 Bug,但起码它知道该去哪儿翻文档了。)
极速沙箱:给 AI 盖个“防爆间”
如果 Skills 是软件,那它跑在哪儿?这里就涉及到一个很关键的概念:沙箱(Sandbox)。
之所以要用沙箱,是因为 AI 运行代码就像让一个“力大无穷但脑回路清奇”的实习生去操作你的服务器。如果没有沙箱,它手滑执行一个 rm -rf /,或者被投毒的包(比如前两天的 LiteLLM 事件)偷走了你的 API Key,你就彻底崩了。沙箱就是一个“防爆间”,它在里面怎么折腾,火都烧不到外面。
但传统的 Docker 容器太重了,起个容器要等 500ms,反馈延迟直接就把体验搞崩了。
所以 Cloudflare 最近发的 Dynamic Workers 挺吓人的。他们用 V8 isolates 技术,把启动速度直接干到了 1-5ms,比传统容器快了 100 倍。现在的基建逻辑已经变了:极速启动的微沙箱 + 结构化的 Skills 抽象 = 一个高性能的 AI 运行时。
80% 的时间在 Plan,20% 在执行
Claude Code 的创造者 Boris 提了个建议:“计划对了,代码就对了。”
现在的核心工作流变成了:80% 的时间花在 Plan(计划),20% 的时间交给 Agent 执行。 你的角色从“码农”变成了“架构师”或者“监制”。你不需要盯着每一行代码怎么写,而是通过 plan.md 这种锚点,在多个 Agent 之间进行任务编排。
Boris 甚至建议大家不要串行工作。因为 Agent 是可以并行的。你可以同时开 5 个实例:一个在改 Bug,一个在写测试,一个在重构。这种“并行开发”的效率,以前单兵作战的时候简直不敢想。
反对的声音:这玩意儿真的靠谱吗?
当然,这种“Agent 统治一切”的叙事听着很爽,但现实里泼冷水的人也不少。
首先是安全问题。 前两天 LiteLLM 在 PyPI 上刚被投了毒,搞得一堆开发者心惊肉跳。这种“自动驾驶”的开发模式,风险其实比手动写代码大得多。
其次是成本。 OpenAI 的 Sora 最近传闻被砍,很大一部分原因就是 GPU 成本太高。Agent 这种“并行开发”模式,本质上是在用 Token 换时间。如果你同时开 10 个 Agent 帮你干活,月底的账单可能会让你怀疑人生。
最后是“管理地狱”。 有人吐槽说,以前是写代码累,现在是“管 Agent”累。如果你要调度 48 个 Agent 组成的虚拟工作室,你可能得先去考个 PMP(项目管理认证)。
核心竞争力正在易主
虽然坑很多,但趋势就在这儿。
未来的顶尖开发者可能不再是那个算法背得最熟的人,而是那个能定义出最精简 Skills 集、构建出最稳健 Plan 锚点,并且能防住 Agent“造反”的人。
AI 已经拿到了操作系统的钥匙。至于我们?可能以后真的只需要负责“出主意”和“修 Bug”了。
你准备好交出键盘了吗?
