All posts

I like to write about stuff I'm into. You'll find a mix of web dev articles, tech news, and random thoughts from my life. Use the search below to filter by title.

April 4, 2026AI

300 刀主机硬刚 26B 大模型：黄仁勋的“显存税”正在被极客凿穿

300 刀的主机跑通 26B 大模型？这事儿听着不科学，但极客们用 MoE 架构和统一内存硬生生把老黄的“显存税”给钻开了。不用上万块的显卡，靠白菜价的内存也能让 260 亿参数的“大脑”在桌面上跳动。这场算力平权运动，才刚刚开始。

April 3, 2026AI

10 倍价差与 300 tokens/s：大模型 API 的暴利护城河正在崩塌

Google Gemma 4 与阿里 Qwen 3.6-Plus 正在通过开源与极致性价比，终结闭源大厂的 API 暴利时代。

April 2, 2026AI

51 万行代码的“拙诚”：Claude Code 裸奔后，我看到了 AI Agent 的真相

Anthropic 源码泄露揭示了 AI Agent 的工程真相：没有魔法，只有对细节的变态执着。

March 27, 2026AI

别再吹你的模型多聪明了，接不上本地代码库的 Agent 都是残废

大模型底层战争降温，Agent 的“集成层”成为核心战场。Anthropic 的 MCP 协议正在挑战 OpenAI 的封闭花园。

March 26, 2026AI

一项 3-bit 压缩技术引发的华尔街闪崩：为什么 AI 越省显存，内存反而越贵？

Google Research 发布 TurboQuant 算法，通过 3-bit 极致压缩实现 6 倍 KV-Cache 瘦身，引发存储芯片行业巨震。本文深度解析其背后的技术逻辑与杰文斯悖论。

March 26, 2026AI Agent

别再吹你的模型多聪明了，接不上本地代码库的 Agent 都是残废

别吹模型 benchmark 了，全是水！接不上本地 repo 的 Agent 纯属废柴。现在的核心是 integration。OpenAI 想搞封闭生态玩 lock-in 收税，吃相难看；Anthropic 直接甩出 MCP 协议，像 USB-C 一样无缝打通本地工具链，爽感拉满！以后谁还管你底层啥 model？能干活的开放生态才是王道，想建墙圈人的迟早被锤爆。

March 26, 2026AI

别再吹你的模型多聪明了，接不上本地代码库的 Agent 都是残废

大模型底层战争降温，现在的核心战场是 Agent 的“集成层”。Anthropic 的 MCP 协议正在与 OpenAI 的 Plugins 进行一场生态暗战。

March 26, 2026AI

别再吹你的模型多聪明了，接不上本地代码库的 Agent 都是残废

大模型底层战争降温，现在的核心战场是 Agent 的“集成层”。Anthropic 的 MCP 协议正在与 OpenAI 的 Plugins 进行一场生态暗战。

March 25, 2026AI Agent

从对话框到 OS：为什么说 Skills 才是 AI Agent 的终极抽象？

AI 正在从一个‘只会聊天的盒子’，进化为一个‘有手有脚的操作系统’。为什么 Skills 才是 Agent 的终极抽象？

March 24, 2026AI

Anthropic 悄悄接管了你的桌面，AI 创业者还有活路吗？

Anthropic 发布 Computer Use，让 Claude 直接接管键鼠。这不再是模型升级，而是一场对 AI 创业者的“降维打击”。这种绕过 API 直接翻窗的“暴力美学”，虽然推倒了软件间的墙，但也让 Token 燃烧速度快得像用印钞机取暖。当 AI 变成了一个换了你家锁的“Rootkit”，你准备好交出鼠标了吗？

March 22, 2026AI

Harness Engineering：AI 编程的“第三范式”，是程序员的救命稻草还是裁员预警？

从 Vibe Coding 到 Harness Engineering，程序员的角色正在发生剧变。当 AI 成了那个“酗酒的实习生”，你该如何设计那个让它无法犯错的“钢架子”？

March 21, 2026AI

Vibe Coding 的“大跃进”：当 10 万行代码只需 48 天，你的护城河还剩几块砖？

AI 降低了“写”的门槛，却极大地提高了“审”的要求。新时代的护城河不再是写代码的速度，而是判断“这段代码不该合并”的能力。