微软按下vibe coding暂停键:「烧token」已经比员工贵了

2026/05/27 01:37
🌐zh-Hans

给员工配 AI 副驾,工资不减反增 token 账单,这笔账注定亏。

微软按下vibe coding暂停键:「烧token」已经比员工贵了
原文标题:《微软按下 vibe coding 暂停键:烧 token 已经比员工贵了》
原文作者:张勇毅,极客公园

2026 年 5 月 14 日,微软已经开始取消大部分员工的 Claude Code 内部许可。截止日期是 6 月 30 日——也是微软财年最后一天。

仅仅 6 个月前,微软还在做完全相反的事——2025 年 12 月,它把 Claude Code 开放给数千名员工,包括工程师、产品经理、设计师,鼓励所有人都用 vibe coding 的方式来重塑工作流。员工很喜欢这个工具,但也许,太喜欢了。

但 6 个月之后,微软自己撤了。

而几乎在同一周,YC 的合伙人 Tom Blomfield 在一场 batch talk 上说了另一句话:「如果你的 API 账单不让你心痛,说明你烧得不够。」

同一个春天,硅谷正在为同一个问题给出两个完全相反的答案——AI 用起来,到底比人贵不贵?

01 vibe coding 的失败现场

微软取消的不是 Claude 这个模型。Anthropic 的模型还会继续通过 Copilot CLI 提供给微软员工。它取消的是 Claude Code 这个产品入口本身。

被影响最深的是「Experiences + Devices」这个部门——也就是 Windows、Microsoft 365、Outlook、Teams 和 Surface 背后的工程师团队。EVP Rajesh Jha 在内部备忘录里把这个决定包装成「工具链统一」(toolchain unification),但 The Verge 援引的微软内部消息更直白:员工普遍认为 Claude Code 比 Copilot CLI 更好用,Anthropic 这个工具在微软内部的流行,甚至让微软自家的 Copilot CLI 被「冷落」了。

换句话说,微软撤掉 Claude Code,不是因为它不行,是因为它太行

那个 6 月 30 日的截止日期也不是巧合——是微软财年的最后一天。砍掉一个员工普遍偏好的工具、换回自家产品、时间点卡在财年节点上——里面有多少是产品判断、有多少是财务考量,大家心知肚明。

图片来源:视觉中国

微软不是孤例。

一个月前,Uber 的 CTO Praveen Neppalli Naga 对 The Information 透露:公司 2026 年全年的 AI 编程工具预算,在前 4 个月就烧光了。Uber 此前还专门搞过内部排行榜,用比赛的方式激励员工多用 AI——结果是预算崩盘。

更直白的是英伟达应用深度学习副总裁 Bryan Catanzaro 接受 Axios 采访时说的那句:「对我的团队来说,算力的成本远远超过员工的成本。」这是从一家硬件公司的高管嘴里说出来的——这家公司的核心产品就是卖算力。

Fortune 把这些线索串到一起,给文章起了一个非常 Fortune 的标题:「微软的报告暴露了 AI 真正的成本问题——用这玩意儿比养员工还贵」。

如果只读到这一层,结论很简单:vibe coding 失败了,AI 替代人这个故事可以收摊了。

但这个结论下早了。

02 Copilot 模式已经「撞墙」

要解释微软的撤退,得先讲清楚 vibe coding 是什么。

这个词是 Andrej Karpathy 在 2025 年初提出的——他描述了一种新的编程方式:开发者不再一行行写代码,而是用自然语言描述意图,让 LLM 生成代码。开发者甚至不读代码、只看结果——能跑就接受,不能跑就再让 AI 改一遍。

这是 AI 时代最有诱惑力的一种生产力承诺。它意味着:一个不会写 Rust 的工程师能让 AI 帮他写 Rust;一个产品经理能让 AI 帮他做出原型;一个设计师能让 AI 帮他写出能跑的代码。微软 2025 年 12 月那次开放 Claude Code 的对象——工程师、PM、设计师——恰好就是这三类人。这不是巧合,这是 vibe coding 最经典的落地姿势。

但 vibe coding 落到大公司里,会变成一件结构上很别扭的事。

假设微软有一个工程师,年薪 30 万美元。微软给他配一个 Claude Code 之后,他的产出提升了 20%——这是 vibe coding 最理想的状态。但与此同时,他每个月烧掉的 token 成本,是 200 美元、500 美元、还是 2000 美元?这个数字会随着他对 AI 的依赖越来越深而单调上升。

更麻烦的是,他不会因为「用了 AI」就被裁掉——他的 30 万年薪还在,福利还在,他的工位还在。

也就是说,微软的总成本结构是「原来的员工工资 + 新增的 token 账单」。这个公式只有一个方向——成本暴涨。

而「员工产出 +20%」这件事在财务上的反映是「营收 +20%」吗?不是。是「营收维持不变,但成本结构里多了一项 AI 账单」——因为大部分员工的产出,并不直接对应新增的收入,他写得更快不代表公司卖得更多。

这就是 Catanzaro 那句「算力比员工贵」真正的含义。它不是说 AI 笨,是说当你把 AI 装在原来的员工身上,你不可能让账算得过来。

这个逻辑还有数据支撑。

Gartner 最近一份预测里说:到 2030 年,一万亿参数大模型的推理成本将比 2025 年下降近 90%。听上去是 AI 越来越便宜了,但 Gartner 的真正结论是:这并不会让企业的 AI 总账单变便宜。Gartner 高级总监分析师 Will Sommer 说过一句话——「CPO 们不应该把『商品级 token 的通缩』和『前沿推理能力的入门化』混为一谈。」

Goldman Sachs 的预测更直接:到 2030 年,agentic AI 将推动 token 消耗量增长 24 倍,达到每月 120 千万亿。单 token 价格下降 90%、消耗量增长 24 倍——结果是总账单还在涨。

黄仁勋有一个更激进的版本。他几个月前在公开场合说,未来每一个英伟达员工身边都会有 100 个 AI agent 一起工作。

听上去很美。但如果你是 CFO,你听到的是什么?是 100 个 token 烧炉,每天 24 小时不停地烧。

问题不是 AI 太贵。问题是「给每个员工配一个 AI 副驾」这个假设本身。

这种姿势在科技圈有一个流行的名字——「副驾模式」(copilot mode)。它的核心假设是:人继续在驾驶位上,AI 在副驾位上给你建议。它不替代你,只是让你更快。

这个假设在文字层面非常温柔——「AI 不会抢走你的工作,AI 只是帮你」。但在财务层面,它的隐含意思是:原来的所有工资不变,但额外多了一项 token 费用

而 token 不是固定费用,是按消耗计费的。员工用得越多,公司付得越多——这恰好是企业最不愿意看到的成本结构:浮动、上不封顶、跟着产能反向放大。

微软在 2025 年 12 月开放 Claude Code 的时候,可能并没有完全意识到这一点。它本来想的是:让员工试一下,看看 AI 能让工作效率提升多少。但 6 个月之后,员工真的用上瘾了,Claude Code 在微软内部太流行——结果就是 token 账单远超预期,超过了微软自己能从这种流行中拿回的产出。

微软撤了。但撤的不是 AI——撤的是「员工继续在驾驶位、AI 在副驾位」这种结构。

这是一种结构性的失败。它不会因为模型更便宜而消失,也不会因为员工更熟练而消失——它会随着员工对 AI 越来越熟练而更严重

03 烧 token,是因为不烧人头

几乎和微软撤退同一周,Tom Blomfield 在 YC 的 batch talk 上提出了一个完全不同的视角。他没有讨论「AI 该怎么用」——他讨论的是「AI 时代的公司应该长什么样」。

Blomfield 的判断很直接:今天大部分公司还是「罗马军团」式的结构——信息逐级向上传递、命令逐级向下分发、人是协调的核心。把 AI 装到这种结构上,效果就是把热兵器发给罗马步兵——他们会用得更狠,但战术不会变

真正的 AI-native 公司应该是另一种样子。

Blomfield 用了一个很具体的描述:每个动作都应该产生一个可记录、可调用的产物,让一切对 AI 清晰可读(legible to AI);公司应该被设计成「自我改进的 AI 循环」,系统能感知环境、做出决策、调用工具、接收反馈、自我修正。

人在这种公司里只剩两种角色。一是个人贡献者——每个人不论部门都是 builder 和 operator,开会带原型,不光带想法;二是 DRI(直接负责人)——每个产出都有一个明确的责任人,「不能躲到 AI 后面」。

然后 Blomfield 说了那句金句:「如果你的 API 账单不让你心痛,说明你烧得不够。」

这句话如果出现在微软的 CFO 办公室,会被当成笑话;但放在 YC 一屋子初创公司创始人面前,没有人觉得疯狂。

为什么?

YC 另一位合伙人 Diana Hu 在 5 月初的 Startup School 里给出了答案。她讲了一句话——「最大化的不是人头,是 token 消耗」。她还有更直白的版本:「一个人配上 AI 工具,就等于过去一支大工程师团队。」

注意这里的关键词:「等于」。不是「相当于」,不是「类似于」——是替代。

YC 那批 P26 2026 春季 batch 里,已经有不少公司在用 5、6 个人做过去需要 20、30 人才能做的事。它们的 token 账单当然高,但它们的人员账单极低——账整体算下来,是赚的。

更激进的案例是 Block。Jack Dorsey 旗下这家金融科技公司最近裁了 40% 的员工。这不是传统意义上的「降本增效」——Block 同时把 AI 工具的内部投入加大,新结构就是 Diana Hu 描述的那种:IC + DRI + AI agent。

烧 token 在 YC 的语境里不是支出,是替代。它替代的不是 AI 之外的开销,是人头工资。账之所以算得过来,是因为公司同步去掉了那些原本要烧工资的位置。

这就是微软和 YC 看到同一件事,却给出相反答案的根本原因——他们烧的根本不是同一种 token。微软的 token 是给原班人马的副驾加油,YC 的 token 是替代原本的驾驶员

04 真正的资产正在被重新定义

Tom Blomfield 在对谈里,还说了另一句更耐人寻味的话——「人是短暂的,上下文文档才是重要的。」

这是一个会计学层面的判断。

传统公司的资产负债表是怎么写的?左边是固定资产、应收账款、商誉、IP,右边是负债和股东权益。员工不在资产那一栏——员工是成本。但每个公司心里都知道,员工其实是真正的资产:客户关系在销售脑子里,业务直觉在产品经理脑子里,技术 know-how 在工程师脑子里。

这种「资产」的特点是会走的。员工离职,资产就跑了。

而 Blomfield 描述的 AI-native 公司,是在做一件事:把这些原本只存在于人脑里的资产,全部抽取出来,变成 AI 可读、可调用、可迭代的「上下文资产」。

具体形式是什么?是详尽的需求文档;是把每一次决策、每一次邮件往来、每一次 Slack 讨论沉淀下来的过程文档;是开放的 MCP 接口和 API;是每个内部工具产生的 artifact——所有这些东西,构成了一家公司新的、可继承的、不会随员工离职而蒸发的资产层。

人在这种公司里反而变成「变量」——可以快速接入,也可以快速离开,因为公司的核心资产不在人脑里,在文档里。

图片来源:视觉中国

这种结构如果成立,意味着的不只是一种新的组织模式——意味着公司的资产负债表正在被重写。一家 6 个人、烧着惊人 token 账单的 AI-native 公司,看上去财务不健康,但它真正的资产可能比一家 60 个人的传统公司还厚——只是这种资产,现在的会计准则还没学会怎么计算。

换句话来讲,vibe coding 没有死。它只是不属于传统公司。

微软撤掉 Claude Code 的那天,不是 AI 经济学失败的一天——是一种把 AI 装在旧组织上的姿势,被它自己证伪的一天。

而 YC 那一屋子初创公司里,正在长出另一种姿势——它们小、它们烧、它们没有 KPI 表里的「员工 AI 使用率」、它们的 CFO 也不会因为 token 账单暴涨而恐慌——因为他们烧的本来就不是「员工的副驾」,是「员工的替代品」。

未来几年,所有还在让员工「多用一点 AI」的中型公司,都会撞到微软撞过的那堵墙——结构性必涨的 token 账单。

但撞墙的真正原因,不是 AI 太贵——是组织还没改。

而绝大多数公司,恐怕一时半会儿都不会改。

原文链接
QQlink

Tiada pintu belakang kripto, tiada kompromi. Platform sosial dan kewangan terdesentralisasi berasaskan teknologi blockchain, mengembalikan privasi dan kebebasan kepada pengguna.

© 2024 Pasukan R&D QQlink. Hak Cipta Terpelihara.