Microsoft nhấn nút tạm dừng mã hóa Vibe: "đốt token" đã đắt hơn cả nhân viên

2026/05/27 01:39
🌐vi

Việc chỉ định các phi công AI cho nhân viên sẽ làm tăng chi phí mã thông báo thay vì giảm lương, điều này chắc chắn sẽ gây lỗ.

Microsoft nhấn nút tạm dừng mã hóa Vibe: "đốt token" đã đắt hơn cả nhân viên
Tiêu đề gốc: "Microsoft nhấn nút tạm dừng mã hóa Vibe: việc đốt mã thông báo đã đắt hơn nhân viên"
Tác giả gốc: Zhang Yongyi, Geek Park

Vào ngày 14 tháng 5 năm 2026, Microsoft đã bắt đầu hủy giấy phép nội bộ Claude Code cho hầu hết nhân viên. Hạn chót là ngày 30 tháng 6 - ngày cuối cùng trong năm tài chính của Microsoft.

Chỉ 6 tháng trước, Microsoft đã làm điều hoàn toàn ngược lại - vào tháng 12 năm 2025, hãng đã mở Claude Code cho hàng nghìn nhân viên, bao gồm các kỹ sư, giám đốc sản phẩm và nhà thiết kế, khuyến khích mọi người sử dụng mã hóa Vibe để định hình lại quy trình làm việc. Nhân viên yêu thích công cụ này nhưng có thể là quá nhiều.

Nhưng sáu tháng sau, Microsoft đã rút lui.

Gần như trong cùng tuần đó, đối tác của YC, Tom Blomfield, đã nói điều gì đó khác trong một cuộc nói chuyện theo đợt: "Nếu dự luật API của bạn không khiến bạn đau lòng, điều đó có nghĩa là bạn chưa đốt nó đủ."

Cũng trong mùa xuân đó, Thung lũng Silicon đưa ra hai câu trả lời hoàn toàn trái ngược nhau cho cùng một câu hỏi - sử dụng AI có đắt hơn con người không?

01 Cảnh thất bại của mã hóa cảm xúc

Cái mà Microsoft hủy bỏ không phải là mô hình Claude. Các mô hình của Anthropic cũng sẽ tiếp tục được cung cấp cho nhân viên Microsoft thông qua Copilot CLI. Những gì nó hủy bỏ chính là lối vào sản phẩm Claude Code.

Bộ phận bị ảnh hưởng nhiều nhất là bộ phận “Trải nghiệm + Thiết bị”—nhóm kỹ sư phụ trách Windows, Microsoft 365, Outlook, Teams và Surface. EVP Rajesh Jha gọi quyết định này là "sự thống nhất chuỗi công cụ" trong một bản ghi nhớ nội bộ, nhưng thông tin nội bộ từ Microsoft được The Verge trích dẫn lại đơn giản hơn: nhân viên thường tin rằng Claude Code hữu ích hơn Copilot CLI và sự phổ biến của Anthropic trong Microsoft thậm chí còn khiến Copilot CLI của chính Microsoft bị "loại bỏ".

Nói cách khác, Microsoft loại bỏ Claude Code không phải vì nó không tốt mà vì nó quá tốt.

Thời hạn ngày 30 tháng 6 cũng không phải ngẫu nhiên—đó là ngày cuối cùng trong năm tài chính của Microsoft. Cắt bỏ một công cụ mà nhân viên thường ưa thích và thay thế nó bằng sản phẩm của chính họ, thời gian bị kẹt ở nút năm tài chính - mọi người đều biết trong đó bao nhiêu là đánh giá sản phẩm và bao nhiêu là cân nhắc tài chính.

Nguồn hình ảnh: Visual China

Microsoft thì không một trường hợp bị cô lập.

Một tháng trước, CTO Praveen Neppalli Naga của Uber đã tiết lộ với The Information: Ngân sách dành cho công cụ lập trình AI cả năm của công ty cho năm 2026 đã cạn kiệt trong bốn tháng đầu tiên. Uber trước đó đã tiến hành xếp hạng nội bộ và sử dụng các cuộc thi để thúc đẩy nhân viên sử dụng AI nhiều hơn - kết quả là ngân sách bị sụp đổ.

Điều thậm chí còn đơn giản hơn là điều mà Bryan Catanzaro, phó chủ tịch phụ trách học sâu ứng dụng tại Nvidia, đã nói trong một cuộc phỏng vấn với Axios: "Đối với nhóm của tôi, chi phí cho sức mạnh tính toán vượt xa chi phí của nhân viên." Đây là nhận định của giám đốc điều hành một công ty phần cứng - sản phẩm cốt lõi của công ty này là bán sức mạnh tính toán.

Fortune đã ghép những manh mối này lại với nhau và đặt cho bài báo một tiêu đề rất Fortune: "Báo cáo của Microsoft vạch trần vấn đề chi phí thực sự của AI - sử dụng thứ này còn tốn kém hơn cả việc tuyển dụng nhân viên."

Nếu bạn chỉ đọc đến mức này thì kết luận rất đơn giản: mã hóa cảm xúc đã thất bại và câu chuyện về AI thay thế con người có thể khép lại.

Nhưng kết luận này là quá sớm.

02 Mô hình Copilot đã "đập tường"

Để giải thích sự rút lui của Microsoft, trước tiên chúng ta phải giải thích rõ ràng Vibe Coding là gì.

Thuật ngữ này được Andrej Karpathy đề xuất vào đầu năm 2025 - ông mô tả một cách lập trình mới: các nhà phát triển không còn viết mã theo từng dòng nữa mà mô tả ý định bằng ngôn ngữ tự nhiên và để LLM tạo mã. Các nhà phát triển thậm chí không đọc mã mà chỉ nhìn vào kết quả - nếu nó hoạt động, họ chấp nhận và nếu không, họ để AI thay đổi lại.

Đây là lời hứa về năng suất hấp dẫn nhất trong kỷ nguyên AI. Nó có nghĩa là: một kỹ sư không viết được Rust có thể để AI viết Rust cho anh ta; người quản lý sản phẩm có thể để AI giúp anh ta tạo ra nguyên mẫu; và nhà thiết kế có thể để AI giúp anh ta viết mã có thể chạy được. Đối tượng mục tiêu khi Microsoft khai trương Claude Code vào tháng 12 năm 2025-các kỹ sư, Thủ tướng và nhà thiết kế-chính xác là ba loại người này. Đây không phải là ngẫu nhiên, đây là vị trí hạ cánh cổ điển nhất của mã hóa rung cảm.

Nhưng nếu việc viết mã cảm xúc rơi vào một công ty lớn, nó sẽ trở thành một điều khó xử về mặt cấu trúc.

Giả sử Microsoft có một kỹ sư với mức lương hàng năm là 300.000 USD. Sau khi Microsoft giao cho anh ấy Mã Claude, sản lượng của anh ấy đã tăng 20% ​​- đây là trạng thái mã hóa cảm xúc lý tưởng nhất. Nhưng đồng thời, chi phí mã thông báo mà anh ấy đốt hàng tháng là 200 đô la, 500 đô la hay 2.000 đô la? Con số này sẽ tăng lên một cách đơn điệu khi anh ấy trở nên phụ thuộc nhiều hơn vào AI.

Điều rắc rối hơn là anh ấy sẽ không bị sa thải chỉ vì “sử dụng AI”—mức lương hàng năm 300.000 nhân dân tệ của anh ấy vẫn còn, phúc lợi vẫn còn, và vị trí công việc của anh ấy vẫn còn đó.

Nói cách khác, Cấu trúc tổng chi phí của Microsoft là "lương nhân viên ban đầu + hóa đơn mã thông báo mới". Công thức này chỉ có một hướng - chi phí tăng vọt.

Và "Sản lượng của nhân viên +20%" là sự phản ánh tài chính của "doanh thu" +20%"? KHÔNG. Đó là "doanh thu vẫn giữ nguyên, nhưng có thêm hóa đơn AI trong cơ cấu chi phí" - bởi vì sản lượng của hầu hết nhân viên không tương ứng trực tiếp với doanh thu mới, chỉ vì anh ta viết nhanh hơn không có nghĩa là công ty bán được nhiều hơn.

Đây thực sự là điều Catanzaro muốn nói khi nói “sức mạnh tính toán đắt hơn nhân viên”. Điều đó không có nghĩa là AI ngu ngốc, mà có nghĩa là khi bạn cài đặt AI cho nhân viên ban đầu, bạn không thể làm cho nó hoạt động được.

Logic này cũng được hỗ trợ bởi dữ liệu.

Gartner cho biết trong một dự đoán gần đây rằng đến năm 2030, chi phí suy luận cho một mô hình lớn với một nghìn tỷ tham số sẽ giảm gần 90% so với năm 2025. Nghe có vẻ như AI ngày càng rẻ hơn, nhưng kết luận thực sự của Gartner là điều này không làm cho tổng hóa đơn AI của doanh nghiệp trở nên rẻ hơn. Giám đốc cấp cao của Gartner, Nhà phân tích Will Sommer đã nói điều gì đó - "CPO không nên nhầm lẫn giữa 'giảm phát mã thông báo cấp hàng hóa' với 'mức đầu vào của khả năng suy luận tiên tiến'".

Dự đoán của Goldman Sachs trực tiếp hơn: đến năm 2030, AI tác nhân sẽ thúc đẩy mức tiêu thụ mã thông báo tăng 24 lần, đạt 120 triệu tỷ mỗi tháng. Giá của một mã thông báo đã giảm 90% và mức tiêu thụ đã tăng 24 lần - kết quả là tổng hóa đơn vẫn tăng.

Huang Jen-Hsun có phiên bản cấp tiến hơn. Cách đây vài tháng, ông đã công khai tuyên bố rằng trong tương lai mỗi nhân viên NVIDIA sẽ có 100 đặc vụ AI làm việc cùng nhau.

Nghe có vẻ hay đấy. Nhưng nếu bạn là giám đốc tài chính, bạn đã nghe thấy điều gì? Đó là lò đốt 100 token đốt cháy 24 giờ một ngày.

Vấn đề không phải là AI quá đắt. Vấn đề nằm ở giả định về việc “giao một phi công phụ AI cho mọi nhân viên”.

Tư thế này có một cái tên khá phổ biến trong giới công nghệ - "chế độ phi công phụ". Giả định cốt lõi của nó là người đó tiếp tục ngồi ở ghế lái và AI đưa ra gợi ý cho bạn ở ghế hành khách. Nó không thay thế bạn, nó chỉ làm cho bạn nhanh hơn.

Giả thuyết này rất nhẹ nhàng theo nghĩa đen - "AI sẽ không lấy đi công việc của bạn, AI sẽ chỉ giúp bạn mà thôi". Nhưng ở cấp độ tài chính, ý nghĩa ngầm của nó là: Tất cả mức lương ban đầu không thay đổi, nhưng có thêm một khoản phí token.

Mã thông báo không phải là một khoản phí cố định mà được tính dựa trên mức tiêu thụ. Càng nhiều nhân viên sử dụng, công ty càng trả nhiều tiền - đây chính xác là cơ cấu chi phí mà các công ty ít muốn thấy nhất: thả nổi, không khai thác và mở rộng nghịch đảo với năng lực sản xuất.

Microsoft có thể chưa nhận ra đầy đủ điều này khi mở Claude Code vào tháng 12 năm 2025. Điều ban đầu họ muốn làm là để nhân viên dùng thử và xem AI có thể cải thiện hiệu quả công việc đến mức nào. Nhưng sau 6 tháng, các nhân viên đã thực sự nghiện sử dụng nó và Claude Code đã quá phổ biến trong Microsoft - kết quả là hóa đơn token cao hơn nhiều so với dự kiến, vượt quá sản lượng mà chính Microsoft có thể thu lại từ sự phổ biến này.

Microsoft đã rút lui. Nhưng thứ đang bị loại bỏ không phải là AI - thứ đang bị loại bỏ là cấu trúc “nhân viên tiếp tục ngồi ở ghế lái và AI ở ghế hành khách”.

Đây là một sai sót về mặt cấu trúc. Nó sẽ không biến mất vì mô hình rẻ hơn và nó sẽ không biến mất vì công nhân có tay nghề cao hơn—nó sẽ trở nênnghiêm trọng hơnkhi công nhân trở nên thành thạo hơn về AI.

03 Đốt token vì bạn không đốt đầu người

Gần như tuần rút lui của Microsoft, Tom Blomfield đã đưa ra một góc nhìn hoàn toàn khác trong buổi nói chuyện hàng loạt của YC. Anh ấy không thảo luận về "cách sử dụng AI" - anh ấy thảo luận về "một công ty trong kỷ nguyên AI sẽ như thế nào."

Blomfield Nhận định rất đơn giản: hầu hết các công ty ngày nay vẫn có cấu trúc kiểu "Quân đoàn La Mã" - thông tin được truyền lên theo cấp độ, mệnh lệnh được phân phối xuống theo cấp độ và con người là cốt lõi của sự phối hợp. Tác dụng của việc cài đặt AI trên công trình này là cung cấp vũ khí nóng cho bộ binh La Mã - họ sẽ sử dụng chúng nhiều hơn nhưng chiến thuật sẽ không thay đổi.

Một công ty có nền tảng AI thực sự phải có vẻ ngoài khác biệt.

Blomfield đã sử dụng một mô tả rất cụ thể: mọi hành động phải tạo ra một sản phẩm có thể ghi và gọi được, khiến mọi thứ đều dễ đọc đối với AI; công ty phải được thiết kế như một "vòng AI tự cải tiến", nơi hệ thống có thể cảm nhận môi trường, đưa ra quyết định, gọi công cụ, nhận phản hồi và tự sửa lỗi.

Chỉ còn hai vai trò dành cho những người trong loại công ty này. Đầu tiên là những người đóng góp cá nhân - tất cả mọi người bất kể bộ phận nào đều là người xây dựng và điều hành, đồng thời mang nguyên mẫu đến các cuộc họp chứ không chỉ là ý tưởng; thứ hai là DRI (người chịu trách nhiệm trực tiếp) - mỗi đầu ra đều có người chịu trách nhiệm rõ ràng, “không thể trốn sau AI”.

Rồi Blomfield đã nói câu nói vàng đó: "Nếu dự luật API của bạn không khiến bạn đau lòng, nghĩa là bạn chưa đủ cháy bỏng."

Nếu câu này xuất hiện trong văn phòng CFO của Microsoft, nó sẽ bị coi là một trò đùa; nhưng trước căn phòng của những người sáng lập startup YC, không ai nghĩ điều đó là điên rồ.

Tại sao?

Diana Hu, một đối tác khác của YC, đã đưa ra câu trả lời tại Startup School vào đầu tháng 5. Cô ấy đã nói điều gì đó - "Thứ được tối đa hóa không phải là số lượng đầu người mà là mức tiêu thụ mã thông báo." Cô cũng có một phiên bản đơn giản hơn: “Một người được trang bị các công cụ AI tương đương với một đội ngũ kỹ sư đông đảo trước đây”.

Lưu ý từ khóa ở đây: “bằng”. Không "tương đương", không "tương tự" - đó là sự thay thế.

Trong đợt xuân YC P26 2026, nhiều công ty đã sử dụng 5 hoặc 6 người để làm những công việc mà trước đây phải mất 20 hoặc 30 người. Tất nhiên, hóa đơn mã thông báo của họ cao, nhưng hóa đơn nhân sự của họ cực kỳ thấp - tổng cộng, họ có lãi.

Một trường hợp cấp tiến hơn là Block. Công ty fintech thuộc sở hữu của Jack Dorsey gần đây đã sa thải 40% lực lượng lao động của mình. Đây không phải là "giảm chi phí và cải thiện hiệu quả" theo nghĩa truyền thống - Block cũng đã tăng cường đầu tư nội bộ vào các công cụ AI. Cấu trúc mới đúng như những gì Diana Hu mô tả: tác nhân IC + DRI + AI.

Đốt token trong bối cảnh YC không phải là một khoản chi tiêu mà là một sự thay thế. Những gì nó thay thế không phải là các chi phí khác ngoài AI mà là tiền lương đầu người. Lý do tại sao các tài khoản có thể được tính toán là vì công ty đã đồng thời loại bỏ những vị trí có thể đốt cháy tiền lương.

Đây là lý do cơ bản tại sao Microsoft và YC nhìn thấy điều giống nhau nhưng lại đưa ra những câu trả lời trái ngược nhau - họ hoàn toàn không đốt cùng một mã thông báo. Mã thông báo của Microsoft dùng để tiếp nhiên liệu cho người lái phụ của nhóm ban đầu và mã thông báo của YC dùng để thay thế người lái xe ban đầu.

04 Tài sản thực đang được định nghĩa lại

Tom Blomfield cũng nói một câu khác hấp dẫn hơn trong cuộc trò chuyện - "Con người rất ngắn ngủi và các tài liệu theo ngữ cảnh rất quan trọng."

Đây là một phán đoán ở cấp độ kế toán.

Bảng cân đối kế toán của một công ty truyền thống được viết như thế nào? Bên trái là tài sản cố định, các khoản phải thu, lợi thế thương mại và tài sản trí tuệ, bên phải là nợ phải trả và vốn chủ sở hữu của cổ đông. Nhân viên không có trong cột tài sản—nhân viên là chi phí. Nhưng trong thâm tâm mọi công ty đều biết rằng nhân viên thực sự là tài sản thực sự của mình: mối quan hệ với khách hàng nằm trong tâm trí của những người bán hàng, trực giác kinh doanh nằm trong tâm trí của những người quản lý sản phẩm và bí quyết kỹ thuật nằm trong tâm trí của các kỹ sư.

Đặc điểm của “tài sản” này là chúng có thể di chuyển. Khi nhân viên rời đi, tài sản cũng biến mất.

Công ty có nguồn gốc AI mà Blomfield mô tả đang làm một việc: trích xuất tất cả những tài sản vốn chỉ tồn tại trong não người này và biến chúng thành "tài sản theo ngữ cảnh" mà AI có thể đọc, gọi được và lặp lại được.

Hình thức cụ thể là gì? Đây là tài liệu yêu cầu chi tiết; nó là một tài liệu quy trình thúc đẩy mọi quyết định, mọi trao đổi email và mọi cuộc thảo luận của Slack; nó là giao diện và API MCP mở; nó là một tạo phẩm được tạo ra bởi mọi công cụ nội bộ - tất cả những thứ này tạo thành lớp tài sản mới, có thể kế thừa của công ty và sẽ không bốc hơi khi nhân viên rời đi.

Trong loại công ty này, con người trở thành những "biến số" - họ có thể nhanh chóng truy cập và rời đi nhanh chóng, bởi vì tài sản cốt lõi của công ty không nằm ở đầu óc con người mà ở tài liệu.

Nguồn hình ảnh: Visual China

Nếu điều này cơ cấu được thiết lập, nó không chỉ có ý nghĩa là một mô hình tổ chức mới - nó có nghĩa là bảng cân đối kế toán của công ty đang được viết lại. Một công ty gốc AI với 6 người và đốt các hóa đơn token đáng kinh ngạc dường như không lành mạnh về mặt tài chính, nhưng tài sản thực của nó có thể dày hơn một công ty truyền thống với 60 người—chỉ là các chuẩn mực kế toán hiện tại chưa học được cách tính loại tài sản này.

Nói cách khác, mã hóa cảm xúc vẫn chưa chết. Nó không thuộc về một công ty truyền thống.

Ngày Microsoft loại bỏ Claude Code không phải là ngày mà nền kinh tế AI thất bại mà là ngày mà quan điểm cài đặt AI vào các tổ chức cũ đã bị chính nó làm sai lệch.

Và trong phòng của các công ty khởi nghiệp YC, một thái độ khác đang gia tăng - họ nhỏ bé, họ đốt cháy, họ không có "việc sử dụng AI của nhân viên" trong bảng KPI, và các CFO của họ sẽ không hoảng sợ vì hóa đơn token tăng vọt - bởi vì thứ họ đốt không phải là "nhân viên đồng nghiệp" mà là "nhân viên thay thế".

Trong vài năm tới, tất cả các công ty cỡ trung bình vẫn đang yêu cầu nhân viên của họ "sử dụng nhiều AI hơn" sẽ gặp phải bức tường tương tự mà Microsoft đã vấp phải - dự luật mã thông báo đang gia tăng về mặt cấu trúc.

Nhưng lý do thực sự khiến mọi người thất vọng không phải vì AI quá đắt - mà là tổ chức không thay đổi.

Và đại đa số các công ty có thể sẽ không thay đổi nó trong một thời gian.

Liên kết gốc
QQlink

暗号バックドアなし、妥協なし。ブロックチェーン技術に基づいた分散型ソーシャルおよび金融プラットフォームで、プライバシーと自由をユーザーの手に取り戻します。

© 2024 QQlink 研究開発チーム. 無断転載を禁じます。