Litecoin

500.000 dòng rò rỉ mã của Claude Code đã được giải quyết hoàn toàn. Cốt lõi thực sự của AI Agent là gì?

2026/04/01 12:58
🌐vi

Code trực tiếp chịu trách nhiệm gọi giao diện của mô hình AI chỉ chiếm 1,6% tổng số

500.000 dòng rò rỉ mã của Claude Code đã được giải quyết hoàn toàn. Cốt lõi thực sự của AI Agent là gì?

512.000 dòng mã, 1906 tệp, bản đồ nguồn 59,8 MB. Sáng sớm ngày 31 tháng 3, Chaofan Shou của Solayer Labs đã phát hiện ra rằng sản phẩm chủ lực của Anthropic, Claude Code, đã để lộ mã nguồn hoàn chỉnh của nó trong kho lưu trữ công khai npm. Trong vòng vài giờ, mã đã được sao chép tới GitHub và số lượng nhánh đã vượt quá 41.000.

Đây không phải là lần đầu tiên Anthropic mắc sai lầm này. Vụ rò rỉ bản đồ nguồn tương tự xảy ra một lần vào tháng 2 năm 2025 khi Claude Code được phát hành lần đầu tiên. Lần này số phiên bản là v2.1.88. Lý do rò rỉ là như nhau. Công cụ xây dựng Bun tạo bản đồ nguồn theo mặc định và tệp này bị thiếu trong .npmignore.

Hầu hết các báo cáo đều đưa trứng Phục sinh vào các rò rỉ hàng tồn kho, chẳng hạn như hệ thống thú cưng ảo và "chế độ bí mật" cho phép Claude gửi mã ẩn danh cho các dự án nguồn mở. Nhưng câu hỏi thực sự đáng được giải đáp là tại sao hiệu suất của cùng một mô hình Claude lại khác nhau ở phiên bản web và Claude Code? Chính xác thì 512.000 dòng mã đang làm gì?

Mô hình chỉ là phần nổi của tảng băng chìm

Câu trả lời ẩn trong cấu trúc mã. Theo phân tích ngược mã nguồn bị rò rỉ của cộng đồng GitHub, trong số 512.000 dòng TypeScript, chỉ có khoảng 8.000 dòng mã giao diện chịu trách nhiệm trực tiếp gọi mô hình AI, chiếm 1,6% tổng số.

98,4% còn lại đang làm gì? Hai mô-đun lớn nhất là công cụ truy vấn (46.000 hàng) và hệ thống công cụ (29.000 hàng). Công cụ truy vấn xử lý các lệnh gọi API LLM, đầu ra phát trực tuyến, điều phối bộ đệm và quản lý hội thoại nhiều vòng. Hệ thống công cụ xác định khoảng 40 công cụ tích hợp và 50 lệnh gạch chéo, tạo thành kiến ​​trúc giống như plug-in và mỗi công cụ có quyền kiểm soát quyền độc lập.

Ngoài ra, còn có 25.000 dòng mã hiển thị giao diện người dùng đầu cuối (một tệp có tên print.ts dài 5594 dòng và một hàm duy nhất trải dài 3167 dòng), 20.000 dòng kiểm soát quyền và bảo mật (bao gồm 23 kiểm tra bảo mật Bash được đánh số và 18 lệnh tích hợp Zsh bị chặn) và 18.000 dòng của hệ thống điều phối đa tác nhân.

Sau khi phân tích mã bị rò rỉ, nhà nghiên cứu máy học Sebastian Raschka đã chỉ ra rằng lý do tại sao Claude Code tốt hơn phiên bản web của cùng một mô hình không phải là do bản thân mô hình đó mà là do giàn giáo phần mềm được xây dựng xung quanh mô hình, bao gồm tải ngữ cảnh kho, lập lịch công cụ đặc biệt, chiến lược bộ nhớ đệm và cộng tác giữa các tác nhân phụ. Ông thậm chí còn tin rằng nếu kiến ​​trúc kỹ thuật tương tự được áp dụng cho các mô hình khác như DeepSeek hay Kimi, thì có thể đạt được những cải tiến hiệu suất lập trình tương tự.

Một so sánh trực quan có thể giúp hiểu được khoảng cách này. Bạn nhập câu hỏi vào phiên bản web ChatGPT hoặc Claude và mô hình sẽ trả lời câu trả lời sau khi xử lý, không để lại gì khi cuộc trò chuyện kết thúc. Nhưng cách tiếp cận của Claude Code lại hoàn toàn khác. Khi khởi động, trước tiên nó sẽ đọc các tệp dự án của bạn, hiểu cấu trúc cơ sở mã của bạn và ghi nhớ tùy chọn của bạn lần trước "Đừng thử nghiệm cơ sở dữ liệu trong các thử nghiệm". Nó có thể thực thi các lệnh, chỉnh sửa tệp và chạy thử nghiệm trực tiếp trong thiết bị đầu cuối của bạn. Khi gặp các tác vụ phức tạp sẽ được chia thành nhiều tác vụ con và giao cho các tác nhân con khác nhau để xử lý song song. Nói cách khác, phiên bản web của AI là cửa sổ hỏi đáp và Claude Code là cộng tác viên sống trong máy tính của bạn.

Một số người so sánh kiến ​​trúc này với một hệ điều hành: 42 công cụ tích hợp tương đương với các lệnh gọi hệ thống, hệ thống cấp phép tương đương với việc quản lý người dùng, giao thức MCP tương đương với trình điều khiển thiết bị và việc điều phối tác nhân phụ tương đương với việc lập lịch trình quy trình. Theo mặc định, mọi công cụ đều được đánh dấu là "không an toàn, có thể ghi" khi xuất xưởng, trừ khi nhà phát triển chủ động tuyên bố rằng nó an toàn. Các công cụ chỉnh sửa tệp sẽ buộc bạn phải kiểm tra xem bạn đã đọc tệp trước chưa và sẽ không cho phép bạn thay đổi nếu chưa. Đây không phải là một chatbot với một số công cụ plug-in mà là môi trường hoạt động với LLM làm cốt lõi và cơ chế bảo mật hoàn chỉnh.

Điều này có nghĩa là: các rào cản cạnh tranh đối với các sản phẩm AI có thể không ở cấp độ mô hình mà ở cấp độ kỹ thuật.

Mỗi lần bộ đệm bị hỏng, chi phí sẽ tăng gấp 10 lần

Có một tệp có tên là nhắcCacheBreakDetection.ts trong mã bị rò rỉ, theo dõi 14 vectơ có thể gây ra lỗi bộ nhớ đệm nhắc nhở. Tại sao các kỹ sư của Anthropic lại tốn nhiều công sức như vậy để ngăn chặn tình trạng nổ tung bộ nhớ đệm?

Chỉ cần nhìn vào giá chính thức của Anthropic và bạn sẽ hiểu. Lấy Claude Opus 4.6 làm ví dụ, giá đầu vào tiêu chuẩn là 5 USD trên một triệu token, nhưng nếu bộ đệm bị tấn công, giá đọc chỉ là 0,5 USD, rẻ hơn 90%. Mặt khác, mỗi sự cố bộ đệm sẽ làm tăng chi phí suy luận lên gấp 10 lần.

Điều này giải thích một số lượng lớn các quyết định kiến trúc dường như "được thiết kế quá mức" trong mã bị rò rỉ. Khi Mã Claude khởi động, nó sẽ tải nhánh git hiện tại, bản ghi cam kết mới nhất và tệp CLAUDE.md làm ngữ cảnh. Các nội dung tĩnh này được lưu vào bộ nhớ đệm chung và nội dung động được phân tách bằng các điểm đánh dấu ranh giới để đảm bảo rằng mỗi cuộc hội thoại không xử lý lặp đi lặp lại ngữ cảnh hiện có. Ngoài ra còn có một cơ chế gọi là chốt dính trong mã để ngăn việc chuyển chế độ phá hủy bộ đệm đã thiết lập. Tác nhân con được thiết kế để sử dụng lại bộ đệm của tiến trình cha thay vì thiết lập lại cửa sổ ngữ cảnh của chính nó.

Đây là một chi tiết đáng để mở rộng. Ai đã từng sử dụng các công cụ lập trình AI đều biết rằng cuộc trò chuyện càng dài thì phản hồi của AI sẽ càng chậm, vì mỗi vòng hội thoại đều phải gửi lại lịch sử trước đó cho mô hình. Cách làm thông thường là xóa các tin nhắn cũ để giải phóng dung lượng, nhưng vấn đề là việc xóa bất kỳ một tin nhắn nào cũng sẽ phá vỡ tính liên tục của bộ đệm, khiến toàn bộ lịch sử hội thoại bị xử lý lại, đồng thời độ trễ và chi phí sẽ tăng vọt.

Có một cơ chế gọi là cache_edits trong mã bị rò rỉ. Phương pháp này thực sự không phải là xóa tin nhắn mà là đánh dấu tin nhắn cũ là "bỏ qua" ở lớp API. Mô hình không còn nhìn thấy những thông báo này nữa nhưng tính liên tục của bộ nhớ đệm không bị hủy. Điều này có nghĩa là đối với một cuộc trò chuyện dài kéo dài vài giờ, sau khi xóa hàng trăm tin nhắn cũ, vòng phản hồi tiếp theo gần như nhanh bằng vòng đầu tiên. Đối với người dùng bình thường, đây là câu trả lời cơ bản cho "Tại sao Claude Code có thể hỗ trợ các cuộc trò chuyện dài vô tận mà không bị chậm lại?"

Theo dữ liệu giám sát nội bộ bị rò rỉ (nhận xét mã từ autoCompact.ts, ngày 10 tháng 3 năm 2026), trước khi giới hạn lỗi nén tự động được đưa ra, Claude Code đã lãng phí khoảng 250.000 lệnh gọi API mỗi ngày. Có 1.279 phiên người dùng gặp hơn 50 lỗi nén liên tiếp và phiên nghiêm trọng nhất bị lỗi 3.272 lần liên tiếp. Cách khắc phục chỉ là thêm một dòng hạn chế: MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES = 3.

Vì vậy, đối với các sản phẩm AI, chi phí suy luận mô hình có thể không phải là lớp đắt nhất mà là lỗi quản lý bộ đệm.

44 switch, hướng về cùng một hướng

Có 44 feature flag ẩn trong mã bị rò rỉ - các switch chức năng đã được biên dịch nhưng chưa được tung ra thế giới bên ngoài. Theo phân tích của cộng đồng, những lá cờ này được chia thành 5 loại theo khu vực chức năng, trong đó dày đặc nhất là loại “tác nhân tự trị” (12), trỏ đến một hệ thống có tên KAIROS.

KAIROS được tham chiếu hơn 150 lần trong mã nguồn. Đây là chế độ daemon nền thường trú. Claude Code không còn chỉ là một công cụ phản hồi khi bạn chủ động gọi nó mà là một tác nhân luôn chạy ở chế độ nền, liên tục quan sát, ghi lại và thực hiện các hành động chủ động vào đúng thời điểm. Miễn là người dùng không bị gián đoạn, mọi thao tác có thể chặn người dùng trong hơn 15 giây sẽ bị trì hoãn.

KAIROS cũng được tích hợp sẵn tính năng nhận biết tiêu điểm của thiết bị đầu cuối. Có một trường terminalFocus trong mã để phát hiện xem người dùng có đang nhìn vào cửa sổ terminal trong thời gian thực hay không. Khi bạn chuyển sang trình duyệt hoặc ứng dụng khác, nhân viên xác định bạn "vắng mặt" và sẽ chuyển sang chế độ tự động, chủ động thực hiện các tác vụ và gửi mã trực tiếp mà không cần chờ bạn xác nhận. Khi bạn quay lại thiết bị đầu cuối, nhân viên sẽ ngay lập tức quay lại chế độ cộng tác: đầu tiên báo cáo những gì họ vừa làm, sau đó hỏi ý kiến ​​​​của bạn. Mức độ tự chủ không cố định mà dao động theo thời gian thực tùy theo sự chú ý của bạn. Điều này giải quyết vấn đề đáng xấu hổ bấy lâu nay với các công cụ AI: AI hoàn toàn tự chủ khiến con người không thoải mái, còn AI hoàn toàn thụ động thì quá kém hiệu quả. Lựa chọn của KAIROS là để cho sáng kiến ​​của AI tự động điều chỉnh theo sự chú ý của người dùng. Nó sẽ thành thật khi bạn nhìn chằm chằm vào nó và nó sẽ tự hoạt động khi bạn bước đi.

Một hệ thống con khác của KAIROS được gọi là autoDream. Cứ sau năm phiên tích lũy hoặc cứ sau 24 giờ, tác nhân sẽ bắt đầu một quy trình "phản ánh" ở chế độ nền, được chia thành bốn bước. Trước tiên, hãy quét những ký ức hiện có của bạn để hiểu những gì bạn hiện có. Sau đó trích xuất kiến ​​thức mới từ nhật ký hội thoại. Sau đó thống nhất kiến ​​thức cũ và mới, sửa chữa những mâu thuẫn, loại bỏ những trùng lặp. Cuối cùng, chỉ mục được sắp xếp hợp lý và các mục lỗi thời sẽ bị xóa. Thiết kế dựa trên lý thuyết củng cố trí nhớ từ khoa học nhận thức. Mọi người sắp xếp những kỷ niệm trong ngày khi họ ngủ và KAIROS sắp xếp bối cảnh dự án khi người dùng đi vắng. Đối với người dùng bình thường, điều này có nghĩa là bạn sử dụng Mã Claude càng lâu thì sự hiểu biết về dự án của bạn càng chính xác hơn thay vì chỉ "nhớ những gì bạn nói".

Danh mục lớn thứ hai là "Khử chưng cất và bảo mật" (8 cờ). Đáng chú ý nhất trong số đó là cơ chế fake_tools. Khi bốn điều kiện được đáp ứng cùng lúc (cờ thời gian biên dịch được bật, mục nhập CLI được kích hoạt, API của bên thứ nhất được sử dụng và công tắc từ xa của GrowthBook là đúng), Claude Code sẽ đưa các định nghĩa công cụ giả mạo vào yêu cầu API với mục đích làm ô nhiễm tập dữ liệu có thể đang ghi lại lưu lượng API và được sử dụng để đào tạo các mô hình sản phẩm cạnh tranh. Đây là hình thức phòng thủ mới trong cuộc chạy đua vũ trang AI. Nó không ngăn bạn sao chép nhưng cho phép bạn sao chép những thứ sai.

Ngoài ra, mã mô hình Capybara cũng xuất hiện trong mã (được chia thành ba cấp độ: phiên bản tiêu chuẩn, phiên bản nhanh và phiên bản triệu cửa sổ ngữ cảnh), được cộng đồng đồn đoán rộng rãi là tên mã nội bộ của dòng Claude 5.

Easter egg: Có một con thú cưng điện tử ẩn trong 512.000 dòng mã

Giữa tất cả các kiến ​​trúc kỹ thuật nghiêm túc và cơ chế an toàn, các kỹ sư của Anthropic cũng âm thầm xây dựng một hệ thống thú cưng ảo hoàn chỉnh, có tên mã nội bộ là BUDDY.

Theo mã bị rò rỉ và phân tích cộng đồng, BUDDY là một thú cưng đầu cuối có hình dạng đa dạng sẽ xuất hiện bên cạnh hộp nhập liệu của người dùng dưới dạng hộp bong bóng ASCII. Nó có 18 loài (bao gồm capybaras, kỳ nhông, nấm, ma, rồng và một loạt các sinh vật nguyên bản như Pebblecrab, Dustbunny, Mossfrog) được chia thành 5 cấp độ hiếm: Phổ biến (60%), Không phổ biến (25%), Hiếm (10%), Sử thi (4%) và Huyền thoại (1%). Mỗi loài cũng có "biến thể sáng bóng", trong đó Nebulynx huyền thoại sáng bóng hiếm nhất chỉ có 1 trên 10.000 cơ hội xuất hiện.

Mỗi BUDDY có năm thuộc tính: DEBUGGING (gỡ lỗi), KIÊN NHẪN (kiên nhẫn), CHAOS (hỗn loạn), WISDOM (khôn ngoan) và SNARK (lưỡi độc). Họ cũng có thể đội mũ, với các lựa chọn bao gồm vương miện, mũ chóp, mũ cánh quạt, quầng sáng, mũ phù thủy và thậm chí cả một con vịt nhỏ. Hàm băm của ID người dùng xác định thú cưng nào bạn ấp và Claude tạo tên và tính cách cho nó.

Theo kế hoạch ra mắt bị rò rỉ, BUDDY ban đầu dự kiến ​​bắt đầu thử nghiệm nội bộ từ ngày 1 đến ngày 7 tháng 4 và ra mắt chính thức vào tháng 5, bắt đầu với nhân viên nội bộ của Anthropic.

512.000 dòng mã, 98,4% trong số đó là kỹ thuật cốt lõi, nhưng cuối cùng ai đó đã dành thời gian để tạo ra một con kỳ nhông điện tử đội mũ cánh quạt. Đây có lẽ là dòng mã thân thiện với người dùng nhất trong vụ rò rỉ.

QQlink

暗号バックドアなし、妥協なし。ブロックチェーン技術に基づいた分散型ソーシャルおよび金融プラットフォームで、プライバシーと自由をユーザーの手に取り戻します。

© 2024 QQlink 研究開発チーム. 無断転載を禁じます。