Trong thời đại AI, sự suy diễn cuối cùng của cuộc chiến cung cầu Token

Tiêu đề video: Cung và cầu Token AI | Phỏng vấn Dylan Patel

Tác giả video: Invest Like The Best

Biên soạn bởi: Peggy, BlockBeats

Lưu ý của người biên tập: Trong bối cảnh có bước nhảy vọt liên tục về khả năng của mô hình AI và sự tích hợp quy mô lớn các công cụ như Claude Code và Cursor của các doanh nghiệp, các cuộc thảo luận trong ngành đang chuyển từ "mức độ mạnh mẽ của mô hình" sang "mô hình này đi vào sản xuất như thế nào". Nhưng khi lập trình AI, phân tích tự động và mô hình hóa dữ liệu dần trở thành sự đồng thuận mới, một câu hỏi cấp độ thấp hơn bắt đầu xuất hiện: Khi chi phí thực hiện giảm nhanh chóng, điều thực sự khan hiếm là nhân lực, vốn hay quyền sử dụng các mô hình và token tiên tiến?

Bên trái là người dẫn chương trình Patrick O'Shaughnessy, bên phải là Dylan Patel

Bài viết này được biên soạn từ cuộc trò chuyện giữa Patrick O'Shaughnessy và Dylan Patel, người sáng lập SemiAnalysis. Dylan từ lâu đã quan tâm đến cơ sở hạ tầng AI, chuỗi cung ứng chất bán dẫn và kinh tế mô hình. Trong cuộc trò chuyện này, anh ấy bắt đầu từ khoản chi tiêu tăng vọt của công ty Claude Code và thảo luận về cách AI thay đổi tổ chức doanh nghiệp, dịch vụ thông tin, nhu cầu mã thông báo, chuỗi cung ứng điện toán và tâm lý xã hội.

Điều đáng chú ý nhất trong cuộc trò chuyện này không phải là một mô hình nhất định làm mới lại điểm chuẩn mà nó cung cấp một cách để hiểu về nền kinh tế AI - xem AI như một hệ thống sản xuất đang phân phối lại khả năng thực thi, hiệu quả tổ chức và lợi nhuận công nghiệp, thay vì chỉ nâng cấp công cụ phần mềm.

Cuộc trò chuyện này có thể được hiểu từ năm góc độ.

Trước hết là chi phí thực hiện bị phá vỡ. Ngày xưa ý tưởng không hề khan hiếm. Điều thực sự khó khăn là biến ý tưởng thành sản phẩm, hệ thống và dịch vụ có thể cung cấp được. Giờ đây, Claude Code cho phép những người không rành về kỹ thuật viết mã, xây dựng ứng dụng và phân tích dữ liệu. Công việc ban đầu cần một nhóm duy trì trong thời gian dài giờ đây đã được một số ít người hoàn thành với sự trợ giúp của các mô hình. Chi tiêu hàng năm của Claude Code của SemiAnalysis đã đạt 7 triệu USD, hơn 1/4 chi tiêu tiền lương. Điều này cho thấy AI không còn chỉ là công cụ nâng cao hiệu quả mà đang trở thành nguồn vốn sản xuất mới cho doanh nghiệp.

Thứ hai, ngành dịch vụ thông tin là ngành đầu tiên được viết lại. Dylan hoạt động trong lĩnh vực kinh doanh chủ yếu bán các bộ phân tích, tư vấn và dữ liệu, những lĩnh vực dễ bị biến đổi thành hàng hóa của AI nhất. Trước đây, phân tích ngược chip, lập mô hình lưới năng lượng và xây dựng chỉ báo kinh tế vĩ mô có thể yêu cầu một nhóm đầu tư dài hạn, nhưng giờ đây một số ít người có thể tạo ra các sản phẩm có thể sử dụng được trong vòng vài tuần. Điều này có nghĩa là áp lực của AI đối với các công ty dịch vụ thông tin không phải là “liệu nó có thay thế được con người hay không” mà là “ai có thể làm lại sản phẩm của các đối thủ nhanh hơn”. Các công ty không áp dụng AI sẽ bị các công ty nhanh hơn trở thành hàng hóa và các công ty áp dụng AI phải tiếp tục nâng cao tiêu chuẩn của mình để tránh bị thay thế bởi các đối thủ cạnh tranh hiệu quả hơn tiếp theo.

Ở mức độ sâu hơn, mã thông báo đang trở thành phương tiện sản xuất mới. Trước đây, khi doanh nghiệp mua đăng ký phần mềm, vấn đề cốt lõi là công cụ này có dễ sử dụng hay không; giờ đây, quyền truy cập, giới hạn tỷ lệ, hợp đồng doanh nghiệp và ngân sách mã thông báo của các mô hình tiên tiến bắt đầu quyết định trực tiếp năng lực sản xuất. Các mô hình mạnh hơn không nhất thiết có nghĩa là chi phí cao hơn vì các mã thông báo thông minh hơn có thể hoàn thành các nhiệm vụ có giá trị cao hơn với ít bước hơn. Sự cạnh tranh thực sự đang chuyển từ “ai sử dụng AI” sang “ai có thể có được mô hình mạnh nhất và sử dụng các mã thông báo đắt nhất trong các tình huống có giá trị cao nhất”.

Nhu cầu này sẽ tiếp tục được truyền tải đến toàn bộ chuỗi cung ứng. Việc sử dụng token tăng vọt cuối cùng sẽ trở thành áp lực liên tục lên GPU, CPU, bộ nhớ, FPGA, PCB, lá đồng, thiết bị bán dẫn và chi phí vốn cho nhà máy. “Hiệu ứng bullwhip” được đề cập trong bài viết chính xác là logic này: hạ nguồn tưởng chừng chỉ là sự gia tăng nhu cầu về các cuộc gọi mô hình, nhưng khi đến thượng nguồn, nó có thể biến thành đơn đặt hàng, mở rộng sản xuất và tăng giá gấp nhiều lần. Vì vậy, việc phân phối lợi nhuận của ngành AI sẽ không dừng lại ở các công ty mô hình và NVIDIA mà sẽ tiếp tục lan rộng khắp chuỗi cung ứng chất bán dẫn và trung tâm dữ liệu.

Cuối cùng, phản ứng dữ dội của xã hội đối với AI có thể đến sớm hơn. Khi AI thực sự đi vào quy trình làm việc, mối lo ngại của công chúng về việc thay thế công việc, tiêu thụ năng lượng, mở rộng trung tâm dữ liệu và tập trung quyền lực cũng sẽ đồng thời tăng lên. Dylan thậm chí còn dự đoán rằng có thể sẽ có những cuộc biểu tình rầm rộ chống lại AI trong vòng ba tháng. Đối với các công ty kiểu mẫu, việc tiếp tục nhấn mạnh rằng "AI sẽ thay đổi thế giới" có thể không làm giảm bớt lo lắng mà thay vào đó có thể củng cố trí tưởng tượng của người bình thường về cảm giác mất kiểm soát. Điều mà ngành công nghiệp AI cần chứng minh tiếp theo không chỉ là khả năng kỹ thuật mà còn là cách nó có thể tạo ra giá trị công cụ thể và dễ nhận biết ngày nay.

Ngày nay, câu hỏi cốt lõi của AI đang chuyển từ "mô hình có thể làm gì" sang "ai có thể lấy mô hình, cách sử dụng mô hình và ai có thể nắm bắt được giá trị do mô hình tạo ra". Theo nghĩa này, đối tượng của bài viết này không chỉ là Claude Code, Anthropic hay một công ty AI nào đó, mà là sự sắp xếp lại cấu trúc xung quanh năng suất, chi tiêu vốn, hiệu quả tổ chức và sự chấp nhận của xã hội.

Sau đây là nội dung gốc (nội dung gốc đã được chỉnh sửa để dễ đọc và dễ hiểu):

TL; DR

·Biến số cốt lõi của AI đang chuyển từ "có thể làm được" sang "có đáng làm không". Sau khi chi phí thực hiện giảm mạnh, điều thực sự khan hiếm là những ý tưởng có giá trị cao có thể được khuếch đại bằng mô hình.

·Chi phí Claude Code chiếm 25% chi phí tiền lương. Đây chỉ là sự khởi đầu. AI đang thay đổi từ một công cụ phần mềm thành một nguồn vốn sản xuất mới cho doanh nghiệp.

·Sự cạnh tranh trong các mô hình tiên tiến không còn chỉ là cạnh tranh về năng lực mà là cạnh tranh về quyền mua lại token; ai có được mô hình mạnh nhất sớm hơn và ổn định hơn có thể hình thành những rào cản kinh doanh mới.

·Ngành dịch vụ thông tin sẽ là ngành đầu tiên được định hình lại bởi AI, vì chi phí sản xuất dữ liệu, phân tích và nghiên cứu đang giảm nhanh chóng và các công ty chậm chạp sẽ được các công ty nhanh hơn biến thành hàng hóa.

·Nhu cầu mã thông báo sẽ không chậm lại do các mô hình cũ giảm giá, bởi vì mỗi khi một mô hình trở nên mạnh hơn, nó sẽ tung ra các trường hợp sử dụng mới có giá trị cao và đẩy người dùng đến các mô hình tiên tiến đắt tiền hơn.

·Sự thay đổi lớn nhất mà AI mang lại không phải là khiến con người làm việc ít hơn mà là cho phép một số ít người hoàn thành sản lượng gấp nhiều lần trong cùng một thời gian; những người không thể tạo và nắm bắt giá trị mã thông báo sẽ bị khóa ở "lớp dưới cùng vĩnh viễn".

·Tình trạng thiếu sức mạnh tính toán đang lan rộng ra toàn bộ chuỗi cung ứng chất bán dẫn. Từ GPU, CPU, bộ nhớ đến PCB, lá đồng và nhà sản xuất thiết bị, nhu cầu về AI đã trở thành lực đẩy giá cho toàn bộ chuỗi ngành.

·Giá trị kinh tế của AI khó có thể nắm bắt được bằng GDP truyền thống. Câu hỏi thực sự không chỉ là công ty kiểu mẫu kiếm được bao nhiêu tiền mà còn là "GDP ma" được tạo ra bao nhiêu từ quá trình ra quyết định, hiệu quả và hiệu ứng dây chuyền của việc tạo mã thông báo.

Văn bản gốc của cuộc phỏng vấn:

Claude Code đã trở thành lực lượng lao động mới

Patrick O'Shaughnessy (người điều hành):

Trước đây, bạn đã kể cho tôi một câu chuyện tuyệt vời về những thay đổi lớn trong việc sử dụng mã thông báo trong nhóm của bạn năm nay. Bạn có thể nói lại được không? Điều gì khiến bạn hiểu về những gì đang diễn ra trên thế giới?

Dylan Patel (Người sáng lập SemiAnalysis):

Năm ngoái, chúng tôi nghĩ rằng chúng tôi đã là những người sử dụng AI nhiều. Mọi người đều sử dụng ChatGPT, mọi người đều sử dụng Claude và tôi cung cấp cho nhóm bất kỳ gói đăng ký nào họ muốn. Vào thời điểm đó, chi phí của công ty trong lĩnh vực này có lẽ lên tới hàng chục nghìn USD.

Nhưng năm nay, chi tiêu bắt đầu tăng vọt. Điểm khởi đầu thực sự có lẽ là vào cuối tháng 12 năm ngoái, với sự xuất hiện của Opus. Trong đó có Doug, chủ tịch của chúng tôi, Douglas Lawler. Về cơ bản, anh ấy đang dẫn đầu nhiệm vụ thu hút những người không rành về kỹ thuật viết mã trong AI. Có thể nói ông đã đưa cả công ty vào đó từng chút một. Tất nhiên, các kỹ sư đã sử dụng nó từ lâu, nhưng bắt đầu từ tháng 1 năm nay, chi phí của chúng tôi rõ ràng đã tăng lên và sau đó bùng nổ nhanh chóng.

Sau đó chúng tôi đã ký hợp đồng doanh nghiệp với Anthropic. Lần cuối cùng tôi nói chuyện với bạn, chi phí hàng năm của chúng tôi là khoảng 5 triệu đô la; bây giờ họ ở mức 7 triệu đô la.

Patrick O'Shaughnessy:

Và đó là con số của tuần trước.

Dylan Patel:

Đúng vậy, một phần lớn là do cách sử dụng. Điều thực sự thú vị là những người chưa từng viết mã trước đây hiện đang sử dụng Claude Code và một số người đang chi hàng nghìn đô la mỗi ngày. Nhưng nhìn vào toàn bộ công ty, hiện nay chúng tôi chi 7 triệu đô la mỗi năm cho Claude Code và chi phí tiền lương của chúng tôi là khoảng 25 triệu đô la. Nói cách khác, chi phí của Claude Code đã vượt quá 25% chi phí tiền lương.

Nếu xu hướng này tiếp tục, nó thậm chí có thể vượt quá 100% biên chế vào cuối năm nay. Đó là một chút đáng sợ. May mắn thay, bây giờ tôi không phải lựa chọn giữa “con người” và “AI” vì công ty đang phát triển quá nhanh. Giống như: Tôi không cần thuê người nhanh, nhưng tôi có thể chi nhiều tiền hơn cho AI và nó thực sự hoạt động và công ty có thể phát triển nhanh hơn.

Nhưng tôi nghĩ sớm hay muộn các công ty khác cũng sẽ phải đối mặt với vấn đề này: Nếu một người có thể hoàn thành công việc của 5, 10 hoặc thậm chí 15 người bằng cách sử dụng Claude Code thì điều gì tiếp theo? Đầu tiên, có thể đúng là mọi người nên bị sa thải; thứ hai, những kịch bản sử dụng này hiện đang rất phổ biến.

Ví dụ: chúng tôi có một phòng thí nghiệm kỹ thuật đảo ngược ở Oregon đã được xây dựng được một năm rưỡi. Bên trong có rất nhiều thiết bị cao cấp như kính hiển vi và kính hiển vi điện tử quét. Mục đích cốt lõi của phòng thí nghiệm này là thiết kế ngược các chip, trích xuất kiến trúc chip và phân tích các vật liệu được sử dụng trong quá trình sản xuất. Đây cũng là một trong những dữ liệu chúng tôi bán.

Nhưng việc phân tích loại dữ liệu này trước đây là một quá trình rất chậm. Bây giờ, có một người trong nhóm của chúng tôi đã xây dựng một ứng dụng chỉ với vài nghìn đô la token Claude. Ứng dụng này có thể được tăng tốc GPU và chạy trên máy chủ mà chúng tôi đặt trên CoreWeave. Chúng tôi chỉ cần gửi cho nó một hình ảnh của con chip và nó có thể tự động đánh dấu vị trí của từng vật liệu trên hình ảnh: đồng ở đây, tantalum ở đây, germanium ở đây, coban ở đây. Sau đó, bạn có thể thực hiện phân tích phần tử hữu hạn của toàn bộ khối chip rất nhanh chóng và trực quan với giao diện đồ họa và bảng điều khiển hoàn chỉnh.

Người này từng làm việc tại Intel và anh ấy nói rằng trước đây, đây là công việc mà cả nhóm sẽ làm và duy trì. Nhìn vào những điều tương tự bây giờ trong toàn bộ công ty, thật không thể tin được.

Một ví dụ khác mà tôi thấy đặc biệt thú vị là Malcolm. Ông từng là chuyên gia kinh tế tại một ngân hàng lớn. Có lẽ có khoảng 100 đến 200 người trong bộ phận kinh tế của ngân hàng đó. Những gì anh ấy đang làm bây giờ thật tuyệt vời.

Anh ấy lấy tất cả các loại dữ liệu, bao gồm dữ liệu FRED, báo cáo việc làm và các bộ dữ liệu khác từ các API khác nhau. Chúng tôi cũng đã ký hợp đồng với một số nhà cung cấp dữ liệu và có quyền truy cập API. Sau đó, anh ấy lấy tất cả dữ liệu và bắt đầu chạy hồi quy để phân tích tác động lạm phát hoặc giảm phát của những thay đổi kinh tế khác nhau đối với nền kinh tế.

Cục Thống kê Lao động Hoa Kỳ có một bộ phân loại nhiệm vụ hoàn chỉnh, khoảng 2.000 nhiệm vụ. Malcolm sử dụng AI để đánh giá nhiệm vụ nào hiện có thể được AI hoàn thành và nhiệm vụ nào không thể, đồng thời chấm điểm chúng theo một bộ tiêu chí đánh giá. Kết quả cho thấy khoảng 3% nhiệm vụ hiện có thể được hoàn thành bằng AI.

Vì vậy, anh ấy đã tạo ra một chỉ báo để đo lường những việc mà AI có thể làm được và mức độ tác động giảm phát của nó khi những việc này được AI thực hiện. Sản lượng có thể tăng, nhưng do chi phí giảm quá nhiều nên về mặt lý thuyết, GDP có thể giảm. Ông gọi đây là "GDP ảo".

Anh ấy đã thực hiện một bộ phân tích hoàn chỉnh dựa trên khái niệm này và cũng thiết lập một tiêu chuẩn mô hình ngôn ngữ mới, bao gồm khoảng 2000 đánh giá.

Patrick O'Shaughnessy:

Anh ấy làm tất cả những việc này một mình à?

Dylan Patel:

Đúng vậy, anh ấy đã tự mình làm tất cả. Anh ấy nói với tôi, "Trời ạ, việc này từng phải cần đến một đội gồm 200 nhà kinh tế học mỗi năm mới làm được." Bây giờ anh ấy đã hoàn toàn đắm chìm trong Claude và nói rằng mọi thứ đã thay đổi.

Patrick O'Shaughnessy:

Là người điều hành doanh nghiệp, bạn hiểu vấn đề này như thế nào? Bạn đã từ chỗ có khoản chi phí này gần như không có gì cho đến bây giờ nó chiếm gần 25% chi phí tiền lương và nó tiếp tục tăng. Bạn nghĩ ở thời điểm nào: Đợi đã, mình có nên đạp phanh không? Đã đến lúc phải kiểm soát chi tiêu? Có lẽ chúng ta không cần phải luôn gắn bó với mẫu máy tiên tiến vừa được ra mắt ngày hôm nay, như Opus 4.7, mà thay vào đó hãy chuyển sang thứ gì đó rẻ hơn một chút?

Dylan Patel:

Cuối cùng thì tôi làm trong ngành kinh doanh thông tin. Chúng tôi bán phân tích, tư vấn và tạo bộ dữ liệu. Tôi không thấy có lý do gì để nghĩ rằng những thứ này sẽ không trở thành hàng hóa hoàn toàn với tốc độ khá nhanh.

Nếu tôi không tiếp tục cải thiện, sản phẩm dữ liệu đầu tiên tôi bán giờ đây sẽ có nhiều người bắt đầu làm những việc tương tự hơn. Lý do tại sao chúng tôi vẫn có thể bán nó là vì chúng tôi tiếp tục làm cho nó tốt hơn và chi tiết hơn. Nhưng cách chúng tôi làm điều này vào năm 2023 thực sự không khác lắm so với cách những người khác đang làm hiện nay. Nếu tôi không tiếp tục nâng cao tiêu chuẩn, tôi sẽ bị biến thành hàng hóa. Nếu tôi không di chuyển đủ nhanh, tôi cũng mất đi lợi thế của mình.

Vì vậy, câu hỏi đặt ra là: đúng vậy, AI sẽ thương mại hóa rất nhiều thứ, giống như nó đang thương mại hóa phần mềm. Nhưng những người di chuyển đủ nhanh, nắm vững các mối quan hệ với khách hàng, tiếp tục cung cấp dịch vụ xuất sắc và liên tục cải tiến dịch vụ của mình sẽ không bị thu hẹp mà thậm chí còn phát triển nhanh hơn. Những người không đủ năng lực và không làm gì cả.

Vì vậy, đây thực sự là một câu hỏi mang tính sống còn: nếu tôi không áp dụng AI thì người khác sẽ làm và họ sẽ đánh bại tôi.

Một ví dụ rất đơn giản khác là trường năng lượng. Trong năm qua, chúng tôi đã có một số nhà phân tích năng lượng cố gắng xây dựng một mô hình năng lượng. Mô hình này rất phức tạp và thị trường dịch vụ dữ liệu năng lượng có thể trị giá 900 triệu USD, vì vậy đây rõ ràng là một thị trường khổng lồ mà tôi muốn tham gia. Nhưng mặc dù ai đó trong nhóm của chúng tôi đã làm việc này được một năm nhưng chúng tôi vẫn chưa thực sự tham gia kinh doanh dịch vụ dữ liệu năng lượng.

Sau đó, "Claude Code Psycho" xuất hiện. Chúng tôi có một người tên là Jeremy, người đứng đầu bộ phận kinh doanh công nghiệp và năng lượng của trung tâm dữ liệu. Khi anh ấy bắt đầu sử dụng Claude Code, mọi thứ đột nhiên thay đổi. Trong suốt ba tuần, anh ấy đã tiêu rất nhiều tiền, có thể là 6.000 đô la một ngày, điều này thực sự là một sự cường điệu. Nhưng anh ấy đã nắm bắt mọi nhà máy điện ở Hoa Kỳ và mọi đường dây truyền tải trên một mức điện áp nhất định, đồng thời xây dựng bản đồ toàn bộ lưới điện Hoa Kỳ từ nhiều nguồn dữ liệu công cộng khác nhau, đồng thời đưa vào nhiều dữ liệu về phía cầu.

Chúng tôi đã biến nó thành một bảng điều khiển có thể xem và phân tích tình trạng thiếu và dư thừa điện ở nhiều vùng vi mô khác nhau ở Hoa Kỳ cũng như nhiều thông tin chi tiết. Thứ này được đưa lên chỉ trong vài tuần.

Sau đó, chúng tôi đã cho một số khách hàng đã mua tập dữ liệu về trung tâm dữ liệu của chúng tôi xem, bao gồm cả các nhà kinh doanh năng lượng. Sau khi đọc nó, họ nói, "Chà, bạn đã làm việc này được bao lâu rồi? Công ty này rất tốt, tốt hơn công ty nọ." Sau đó, chúng tôi tìm hiểu thêm và phát hiện ra rằng "công ty tương tự" có 100 người đã làm việc này trong mười năm.

Tất nhiên, sản phẩm hiện tại của chúng tôi không hoàn thiện và mạnh mẽ như sản phẩm của họ, nhưng ở một khía cạnh nào đó, nó đã tốt hơn rồi. Vì thế tôi hiện đang thương mại hóa những công ty dịch vụ dữ liệu năng lượng này. Nhưng ngược lại, nếu tôi không chạy nhanh hơn thì ai sẽ biến tôi thành hàng hóa?

Vì vậy, từ góc độ của một chủ doanh nghiệp, câu hỏi không phải là “tôi có tiêu nhiều tiền không?” Vâng, tôi đã tiêu rất nhiều tiền. Nhưng câu hỏi là số tiền này giúp tôi được gì? Nó có mang lại nhiều doanh thu hơn không? Nếu câu trả lời là có thì số tiền bỏ ra là xứng đáng.

Patrick O'Shaughnessy:

Bạn có lo lắng rằng cuối cùng, những người kiểm soát vốn và chịu trách nhiệm đầu tư vốn, những người thường thuê bạn làm những việc bạn làm, sẽ nói: "Chúng tôi có các nhà phân tích riêng và họ rất thông minh, tại sao chúng tôi không tự mình làm việc đó?" Nếu việc này trở nên dễ dàng như vậy thì đến bao giờ tất cả mới chảy ngược vào các tổ chức đầu tư? Suy cho cùng, họ là những người có nhiều khả năng thu được nhiều lợi ích nhất từ dữ liệu và thông tin chi tiết này.

Dylan Patel:

Trước hết, bản chất của bất kỳ hoạt động kinh doanh dịch vụ thông tin nào là: giá trị tôi nhận được từ một mẩu thông tin rõ ràng là không lớn bằng giá trị mà khách hàng nhận được từ thông tin này.

Nếu tôi bán thông tin cho bạn với giá 1 USD, lý do khiến bạn sẵn sàng chi 1 USD là vì bạn biết rằng thông tin này có thể giúp bạn đưa ra quyết định và quyết định này có thể giúp bạn kiếm được nhiều hơn 1 USD. Nói cách khác, bạn có cơ hội kinh doanh chênh lệch giá. Bạn kiếm được nhiều tiền từ tôi hơn là tôi kiếm được từ việc bán thông tin này.

Tất nhiên, bản thân các quỹ đầu tư cũng có năng lực dịch vụ thông tin riêng. Đặc biệt là các tổ chức như Jane Street và Citadel, chúng rất chi tiết và chuyên sâu về mặt dữ liệu. Nhưng các tổ chức này vẫn sẽ mua dữ liệu của chúng tôi và họ sẽ tiếp tục làm như vậy và sự hợp tác của họ với chúng tôi sẽ tiếp tục phát triển.

Tôi nghĩ có một loại "yếu tố nó" nào đó trong chuyện này. Chúng tôi di chuyển nhanh hơn, linh hoạt hơn, chúng tôi có các nhóm nhỏ hơn và chúng tôi tập trung vào một lĩnh vực rất cụ thể: cơ sở hạ tầng AI và những thay đổi lớn mà nó gây ra, bao gồm AI, nền kinh tế mã thông báo và toàn bộ những thứ liên quan đến điều đó. Chúng ta có thể nhìn thấy hướng đi sớm hơn và xây dựng mọi thứ nhanh hơn.

Vì vậy, các chuyên gia đầu tư chắc chắn sẽ cố gắng thực hiện một số việc mà chính chúng ta cũng làm. Nhưng thường xuyên hơn là họ mua hoàn toàn dữ liệu của chúng tôi và sau đó xây dựng dựa trên dữ liệu đó. Việc họ mua dữ liệu của chúng tôi và xây dựng dựa trên dữ liệu đó thường rẻ hơn so với việc họ tự xây dựng dữ liệu đó từ đầu. Tất nhiên, cuối cùng sẽ có người cố gắng tự làm điều đó.

Mã thông báo trở thành một phương tiện sản xuất mới

Patrick O'Shaughnessy:

Tôi cảm thấy như mỗi lần trò chuyện với bạn, cuối cùng tôi lại quay lại cùng một câu hỏi: cung và cầu về mã thông báo. Đây là điều tôi quan tâm nhất trên thế giới hiện nay. Kinh nghiệm của riêng bạn có mang lại cho bạn sự hiểu biết mới nào về phía cầu không? Sau khi bạn cảm nhận được điều này một cách cá nhân, đánh giá của bạn về nhu cầu về token có thay đổi không?

Dylan Patel:

Nếu chúng ta lùi lại và nhìn vào góc độ vĩ mô, ARR của Anthropic có thể đã tăng từ 9 tỷ USD lên khoảng 35 tỷ USD, 40 tỷ USD. Vào thời điểm tập phim này phát sóng, nó có thể trị giá từ 40 tỷ đến 45 tỷ USD.

Nhưng sức mạnh tính toán của họ không tăng lên đến mức tương tự. Nếu bạn làm phép toán và giả sử rằng họ không giảm sức mạnh tính toán R&D - điều mà rõ ràng là không phải vậy, bởi vì họ vẫn đang phát hành các mô hình mới, như Metis, Opus 4, Opus 4.7 - điều đó có nghĩa là một điều: sức mạnh tính toán bổ sung của họ, ngay cả khi tất cả được đầu tư vào suy luận, tỷ suất lợi nhuận gộp sàn của họ là khoảng 72%.

Trên thực tế, một số sức mạnh tính toán mới có khả năng sẽ được đưa vào nghiên cứu và phát triển nên tỷ suất lợi nhuận gộp thực tế của họ có thể cao hơn 72%. Bạn biết đấy, ai đó đã rò rỉ một phần thông tin trong tài liệu tài chính của họ vào đầu năm nay và tỷ suất lợi nhuận gộp hiển thị vào thời điểm đó chỉ khoảng 30%.

Làm thế nào một doanh nghiệp có thể tăng tỷ suất lợi nhuận gộp đến mức như vậy trong một khoảng thời gian ngắn như vậy? Về nguyên tắc là do nhu cầu quá cao. Họ có thể thắt chặt hạn ngạch sử dụng, giới hạn tốc độ và nhiều hạn chế khác nhau. Điều thực sự quan trọng là bạn có người quản lý tài khoản với Anthropic, có hợp đồng kinh doanh và nhận được mức tăng giới hạn lãi suất mà bạn cần. Nếu không, mã thông báo cuối cùng sẽ trở nên cực kỳ phổ biến.

Ai có đủ khả năng thì có thể mua được. Nhân chủng học phải đối mặt với cùng một vấn đề - tất nhiên đó không phải là vấn đề, đó chỉ là thực tế về cách thức hoạt động của chủ nghĩa tư bản. Đúng, khách hàng có thể trả cho họ 40 tỷ đô la phí mã thông báo mỗi năm, nhưng giá trị mà các mã thông báo này tạo ra cho khách hàng là hơn 40 tỷ đô la.

Các công ty khác nhau tạo ra các giá trị khác nhau cho mỗi mã thông báo. Nhưng khi các mô hình ngày càng thông minh hơn, điều thực sự quan trọng sẽ trở thành: ai có thể có được những token thông minh nhất này và sử dụng chúng cho những việc có giá trị nhất.

Là một con người, điều bạn phải quyết định là: cách sử dụng những mã thông báo này để phát triển doanh nghiệp của bạn và tạo ra giá trị. Nhiều người sẽ muốn có token và sẽ tiêu thụ token. Nhưng những công ty khởi nghiệp SaaS thông thường sử dụng Claude để xây dựng các sản phẩm phần mềm ở San Francisco có thể không thực sự tạo ra giá trị lớn. Vì vậy, sớm hay muộn, họ sẽ bị giá token đè bẹp.

Patrick O'Shaughnessy:

Hôm nay tôi đã gặp phải tình huống này trên đường đến đây. Ngay khi Opus 4.7 được phát hành, tôi đã muốn sử dụng ngay 4.7 và tôi muốn sử dụng nó ngay lập tức. Kết quả là, việc sử dụng hiện tại của tôi bị hạn chế và tôi hoàn toàn không thể sử dụng nó. Tôi thậm chí không thể tưởng tượng việc tiếp tục sử dụng 4.6 nữa, mặc dù tôi rất hài lòng với 4.6 trong vài tuần qua và nó rất mạnh mẽ.

Bạn có ngạc nhiên khi mọi người bị ám ảnh bởi việc sử dụng những mẫu máy tiên tiến, đắt tiền nhất không?

Dylan Patel:

Không ngạc nhiên chút nào. Một trong những kỷ niệm vui nhất của tôi trong tháng rưỡi qua là khi tôi và bạn tôi Leopold gần như quỳ xuống trước mặt người đồng sáng lập Anthropic và cầu xin anh ấy cho chúng tôi quyền truy cập vào Metis.

Chúng tôi biết nó tồn tại nên chúng tôi nói: "Hãy sử dụng nó." Và anh ấy nói: "Tôi không biết bạn đang nói về điều gì."

Patrick O'Shaughnessy:

Phản ứng của bạn khi bảng giá hoặc thẻ eval đó xuất hiện là gì?

Dylan Patel:

Trên thực tế, đã có tin đồn trước đây ở Bay Area, và chúng tôi đại khái biết rằng nó sẽ rất mạnh mẽ. Nếu bạn nhìn vào điểm chuẩn, tất nhiên điểm chuẩn sẽ liên tục thay đổi, nhưng Mephisto/Metis có lẽ là bước nhảy vọt lớn nhất về khả năng của mô hình trong hai năm qua.

Tôi nghĩ điều này rất quan trọng: nó mạnh đến mức Anthropic thậm chí không muốn phát hành nó hoàn toàn. Mặc dù họ đã công bố giá cho một số khách hàng và đưa ra các đợt phát hành có chọn lọc, chẳng hạn như đối với các tình huống liên quan đến an ninh mạng. Giá token của nó có thể gấp 5 hoặc thậm chí 10 lần, nhưng họ vẫn không muốn phát hành nó hoàn toàn vì họ lo lắng về tác động của nó đối với thế giới thực.

Vì vậy, những gì chúng tôi được cung cấp bây giờ là một phiên bản tệ hơn, yếu hơn, đó là Opus 4.7. Và họ đã nêu rõ điều đó trong thẻ mô hình: Chúng tôi thực sự đã cố tình thực hiện việc tối ưu hóa trước tồi tệ hơn về khả năng bảo mật mạng. Tôi không biết bạn có đọc phần đó không.

Vì vậy điều tôi muốn nói là: Dù bạn là ai, chỉ cần có đủ vốn, bạn nên mua gói đăng ký doanh nghiệp của Anthropic và thanh toán bằng token thay vì sử dụng những gói đăng ký thông thường đó. Bởi vì bằng cách này bạn sẽ không bị hạn chế dễ dàng như vậy.

Sau đó, bạn phải tìm ra cách sử dụng các mã thông báo này cho các nhiệm vụ có giá trị cao nhất và kiếm tiền từ chúng. Bởi vì về cơ bản mà nói, có thể một hoặc hai năm nữa, về cơ bản, nhiều doanh nghiệp sẽ thực hiện kinh doanh chênh lệch giá token. Token rất mạnh nhưng điều quan trọng là biết trỏ chúng vào đâu.

Trong ba hoặc bốn năm tới, bản thân mô hình có thể biết cách sử dụng mã thông báo và cách tạo ra giá trị tối đa.

Nếu nhìn lại bất kỳ điểm chuẩn nào, bạn sẽ thấy rằng: trước đây, chi phí để đạt được một mức năng lực nhất định là X, nhưng bây giờ có thể chỉ tốn một phần trăm, thậm chí một phần nghìn chi phí ban đầu. Ví dụ: khi DeepSeek đạt đến khả năng cấp GPT-4, chi phí sẽ bằng khoảng 1/6 GPT-4. Kể từ đó, giá thành của các mẫu xe cấp GPT-4 tiếp tục giảm.

Tất nhiên, không ai thực sự quan tâm đến mẫu GPT-4 nữa. Điều mà mọi người đều mong muốn là một mô hình tiên tiến, bởi vì chỉ những mô hình tiên tiến mới có thể tạo ra những thứ có giá trị kinh tế thực sự. Tuy nhiên, các mẫu cấp độ GPT-4 vẫn có thể được sử dụng trong một số cảnh, nhưng những cảnh đó thường nhỏ hơn.

Vì vậy, điều thực sự thúc đẩy nhu cầu không phải là các tính năng cũ trở nên rẻ hơn mà là các trường hợp sử dụng mới tiếp tục xuất hiện. Bạn hiện đang sử dụng mô hình cấp độ Opus 4.6 hoặc Opus 4.7. Một năm nữa, nếu tôi có được khả năng mô hình chất lượng tương tự ngày hôm nay, số tiền bỏ ra của tôi có lẽ sẽ chỉ là 70.000 USD, có thể rẻ hơn 100 lần.

Nhưng điều đó không quan trọng. Bởi khi đó, tôi chắc chắn sẽ dùng mô hình mạnh mẽ hơn để làm được những điều có giá trị hơn.

Bản thân Metis của Anthropic đắt hơn một mô hình nhưng nó làm được điều tương tự với số lượng token ít hơn nhiều. Vì vậy, trong hầu hết các tác vụ, nó thực sự rẻ hơn Opus 4.6.

Dylan Patel:

Bởi vì nó hiệu quả hơn nhiều. Ngay cả khi bản thân mỗi mã thông báo “thông minh hơn” và đắt hơn thì nó vẫn cần ít mã thông báo hơn để hoàn thành nhiệm vụ.

Patrick O'Shaughnessy:

Lần cuối cùng tôi gặp bạn, Metis có thể vừa được ra mắt, hoặc thẻ mô hình vừa mới ra mắt. Lúc đó bạn nói rằng nó mạnh đến mức khiến bạn hơi sợ. Ý bạn là gì?

Dylan Patel:

Mục tiêu của Anthropic vào năm 2025, thậm chí bắt đầu từ năm 2024, là: đến cuối năm 2025, họ hy vọng sẽ có được kỹ sư phần mềm trình độ L4 trong mô hình. Nhìn chung, họ đã khá thành công với Opus 4.6.

Nhưng điều họ không nói là nếu bạn nhìn vào Metis và so sánh nó với điểm chuẩn, thì nó giống một kỹ sư L6 hơn. L4 có lẽ là một kỹ sư phần mềm tương đối trẻ, trong khi L6 đã là một kỹ sư khá giàu kinh nghiệm.

Tôi nhớ Anthropic đã nói rằng mô hình này sẽ có sẵn trong nội bộ từ khoảng tháng Hai. Nói cách khác, họ đã nhảy từ kỹ sư L4 lên kỹ sư L6 trong hai tháng. Vậy điều gì xảy ra tiếp theo?

Khi nghĩ về tiến trình của mô hình, bạn sẽ thấy rằng nó thực sự đang tăng tốc. Nhịp phát hành của Anthropic đang bị nén và nhịp phát hành của OpenAI cũng đang bị nén. Tại sao? Bởi vì nói chung, để tạo ra những mô hình tốt hơn, bạn cần một số thứ.

Trước hết, bạn cần có sức mạnh tính toán mạnh mẽ. Sức mạnh tính toán rất đắt tiền và có quy mô thời gian riêng. Chúng tôi sẽ theo dõi nội dung này và nó chắc chắn đang phát triển, nhưng trong ngắn hạn, nó gần như chắc chắn. Sức mạnh tính toán mà bạn đã ký thường được xác định. Tất nhiên, sẽ có sự chậm trễ và điều chỉnh ở giữa, và bạn cũng có thể tìm cách bổ sung thêm một chút, nhưng nhìn chung thì nó tương đối cố định.

Thứ hai, bạn cần những nhà nghiên cứu rất giỏi. Giờ đây các công ty sẵn sàng trả hàng chục triệu USD cho những người này.

Cuối cùng là khả năng đạt được thành tựu. Về mặt lịch sử, việc thực hiện rất khó khăn. Nếu tôi có ý tưởng thì tôi phải hiện thực hóa nó, và rất khó để hiện thực hóa nó. Nhưng hiện nay, ý tưởng có ở khắp mọi nơi và việc thực hiện rất dễ dàng. Nó đắt tiền, nhưng rất dễ dàng.

Vì vậy, câu hỏi sẽ trở thành: Làm thế nào để quyết định nên thực hiện ý tưởng nào? Kết quả là khi việc thực hiện trở nên quá dễ dàng, bạn có thể thực hiện nhiều ý tưởng hơn và chạy nhanh hơn trên máy chạy bộ này.

Điều này có thể xảy ra trong nghiên cứu mô hình AI, do đó, nhịp phát hành mô hình được rút ngắn từ sáu tháng xuống còn hai tháng qua. Nó cũng có thể xảy ra ở các khu vực khác. Ví dụ: tôi muốn lập mô hình mọi nhà máy điện và đường dây truyền tải ở Hoa Kỳ, chạy hồi quy và phân tích mối quan hệ cung cầu ở các khu vực vi mô—tôi có thể làm điều đó ngay bây giờ.

Bản thân ý tưởng này đã rẻ tiền. Vấn đề là, ý tưởng nào có ý nghĩa? Ý tưởng nào xứng đáng để bạn đầu tư vốn, mua token và hiện thực hóa nó? Vì khả năng thực hiện đã có rồi. Đây là sự thay đổi quan trọng nhất.

Nếu chi phí triển khai tiếp tục giảm—và thực tế là như vậy—thậm chí chúng tôi vẫn chưa thực sự có được Metis. Opus 4.7 chỉ mới được phát hành được vài giờ nhưng trong nhóm chúng tôi đã có rất nhiều hứng thú.

Điều này sẽ mang lại điều gì cho thế giới tiếp theo? Tôi nghĩ nó sẽ sắp xếp lại cách thức hoạt động của nền kinh tế.

Trước đây, việc thực hiện rất quan trọng vì việc thực hiện rất khó khăn; ý tưởng rất rẻ. Giờ đây, ý tưởng không chỉ rẻ và dồi dào mà việc thực hiện còn cực kỳ dễ dàng. Vì vậy, điều duy nhất thực sự đáng làm là những ý tưởng đủ tốt để chứng minh rằng ngay cả khi chi phí thực hiện cực kỳ rẻ thì bạn vẫn đáng để chi tiền cho nó.

Patrick O'Shaughnessy:

Vậy bạn có thực sự sợ hãi không? Hay nó chỉ đơn giản đưa ra một sự không chắc chắn khó nắm bắt?

Dylan Patel:

Chắc chắn có điều gì đó không chắc chắn. Nhưng tôi cảm thấy như có một nỗi sợ hãi nào đó đi kèm với điều đó. Câu hỏi đặt ra là xã hội sẽ tự tổ chức lại như thế nào?

Khi bạn sống trong một thế giới mà bản thân "khả năng đạt được điều gì đó" không quá quan trọng, điều gì là quan trọng? Điều quan trọng là liệu bạn có thể chọn ý tưởng phù hợp cho AI và để nó được triển khai hay không; liệu bạn có thể bán ý tưởng này hay những gì AI thực hiện; và liệu bạn có thể huy động vốn cho hướng đi này hay không. Đây là những điều trở nên quan trọng.

Điều này cũng quay trở lại câu hỏi trước: điều quan trọng là phải luôn có mẫu mới nhất. Vậy ai sẽ có được mẫu mới nhất?

Anthropic có một dự án, tôi biết nó không tên là Earwig, nhưng tôi thích gọi nó là Earwig nhằm mục đích trêu chọc mọi người ở Anthropic. Họ chỉ cung cấp Metis cho một số công ty nhất định để sử dụng trong các tình huống an ninh mạng. Tôi nghĩ điều này sẽ tiếp tục xảy ra: các mô hình sẽ ngày càng được triển khai ở phạm vi hẹp hơn và ngày càng ít dành cho công chúng.

Lưu ý: Ý nghĩa ban đầu của Earwig là "earwig", một loại côn trùng nhỏ, thường được gọi là "côn trùng ghim tai" trong tiếng Trung. Đây giống như một biệt danh đùa cợt hơn: một mặt, Earwig nghe giống như một loại bọ nào đó, mặt khác nó cũng có chút liên tưởng đến việc “lẻn vào tai” và “bí mật gây ảnh hưởng đến người khác”.

Tôi biết OpenAI, Anthropic và các công ty khác sẽ nói rằng họ muốn cung cấp AI mạnh mẽ cho mọi người. Nhưng AI rất đắt tiền. Ai sẽ trả hàng nghìn tỷ USD cơ sở hạ tầng? Đó là những người có tiền và có thể xây dựng thứ gì đó hữu ích với AI.

Ngoài ra, bạn không muốn người khác chắt lọc mô hình của mình nên không phát hành rộng rãi. Bạn sẽ cung cấp nó cho một nhóm khách hàng ngày càng nhỏ hơn. Sau đó, những khách hàng này cũng sẽ bắt đầu cạnh tranh để giành được token.

Trừ khi Anthropic tăng giá đáng kể. Theo nghĩa đen, họ có thể tăng gấp đôi giá của Opus và tôi vẫn tiếp tục trả tiền. Tôi dám nói rằng hầu hết người dùng sẽ tiếp tục trả tiền. Nhưng tôi không nghĩ điều đó thậm chí còn giải quyết được vấn đề năng lực khổng lồ của họ.

Vì vậy, câu hỏi trở thành: chu kỳ này kết thúc ở đâu? Điều gì sẽ xảy ra khi việc sử dụng token và giá trị bổ sung mà các token này mang lại ngày càng tập trung vào tay một số công ty?

Hiện tại tôi không có Metis. Nhưng ai có? Các ngân hàng hàng đầu làm. Hiện tại, họ có thể chỉ sử dụng nó trong an ninh mạng, nhưng tôi có thể tưởng tượng một thế giới mà vì tôi có hợp đồng doanh nghiệp với Anthropic và vì những người ở Anthropic giống tôi nên họ có thể sẵn sàng cấp cho chúng tôi quyền truy cập sớm hơn một chút hoặc giới hạn tỷ lệ cao hơn một chút. Tất nhiên tôi hy vọng điều đó xảy ra.

Sau đó, đối thủ cạnh tranh của tôi không có quyền truy cập đó và tôi có thể đánh bại họ.

Có thể là một tình huống khác. Lấy Ken Griffin từ Citadel làm ví dụ, người có mối quan hệ cực kỳ tốt và cực kỳ giàu có. Anh ta có thể ký một thỏa thuận với OpenAI hoặc Anthropic và nói: "Trước tiên, tôi sẽ mua 10 tỷ USD token mỗi năm. Mỗi khi bạn phát hành một mô hình mới, trước tiên tôi sẽ mua 10 tỷ USD token đầu tiên, sau đó những người khác sẽ sử dụng chúng."

Điều gì sẽ xảy ra sau đó? Anh ta có thể đè bẹp tất cả mọi người trên thị trường.

Đây chỉ là một ví dụ. Nó cũng có thể xảy ra trong thế giới an ninh mạng, nơi Anthropic lo lắng rằng các mô hình sẽ khiến việc hack hệ thống trở nên dễ dàng hơn. Nó cũng có thể xảy ra trong ngành dịch vụ thông tin như của tôi, nơi tôi dùng nó để đè bẹp người khác.

Tôi nghĩ tác động của việc này là rất rộng. Chúng tôi không biết chính xác những mô hình này có thể làm gì. Anthropic không biết, OpenAI không biết, không ai biết. Cuối cùng, người dùng cuối có quyền khám phá: Những mã thông báo này có thể được sử dụng ở đâu? Những gì có thể được xây dựng? Bạn có thể tưởng tượng những gì?

Điều này tất nhiên sẽ cải thiện đáng kể năng suất và nó cũng có mặt rất tích cực cho nhân loại. Nhưng câu hỏi đặt ra là nguồn lực và khả năng tiếp cận sẽ được tập trung như thế nào?

Robot sẽ bắt kịp làn sóng nhu cầu tiếp theo

Patrick O'Shaughnessy:

Giờ đây, số token mà robot hoặc robot tiêu thụ gần như không đáng kể so với các lĩnh vực khác. Bạn nghĩ gì? Nó có thể là một đường cầu thứ hai? Trong vòng một dặm quanh đây, mỗi ngày đều có những công ty khởi nghiệp về robot mới đang cố gắng tạo ra điều gì đó thú vị.

Dylan Patel:

Ở đây có một khái niệm được gọi là "điểm kỳ dị chỉ dành cho phần mềm". Nói cách khác, thế giới có thể lần đầu tiên trải nghiệm một điểm kỳ dị AI chỉ xảy ra trong phần mềm. Nhưng vấn đề là phần lớn thế giới vẫn còn là vật chất. Bạn thấy đấy, thế giới cuối cùng sẽ được tổ chức xung quanh phần cứng chứ không chỉ phần mềm. Vì vậy, tôi tin rằng cái gọi là “điểm kỳ dị của phần mềm” sẽ chỉ là một giai đoạn ngắn ngủi chứ chưa phải là dấu chấm hết. Bởi vì cuối cùng chúng ta sẽ bước vào thế giới vật chất.

Một khi phần mềm khiến mọi việc trở nên thực sự dễ dàng thì phần thực sự khó khăn của robot là gì? Đó là lập trình, bộ vi điều khiển, bộ truyền động và điều khiển tất cả những thứ đó. Những điều này bây giờ rất khó khăn.

Các mô hình AI có một đặc điểm thú vị: hiệu quả học tập của chúng thực tế rất thấp. Chỉ vì chúng tôi cung cấp cho họ lượng dữ liệu khổng lồ nên họ đã học được nhiều điều và về mặt nào đó đã vượt qua con người.

Nhưng các mô hình robot hiện tại, chẳng hạn như VLA, tức là Tầm nhìn-Ngôn ngữ-Hành động, hiện rất phổ biến, nhưng tôi nghĩ nó có thể không phải là thứ mà cuối cùng có thể tiếp tục mở rộng. Hiệu suất dữ liệu của chúng rất thấp và chúng tôi không thể mở rộng quy mô dữ liệu robot đủ nhanh.

Chắc chắn sẽ có cách nào đó để đào tạo trước các mô hình robot trên quy mô lớn trong tương lai. Cũng giống như con người tiếp tục nhìn thấy nhiều dữ liệu khác nhau trong suốt cuộc đời của họ. Điều thực sự tuyệt vời ở con người là chúng ta rất “làm mẫu hiệu quả”. Một ví dụ, hai ví dụ, chúng ta có thể học hỏi.

Nếu khả năng này được áp dụng cho robot, tình hình sẽ hoàn toàn khác. Một khi có điểm kỳ dị ở cấp độ phần mềm, việc triển khai sẽ trở nên rẻ đến mức bất kỳ ai cũng có thể bắt đầu xây dựng những mô hình này. Tiếp theo, mọi người có thể bắt đầu xây dựng các bot thực sự hữu ích.

Vì vậy, tôi nghĩ trong vòng 6 đến 18 tháng tới, chúng ta sẽ bắt đầu chứng kiến những bước đột phá thực sự trong lĩnh vực chế tạo robot. Khả năng chính là học ít lần, tức là học ít lần. Tại thời điểm đó, có một mô hình robot được đào tạo trước, sau đó bạn thuê hoặc mua robot, cho nó xem một vài ví dụ và nó sẽ hoàn thành công việc.

Bạn bảo nó xếp hai thứ này lên nhau và nó sẽ làm việc đó. Bạn nói với nó, "Thứ này thực sự có thể được cân bằng," và nó bắt đầu thử và thực hiện nó. Tin tôi đi, tôi đã làm đổ nhiều thứ nhiều lần rồi.

Vì vậy, tôi nghĩ rằng robot sẽ có khả năng học tập với ít mẫu.

Thực tế hiện nay có rất nhiều công ty chế tạo robot, một số để hiển thị quảng cáo và một số để thực hiện một số nhiệm vụ rất đơn giản. Nhưng sau đó nó sẽ bị phân đoạn rất nhiều. Ví dụ, một robot được thiết kế để gấp quần áo hoặc bẻ nhỏ nó ra một chút, một robot được thiết kế để lau bảng đen. Đó có thể là một dịch vụ cho thuê hoặc có thể là một gói mô hình mà bạn tải xuống robot tiêu chuẩn và nó thực hiện nhiệm vụ và bạn trả tiền cho mỗi lần sử dụng.

Trong mọi trường hợp, lĩnh vực hàng hóa vật chất sẽ tạo ra một sự tăng tốc rất lớn và cũng sẽ có tác động giảm phát. Và điều này cuối cùng sẽ tiếp tục thúc đẩy nhu cầu về token tăng trưởng mạnh mẽ. Vì vậy, cá nhân tôi không nghĩ nhu cầu về token sẽ chậm lại.

Patrick O'Shaughnessy:

Bạn có học được điều gì mới về thế giới từ kết quả của Metis và cách nó được xây dựng không? Nói cách khác, nếu bạn chia nhỏ các thành phần khác nhau của quy luật mở rộng quy mô, chẳng hạn như đào tạo trước...

Dylan Patel:

Đó là một mô hình lớn hơn nhiều so với mô hình trước đó. 100.000 chip Blackwell tương đương với hàng trăm nghìn chip thế hệ trước. Tất nhiên, TPU và Triton có nhịp phát hành khác nhau nên không thể tương ứng hoàn toàn một-một. Nhưng cuối cùng thì đúng vậy, Metis là một mẫu xe lớn hơn đáng kể. Nó chứng tỏ rằng quy luật chia tỷ lệ vẫn còn hiệu lực. Mọi thứ nó thể hiện cho thấy đường xu hướng vẫn tiếp tục: đưa thêm sức mạnh tính toán vào mô hình và mô hình sẽ trở nên tốt hơn.

Và toàn bộ quá trình không chỉ là "càng nhiều sức mạnh tính toán thì mô hình càng tốt hơn". Đồng thời, chúng tôi không ngừng nâng cao hiệu quả tính toán. Tất cả sức mạnh tính toán nghiên cứu và phát triển được đầu tư vào phòng thí nghiệm cuối cùng đều chuyển thành một điều: nếu tôi muốn một mô hình có mức khả năng nhất định, sáu tháng một lần hoặc bây giờ là hai tháng một lần, chi phí để đạt được khả năng này sẽ giảm đáng kể. Nhưng nếu tôi tăng quy mô lên đáng kể, tôi vẫn có thể có được bước nhảy vọt về năng lực.

Vì vậy, vâng, nó chứng tỏ rằng điều này vẫn đang diễn ra. Google và Anthropic không phải là những người sử dụng nhiều GPU trong lĩnh vực đào tạo. OpenAI cũng sẽ ra mắt thế hệ mô hình mới tiếp theo. Tôi nghĩ họ đang thực hiện một cách tiếp cận hợp lý và có nguyên tắc hơn để mở rộng quy mô theo từng bước nhỏ. Và lần này Anthropic đã có một bước nhảy vọt lớn.

Chúng ta sẽ thấy những mẫu máy ngày càng tốt hơn trong năm nay và tốc độ phát hành sẽ ngày càng nhanh hơn.

Patrick O'Shaughnessy:

Chúng tôi đã thảo luận về vấn đề này từ lâu nhưng OpenAI hầu như không được đề cập đến. Đây hẳn là một điều kỳ lạ trước đây.

Dylan Patel:

Đây là lúc mọi chuyện trở nên thú vị. Bây giờ nhiều người sẽ nói: Vậy là Anthropic đã thắng rồi phải không? Họ đã có Metis vào tháng 2 nhưng thậm chí còn không tung ra nó vì cảm thấy không cần thiết. Họ đã bán hết năng lực tính toán và doanh thu của họ đang tăng thêm 10 tỷ USD mỗi tháng. Sau đó, hôm nay sẽ có sự ra mắt của Opus 4.7, và tất cả điều này xảy ra trước tin đồn phát hành Spud của OpenAI - một tin đồn được đưa tin bởi The Information và những người khác.

Vì vậy, nhìn bề ngoài thì Anthropic rõ ràng đang dẫn đầu và OpenAI dường như đã kết thúc. Nhưng điều thú vị là Anthropic rõ ràng bị hạn chế về khả năng tính toán và tốc độ mở rộng cũng bị hạn chế. Dario từng tự hào cho rằng OpenAI đã quá mạnh tay trong việc đầu tư vào sức mạnh tính toán, trong khi việc mở rộng quy mô của Anthropic lại hợp lý hơn. Nhưng bây giờ Anthropic có thể đang nghĩ: Lẽ ra chúng ta đáng lẽ phải có nhiều sức mạnh tính toán hơn.

OpenAI hoàn toàn có khả năng thanh toán các hóa đơn này. Trên thực tế, họ đã huy động được rất nhiều tiền để có được sức mạnh tính toán gia tăng hơn. Ngoài ra, trước đó họ còn mua sức mạnh tính toán từ Oracle, CoreWeave, SoftBank, Microsoft và các công ty khác với quy mô rất hung hãn, thậm chí là "vô trách nhiệm". Bây giờ họ cũng đang nhận Trainium từ Amazon.

Vì vậy, OpenAI đã làm một điều điên rồ với sức mạnh tính toán và họ biết mình cần nhiều hơn thế.

Điều thú vị là nếu nhìn vào Opus 4.6, chúng ta sẽ không coi mô hình này tiếp tục trở nên mạnh mẽ hơn trong thời điểm hiện tại mà chỉ nhìn vào sự phổ biến của công nghệ này. Bạn và tôi có thể sử dụng mô hình ngay trong ngày đầu tiên, nhưng các công việc kinh doanh khác cần có thời gian. Con người cũng cần có thời gian để học hỏi. "Khoảnh khắc thức tỉnh của Claude" đó không tác động đến tất cả mọi người cùng một lúc. Vì vậy, đến cuối năm, giả sử là một mô hình cấp độ Opus 4.6, toàn bộ nền kinh tế sẵn sàng chi 100 tỷ đô la mỗi năm cho nó và tôi không nghĩ đó là một sự cường điệu. Rốt cuộc, 40 tỷ USD đã được chi tiêu.

Patrick O'Shaughnessy:

Về cơ bản nó chỉ là phép ngoại suy tuyến tính.

Dylan Patel:

Đúng, đây là phép ngoại suy tuyến tính, không phải phép ngoại suy hàm mũ. Để đạt được sự tăng trưởng theo cấp số nhân, bạn cần những mô hình tốt hơn. Nhưng Anthropic sẽ không có đủ sức mạnh tính toán để đáp ứng những nhu cầu này. Vì vậy, giả sử OpenAI hoặc Google sớm đạt được mức năng lực này thì ai làm được tiếp theo cũng có thể làm được.

Anthropic có thể tính lãi gộp 70%, nhưng nếu OpenAI đạt được khả năng tương đương tiếp theo, nó sẽ đáp ứng toàn bộ nhu cầu gia tăng này ngay cả khi nó chỉ tính lãi gộp 50%. Và khả năng cao là nó không đủ sức mạnh tính toán để phục vụ tất cả người dùng. Vì vậy, có thể một mô hình như Metis, nếu thế giới có đủ sức mạnh tính toán, có thể mang về doanh thu 500 tỷ USD, hoặc thậm chí còn cường điệu hơn. Nhu cầu thị trường đối với các token này quá mạnh và nguồn cung cấp sức mạnh tính toán là vô cùng hạn chế.

Chúng ta đã thấy điều này với sự bùng nổ giá H100. Tuổi thọ hữu ích của GPU cũng ngày càng tăng. Rõ ràng là ngay cả các phòng thí nghiệm cấp hai cũng sẽ bán hết token của họ chứ chưa nói đến các phòng thí nghiệm cấp một. Các phòng thí nghiệm cấp một sẽ có tỷ suất lợi nhuận tốt hơn, nhưng các phòng thí nghiệm cấp hai cũng sẽ hết hàng, và ngay cả các phòng thí nghiệm cấp ba cũng có thể sắp hết hàng.

Giá trị kinh tế mà các mô hình mạnh nhất có thể tạo ra đang tăng nhanh hơn khả năng cơ sở hạ tầng cung cấp các mã thông báo này cho người dân. Vì vậy, khoảng cách sẽ tiếp tục gia tăng. Tỷ suất lợi nhuận của Model Labs sẽ tiếp tục tăng cho đến khi những người trong chuỗi cung ứng phần cứng và chuỗi cung ứng cơ sở hạ tầng nói: Đợi đã, tại sao tôi không tăng tỷ suất lợi nhuận của mình?

Patrick O'Shaughnessy:

Vì vậy, có thể nói rằng nhận định của bạn về phía cầu ngày nay, đặc biệt là ví dụ về SemiAnalysis của chính bạn, là hoàn toàn bùng nổ. Và rộng hơn, khi mọi người bước vào cái mà bạn gọi là "rối loạn tâm thần AI" và trực tiếp trải nghiệm những gì họ có thể làm, họ cảm thấy khó khăn để đạt được điều đó gần như hoàn toàn biến mất, và bản thân tôi cũng trải nghiệm điều này. Chỉ trong vài tuần, số tiền chi tiêu cho token của tôi đã tăng vọt hoàn toàn.

Điều này nghe có vẻ là một quyết định khá hay từ phía cầu. Vậy về phía cầu, chúng ta còn thiếu điều gì nữa không? Nếu bạn không sử dụng nhiều mã thông báo hơn, bạn sẽ không bao giờ thoát khỏi "lớp dưới cùng vĩnh viễn". Bạn có thể mở rộng về tuyên bố này?

Nói cách khác, hoặc bạn sử dụng nhiều mã thông báo hơn và tạo ra giá trị kinh tế vượt mức thông qua các mã thông báo này; nhưng cách sử dụng hiện nay của nhiều người còn nhàm chán và lười biếng. Họ sẽ nghĩ: "Vậy thì tôi sẽ chỉ làm việc một giờ mỗi ngày thay vì tám giờ, và để AI làm hầu hết công việc cho tôi."

Dylan Patel:

Đó là một cách làm nhàm chán. Thậm chí còn tuyệt vời hơn: Tôi vẫn làm việc tám giờ một ngày, nhưng tôi hoàn thành công việc gấp tám lần và có thể kiếm được số tiền gấp năm lần. Có thể bạn sẽ không thể kiếm được số tiền gấp năm lần, nhưng đó phải là hướng đi.

Tất nhiên, điều này khó thực hiện được nếu bạn chỉ làm một công việc. Đúng là một số người làm nhiều công việc cùng một lúc, và một số người thành lập công ty và bắt đầu bán hàng. Trước khi mọi người sử dụng AI và nó trở thành tiêu chuẩn ngành, bạn cần nắm bắt được giá trị kinh tế mà AI mang lại. Bởi vì nó chưa hoàn toàn đạt tiêu chuẩn. Nếu bạn không sử dụng nhiều mã thông báo hơn, tạo ra giá trị từ các mã thông báo đó và nắm bắt giá trị đó, bạn không thể loại bỏ lớp dưới cùng vĩnh viễn.

Thực tế có ba vấn đề khác nhau ở đây: thứ nhất, sử dụng nhiều mã thông báo hơn; thứ hai, tạo ra giá trị từ những token này; thứ ba, nắm bắt giá trị từ giá trị bạn tạo bằng mã thông báo. Nếu bạn không thể làm được ba điều này, khi khả năng của mô hình tiếp tục tăng cao và các nguồn lực có thể sẽ bị tập trung hơn nữa, thì bạn sẽ không bao giờ loại bỏ được lớp đáy vĩnh viễn.

Được rồi, hãy nói về phía cung. Điều gì đang xảy ra bây giờ? Nếu đường cầu bùng nổ, điều gì đang xảy ra ở biên giới của toàn bộ nguồn cung để phục vụ tất cả các token này? Khi nhu cầu tăng cao, mọi thứ về phía cung đều tăng giá. Cho dù đó là GPU NVIDIA hay các khía cạnh khác, giá đều tăng. Đồng thời, tuổi thọ sử dụng của chúng cũng được kéo dài.

Đây là cách giá H100 hoạt động. Trước đây, người ta đã đề xuất rằng GPU có tuổi thọ hiệu quả dưới 5 năm, điều này hoàn toàn vô nghĩa. Bây giờ một số cụm Hopper từ ba hoặc bốn năm trước đang được tái ký hợp đồng ba hoặc bốn năm; một số cụm A100 cũng đang được đổi mới cho những năm tới.

Vì vậy, tuổi thọ hiệu quả của GPU rõ ràng không phải là năm năm, thậm chí có thể là bảy hoặc tám năm. Chúng ta vẫn chưa biết, chúng ta sẽ phải chờ xem khi nào Hopper thực sự đạt đến giai đoạn đó. Nhưng rõ ràng là không phải 5 năm. Và đến lúc phải gia hạn, giá vẫn tăng.

Điều này có nghĩa là tỷ suất lợi nhuận gộp của một cụm thực tế không phải là 35% mà cao hơn. Biên độ trong đám mây đang mở rộng. Tỷ suất lợi nhuận trên lớp phần cứng cũng rất tốt, NVIDIA vẫn đang tính tỷ suất lợi nhuận gộp khoảng 75%. Nhìn xa hơn về phía hạ nguồn của chuỗi cung ứng, có thể thấy rõ tỷ suất lợi nhuận của liên kết bộ nhớ cũng đã tăng lên đáng kể. Những tiến bộ lớn cũng đã xuất hiện trong các lĩnh vực như mô-đun quang học và chip logic, đồng thời tỷ suất lợi nhuận đang dần tăng lên.

Quan trọng hơn, những công ty sản xuất chip như NVIDIA đang trả trước những khoản thanh toán rất lớn. Do đó, ngay cả khi tỷ suất lợi nhuận gộp không tăng đáng kể thì chi phí vốn, thời điểm luân chuyển tiền tệ hoặc lợi nhuận trên vốn đầu tư cũng tăng lên.

Bạn có thể thấy điều này trong suốt chuỗi cung ứng. ASML đã bán hết hoàn toàn và cần Carl Zeiss mở rộng sản xuất nhanh hơn. Nhìn dọc theo chuỗi cung ứng, mỗi mắt xích đều đã được bán hết, tăng tỷ suất lợi nhuận hoặc nhận tạm ứng, do đó làm tăng lợi tức trên vốn đầu tư vì thực tế nó đòi hỏi ít vốn đầu tư hơn.

Đây là xu hướng nhất quán xuyên suốt chuỗi cung ứng. Ngay cả PCB cũng như thế này. Cần có lá đồng để sản xuất PCB và lá đồng đã được bán hết và mọi người bắt đầu trả tiền trả trước cho lá đồng.

Có thể nói, chỉ cần thứ này còn có “nhịp đập”, chỉ cần nằm trong chuỗi cung ứng và đã bán hết, người ta sẽ đua nhau tranh giành nguồn cung gia tăng nhiều hơn, tranh giành nguồn cung trước trong vài năm tới.

Sự thiếu hụt năng lượng tính toán được truyền đến toàn bộ chuỗi ngành

Dylan Patel:

Chuỗi cung ứng thường phản ứng nhanh chóng. Nhưng có điều gì đó độc đáo ở vấn đề này: chuỗi cung ứng ngày nay phức tạp hơn bao giờ hết và những thứ chúng tôi đang xây dựng cũng phức tạp hơn bao giờ hết, do đó thời gian thực hiện sẽ dài hơn. Không phải các ngành khác không có thời gian thực hiện là 18 tháng, nhưng lần này, bản thân việc xây dựng nguồn cung mới sẽ mất vài năm.

Ký ức là như vậy. Dung lượng bộ nhớ chỉ có thể tăng trưởng ở mức hai con số mỗi năm, chẳng hạn như khoảng 20% hoặc 30%. NAND thậm chí còn thấp hơn, DRAM cao hơn một chút. Ngay cả khi tín hiệu nhu cầu đã rất mạnh vào cuối năm 2025 và các công ty bộ nhớ bắt đầu phản ứng ngay lập tức, năng lực sản xuất mới thực sự sẽ không xuất hiện ngay lập tức.

Ngoài mức tăng trưởng ban đầu là 20% đến 30% hàng năm, họ chắc chắn có thể tăng thêm một chút công suất. Nhưng nguồn cung mới thực sự sẽ không xuất hiện cho đến năm 2028. Sớm nhất có thể là cuối năm 2027, nhưng khả năng cao vẫn là năm 2028. Điều này rất độc đáo. Ngay cả khi họ muốn mở rộng sản xuất càng nhanh càng tốt thì nguồn cung cũng sẽ không đến ngay lập tức.

Kết quả là giá bộ nhớ tăng vọt. Và tôi đang nói với bạn, đặc biệt là DRAM, giá ít nhất sẽ tăng gấp đôi, gấp ba hoặc thậm chí gấp ba lần nữa.

Có người sẽ nói: “Chuyện ký ức người ta kể dở, ai cũng hiểu”. Nhưng điều đó không đúng, bạn không thực sự hiểu nó. DRAM vẫn có thể tăng gấp đôi hoặc gấp ba kể từ bây giờ vì đó là dung lượng cần thiết. Họ phải lấy năng lực từ nơi khác. Và trong nền kinh tế tư bản chủ nghĩa, cách duy nhất để giành lấy năng lực sản xuất từ nơi khác là phá hủy một phần nhu cầu thông qua mức giá cao hơn. Chúng tôi không thực hiện hệ thống phân phối khẩu phần, nên cuối cùng điều này chắc chắn sẽ xảy ra. Tỷ suất lợi nhuận sẽ tiếp tục tăng.

Tôi nghĩ chip logic cũng gặp vấn đề lớn về năng lực sản xuất. TSMC vừa công bố báo cáo tài chính và họ đang tăng chi tiêu vốn. Nhưng việc xây dựng một nhà máy cuối cùng sẽ mất khá nhiều thời gian. Họ đang làm mọi thứ có thể để tăng thêm sản lượng từ mọi nhà máy hiện có. Nhưng TSMC không tăng giá nhanh vì họ là “người tốt”. Mức tăng giá của chúng có lẽ chỉ tăng một chữ số chứ không phải tăng ba chữ số như các nhà sản xuất bộ nhớ.

Vì vậy, cuối cùng bạn sẽ thấy một thị trường nơi TSMC là một công ty tuyệt vời, nhưng liệu công ty này có thực sự khai thác hết giá trị từ đó không? không nhất thiết.

Tôi chỉ đề cập đến một số thứ, chẳng hạn như lá đồng, sợi thủy tinh và tia laser cần thiết cho PCB. Đây là những chuỗi cung ứng được hiểu tương đối rõ ràng nhưng rất phân khúc và hiện tại chúng cũng rất chặt chẽ. Nhìn xa hơn, chuỗi cung ứng thiết bị sản xuất tấm bán dẫn, tôi vẫn nghĩ rằng mặc dù đã tăng lên rất nhiều nhưng thị trường vẫn đánh giá thấp tầm quan trọng của nó một cách nghiêm trọng.

Định hướng chi tiêu vốn của TSMC trong năm nay là 56 tỷ USD. Dự báo của chúng tôi từ tháng 1 là 57,4 tỷ USD và con số đó có thể sẽ tăng thêm một chút khi chúng tôi thấy một số cách để họ tăng vốn đầu tư.

Nhưng điều mọi người không thực sự chú ý đến là: điều này có ý nghĩa gì trong năm tới? Nó có ý nghĩa gì cho năm tới?

Do đó, TSMC có thể tăng chi tiêu vốn lên 100 tỷ USD trong ba năm. Có thể hai năm sau, vào năm 2028, họ thực sự có thể chi 100 tỷ USD cho chi phí vốn. Tôi nói thật đấy, TSMC có thể sẽ chi 100 tỷ USD vào vốn đầu tư vào năm 2028.

Nhiều người không thể tưởng tượng được con số này. Nhưng điều này có ý nghĩa gì đối với chuỗi cung ứng hạ nguồn của nó? Nó có ý nghĩa gì đối với các công ty như Lam Research, Application Materials, ASML? Điều đó có ý nghĩa gì đối với các công ty trong chuỗi cung ứng, chẳng hạn như MKS Instruments?

Hiệu ứng roi da sẽ còn được khuếch đại hơn nữa.

Lưu ý: “Hiệu ứng bullwhip” được đề cập trong bài viết ám chỉ hiệu ứng khuếch đại trong chuỗi cung ứng. Cụ thể, nhu cầu AI ở hạ nguồn nhất dường như chỉ là sự gia tăng đột biến trong việc sử dụng mã thông báo, nhưng khi nó được truyền đến chuỗi cung ứng thượng nguồn, nó sẽ được khuếch đại từng lớp và cuối cùng chuyển thành việc mở rộng sản xuất, tăng giá quá mức và giành lấy năng lực sản xuất.

Nếu TSMC thực sự muốn chi 100 tỷ đô la vốn đầu tư vào năm 2028, điều mà tôi nghĩ là có thể, thì nhiều người sẽ nghĩ điều đó thật điên rồ, nhưng nó thực sự có thể xảy ra.

Patrick O'Shaughnessy:

Còn các phần khác của hệ sinh thái chip thì sao? GPU luôn chiếm ưu thế tuyệt đối. Nhưng liệu CPU, ASIC hay thứ gì khác có xuất hiện như những cơ hội và điểm nghẽn mới không? Ngoài sự thống trị của GPU NVIDIA, còn điều gì đáng được quan tâm?

Dylan Patel:

Đúng vậy, ASIC rõ ràng đang phát triển. Nhưng tôi muốn thoát khỏi con chip AI và nói về những thứ khác. Chúng tôi đã thực hiện một dự án về FPGA và nhận thấy rằng có khoảng 120 FPGA được sử dụng trong mỗi giá đỡ AI thế hệ tiếp theo. Vậy điều này có ý nghĩa gì đối với tất cả các công ty FPGA?

Điều tương tự cũng xảy ra với CPU. Tất cả các môi trường học tập tăng cường này, cùng với tất cả “mã rác” mà bạn và tôi tạo ra—hiện tại tất cả chúng đều đang chạy trên một số phiên bản Vercel, một số phiên bản AWS hoặc một số tài nguyên đám mây mà chúng tôi tạo ra. Tất cả những điều này đều yêu cầu CPU. Vì vậy, CPU hiện cũng đã được bán hết và nhu cầu đang tăng lên nhanh chóng.

Patrick O'Shaughnessy:

Giúp mọi người hiểu, CPU đóng vai trò gì trong toàn bộ hệ thống?

Dylan Patel:

Có hai lý do chính khiến bạn cần nhiều CPU.

Đầu tiên là học tăng cường. Khi thực hiện học tăng cường, CPU rất quan trọng.

Trước đây, bạn sẽ ném dữ liệu từ toàn bộ Internet vào mô hình để đào tạo và sau đó mô hình sẽ đưa ra một số kết quả. Bây giờ, bạn vẫn đang đưa dữ liệu Internet vào mô hình, nhưng sau đó bạn cũng đưa mô hình vào một môi trường và nói: "Đây, hãy thử cái này." Người mẫu sẽ thử rất nhiều thứ khác nhau. Cuối cùng, môi trường đánh giá sự thành công của nỗ lực của nó và cho điểm nó. Những môi trường này có thể là bất cứ điều gì. Nó có thể đơn giản như kiểm tra xem văn bản đầu ra có đúng định dạng hay đầu ra có cấu trúc đúng hay không. Nó cũng có thể rất phức tạp.

Bây giờ mọi người đã bắt đầu bước vào những tình huống rất phức tạp. Ví dụ: "Tôi muốn bạn mở tệp này, sửa đổi, chỉnh sửa, cập nhật và sau đó gửi nó lên một trang web." Hoặc: "Tôi muốn bạn mở phần mềm mô phỏng vật lý của Siemens và chỉnh sửa mô hình CAD này." Vì vậy, những môi trường này sẽ ngày càng trở nên phức tạp hơn. Và những môi trường này chạy trên CPU, không phải GPU hay ASIC.

ASIC hoặc GPU chịu trách nhiệm tự chạy mô hình: lấy dữ liệu đầu vào từ môi trường, đưa dữ liệu đó vào mô hình và tạo ra các đường dẫn đầu ra khác nhau, tức là các cách khác nhau mà mô hình cho rằng nó có thể giải quyết vấn đề. Những đường dẫn này sau đó được đánh giá và cho điểm. Những đường dẫn thành công đó sẽ được sử dụng để tiếp tục đào tạo mô hình, cập nhật mô hình và tiếp tục lặp lại. Vì vậy, đây là nơi đầu tiên CPU rất hữu ích.

Vị trí thứ hai là triển khai.

Khi bạn có những mô hình mạnh mẽ này và triển khai chúng, các mô hình sẽ tạo ra mã tạo ra tất cả các loại đầu ra hữu ích. Nhưng những kết quả đầu ra này không đi trực tiếp từ GPU vào não người. Chúng ra khỏi GPU hoặc ASIC và đi vào một số ứng dụng mà bạn triển khai và bản thân ứng dụng đó thường chạy trên CPU.

Vì vậy, đây là một lĩnh vực khác có nhu cầu rất cao. CPU phần lớn đã được bán hết.

Giá trị của AI khó đo lường bằng GDP

Patrick O'Shaughnessy:

Khi bạn tiếp tục đánh giá xu hướng cung cầu và cố gắng trở thành người hiểu rõ nhất về hai điều này trên thế giới, bạn ước mình biết nhưng chưa biết là gì?

Dylan Patel:

Tôi nghĩ phần khó hiểu nhất đối với chúng tôi và mọi người là kinh tế học mã thông báo, tức là tính kinh tế của mã thông báo. Chúng tôi thực sự có những đánh giá rất tốt về chi phí để vận hành cơ sở hạ tầng, chi phí của mã thông báo là bao nhiêu, chi phí của các mô hình và tỷ suất lợi nhuận của các phòng thí nghiệm này là bao nhiêu. Nhưng điều thực sự khó để lập mô hình là tốc độ sử dụng và áp dụng.

Chúng tôi đã đưa ra một số dự đoán rất tích cực cho tháng 2 vào tháng 1 và Anthropic đã dễ dàng đánh bại chúng. Vậy làm cách nào để hiệu chỉnh mô hình này? Nên sử dụng nguồn dữ liệu nào? Đến tháng 2, chúng tôi đã đưa ra những giả định rất tích cực cho tháng 3 và chúng lại bị vượt quá. Khi mọi người nhìn thấy con số "doanh thu mới 10 tỷ USD", phản ứng của họ là: Chuyện gì đang xảy ra vậy? Làm thế quái nào mà họ lại có thêm 10 tỷ USD doanh thu mới? Ai đang sử dụng các token này? Tại sao sử dụng nó? Chính xác thì họ đang xây dựng cái gì với những token này? Quan trọng hơn, làm thế nào để những thứ họ xây dựng bằng những token này lan tỏa vào nền kinh tế? Bao nhiêu giá trị đã được tạo ra?

Đây không phải là điều có thể dễ dàng nắm bắt được bằng số liệu thống kê GDP. Ví dụ: tất cả giá trị tôi tạo bằng mã thông báo cuối cùng sẽ được chuyển đổi thành thông tin tốt hơn. Sau đó, tôi bán thông tin đó và bán nó với giá thấp hơn giá mà người khác đã bán trước đây.

Thông tin này sau đó sẽ đi vào toàn bộ hệ thống kinh tế, cho phép mọi người đưa ra quyết định đầu tư tốt hơn hoặc quyết định cạnh tranh tốt hơn. Ví dụ: nếu họ là một công ty bán dẫn, một công ty trung tâm dữ liệu hoặc một công ty siêu quy mô thì giá trị của thông tin này là bao nhiêu? Nó đã có tác động gì đến nền kinh tế?

Theo bất kỳ thước đo chủ quan nào, điều này rõ ràng là đáng kinh ngạc. Nhưng câu hỏi đặt ra là “GDP ma” ở đâu? GDP ảo chính xác là gì? Làm thế nào để chúng ta theo dõi giá trị kinh tế thực sự?

Bởi vì các chỉ số GDP hiện tại không chính xác. Nếu bạn hỏi Dylan Patel rằng anh ấy đã tạo ra bao nhiêu GDP, thì đó sẽ là một con số rất nhỏ và hoàn toàn không tỷ lệ thuận với giá trị mà tôi nghĩ anh ấy thực sự đã tạo ra.

Vì vậy, câu hỏi cuối cùng là: Những mã thông báo này tạo ra bao nhiêu giá trị? Không chỉ đơn giản nhìn vào doanh thu trực tiếp mà còn nhìn vào những tác động dây chuyền mà chúng mang lại. Tác động tiếp theo của tất cả những việc họ đã làm là gì?

Tôi nghĩ đây là vấn đề thực sự và là thách thức khó đo lường nhất. Tôi nghĩ chúng tôi đã có đánh giá rất tốt về phía nguồn cung. Chúng tôi cũng có những đánh giá rất tốt về nhiều tín hiệu từ phía cầu. Nhưng giá trị mà những token này tạo ra rất khó định lượng và đo lường. Tôi ước chúng ta có thể nói chuyện này ba tháng một lần vì mọi thứ đang thay đổi quá nhanh.

Các cuộc biểu tình chống AI có thể nổ ra trong vòng ba tháng

Patrick O'Shaughnessy:

Vậy bạn nghĩ điều gì sẽ xảy ra tiếp theo? Ví dụ, nếu tôi đến San Francisco để gặp lại bạn sau ba tháng nữa, bạn mong đợi sẽ thấy điều gì?

Dylan Patel:

Các cuộc biểu tình rầm rộ.

Patrick O'Shaughnessy

Biểu tình chống lại AI? Bắt đầu nói chuyện.

Dylan Patel

Mọi người ghét AI. AI hiện nay thậm chí còn kém phổ biến hơn ICE và kém phổ biến hơn các chính trị gia. Tôi không biết Pew thực hiện các cuộc khảo sát như thế nào, nhưng có vẻ như AI ít phổ biến hơn các chính trị gia.

Khi Anthropic tăng thêm nhiều doanh thu, nó sẽ bắt đầu tạo ra những thay đổi trong hoạt động kinh doanh ở cấp dưới. Mọi người sẽ ngày càng sợ AI. Họ sẽ bắt đầu đổ lỗi ngày càng nhiều về các vấn đề của chính họ, cũng như nhiều vấn đề sâu sắc, lâu đời trên toàn cầu, cho AI.

Những vấn đề này sẽ xuất hiện và sau đó được quy cho AI. Rất có khả năng một số chính trị gia, người dùng mạng xã hội hoặc những người có ảnh hưởng sẽ bắt đầu vũ khí hóa AI và sử dụng nó để tấn công người khác.

Hãy đọc bình luận bên dưới một số bài báo. Cocktail Molotov đã được ném vào nhà Sam Altman hai lần trong hai tuần và ai đó đã thực sự cổ vũ trong phần bình luận. Đây chỉ là sự khởi đầu. Vì vậy tôi nghĩ trong vòng ba tháng chúng ta sẽ chứng kiến những cuộc biểu tình rầm rộ chống lại AI.

Patrick O'Shaughnessy:

Lực đối kháng là gì? Ngành công nghiệp AI nên ứng phó trước như thế nào?

Dylan Patel:

First of all, Sam Altman and Dario should stop giving interviews. They are so impersonal. I don't know what they are doing. Every interview makes the average person hate them more. Sam Altman's appearance on Tucker Carlson's show, for example, might make all Republicans hate OpenAI even more. The same goes for Dario. They really have no charm. This is the first point.

Second, they need to start showing the positive, inspiring things AI can do.

Third, they need to stop talking about how AI capabilities will change the world. Because when people hear about this ability, they just feel scared. Especially when they don’t have any real connection to the technology.

Patrick O'Shaughnessy

They don't know how to use it.

Dylan Patel:

And they have no connection to it. The average person doesn’t know the people at Anthropic, and they don’t know the people at OpenAI. Ordinary people have no idea who these people are or what their goals are. They just see these companies as some sort of sneaky cabal: a few thousand people working together to change the world, automate all jobs, and destroy society. That's how it looks to many people.

Plus, these companies are funding and promoting the construction of massive data centers and power plants that the public sees as polluting the world. People don't really understand what's going on. So these companies have to stop talking about the “big changes that are going to happen in the future” and just talk about the present: how AI can have a positive impact today. I think this requires a huge organizational reshaping and rebranding.

Patrick O'Shaughnessy:

I love having this conversation with you. Cảm ơn bạn đã dành thời gian.

Dylan Patel:

Great, thank you.

Video link

Trong thời đại AI, sự suy diễn cuối cùng của cuộc chiến cung cầu Token

TL; DR

Văn bản gốc của cuộc phỏng vấn:

Claude Code đã trở thành lực lượng lao động mới

Mã thông báo trở thành một phương tiện sản xuất mới

Robot sẽ bắt kịp làn sóng nhu cầu tiếp theo

Sự thiếu hụt năng lượng tính toán được truyền đến toàn bộ chuỗi ngành

Giá trị của AI khó đo lường bằng GDP

Các cuộc biểu tình chống AI có thể nổ ra trong vòng ba tháng

Artikel Terkait

U.S.S.S.S.D. News

Dekat TGE, MegaETH Eco- Defi emas menggali panduan

Ketika Agen AI mengambil alih rantai otoritas: Seberapa jauh paradigma keuangan baru dari Web 4.0

Untuk 3 juta cedera tulang belakang, dia meretas kursi roda

Produk

Hukum & Dukungan

Tautan Teman