Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

Tác giả: Wang Jianshuo

Vào ngày 6 tháng 3 năm 2023, không lâu sau khi ChatGPT ra mắt và GPT-4 vẫn chưa được phát hành, Sarah và tôi đã có buổi phỏng vấn về ChatGPT - Traders' Số thứ ba của Talk "Vernacular Series" (http://www.w3.org/1999/xhtml"}]">Podcast ChatGPT là đã phát hành, chào mừng bạn đến nghe).

Vào thời điểm đó, ChatGPT mới ra mắt cách đây không lâu và có rất ít người thực sự bắt đầu sử dụng nó. Cuộc phỏng vấn kéo dài ba giờ này đã được treo trong vũ trụ nhỏ kể từ đó. Số 1 trong hạng mục ChatGPT. Tôi đưa ra khoảng hai mươi phán đoán và dự đoán trong một hơi thở, tất cả đều dựa trên trực giác và thông tin hạn chế, không có dữ liệu. Bản ghi nguyên văn đầy đủ của cuộc phỏng vấn vào thời điểm đó vẫn có sẵn trên tài khoản công cộng.

Bây giờ là cuối tháng 5 năm 2026. Ba năm đã trôi qua và hồi đó AI đã phát triển thành một thứ không thể tưởng tượng được.

Tôi muốn làm một điều: lần lượt lấy ra hai mươi mục từ năm đó và sử dụng dữ liệu mới nhất hiện nay để đối chiếu các tài khoản một cách khách quan. Tôi có thể thấy rõ thế giới đã trở nên như thế nào trong ba năm qua, và tôi cũng có thể thấy rõ mình đã đi đúng hướng ở đâu và tôi đã sai ở đâu về con người của mình ba năm trước.

Để đảm bảo khách quan nhất có thể, tôi chỉ cần giao bản đối chiếu này cho AI: Tôi đã ném bản ghi nguyên văn của các cuộc phỏng vấn vào một quy trình làm việc và để nó lên lịch. 41 đặc vụ Opus 4.8 đầu tiên phân tích từng cái một hai mươi phán đoán, sau đó tìm kiếm dữ liệu mới nhất trên mạng, xác minh chéo từng cái và cuối cùng cho điểm cho Wang Jianshuo ba năm trước. Nhóm đại lý này đã dành khoảng 20 phút và đốt 1,4 triệu mã thông báo (tương đương khoảng 35 USD) để tạo báo cáo sau. Sự phán xét đến từ họ, không phải tôi. Ngày cơ sở được ấn định là tháng 5 năm 2026.

1. Bảng điểm

Biểu tượng phán đoán: ✅ Đúng · Hầu hết đúng · Đúng một phần · ❌ Sai

Nhìn thoáng qua, hầu hết các hướng đi chung của Wang Jianshuo hồi đó đều đi đúng hướng. Chỉ có một lỗi tính toán thực sự - chuyển GPT-4 dưới dạng tham số 100T. Nhưng ma quỷ ẩn giấu trong các chi tiết: đằng sau hầu hết mọi cái "đúng", có một cái đuôi chưa được xác định vào thời điểm đó. Không có mục nào trong số 20 mục hoàn toàn là "vẫn chưa chắc chắn". Ba năm là đủ dài và hầu hết mọi việc đều có câu trả lời đầy tính dự kiến. Chi tiết dưới đây trong nhóm.

2. Bạn đã hiểu đúng

Điểm chung của nhóm này là định hướng, Cơ chế, thậm chí cả nhịp điệu thời gian mà Vương Kiến Sóc đánh giá hồi đó đều ổn, sai sót duy nhất là ở “mức độ” và “cách diễn đạt tuyệt đối”.

RAG và kiến trúc truy xuất (chế độ xem 2, 3)

> Năm 2023, Wang Jianshuo cho biết: Phương pháp chủ đạo để giải quyết vấn đề về kiến thức và ảo ảnh không phải là thay đổi mô hình mà là sử dụng truy xuất vectơ để đổ kiến thức vào đó dưới dạng "bảng gian lận"; kiến trúc chính xác là để công cụ tìm kiếm thực hiện truy xuất và cung cấp kết quả cho LLM.

Đây là tất cả các tiêu chuẩn thực tế về AI ngày nay dành cho sản phẩm. RAG đã trở thành kiến trúc mặc định cho AI doanh nghiệp và OpenAI, Google và Anthropic đều đã biến nó thành một khả năng cấp nền tảng; ChatGPT Search theo nghĩa đen có nghĩa là "tìm kiếm đầu tiên bằng chỉ mục Bing, cung cấp kết quả cho GPT và sau đó tạo câu trả lời bằng dấu ngoặc kép". Tổng quan về Google AI sử dụng nền tảng để đạt được khoảng 2 tỷ người dùng hoạt động hàng tháng và Perplexity, một công ty chỉ dựa vào kiến trúc này, đã được định giá khoảng 20 tỷ USD.

Trong GPT-4 Trước khi nó được phát hành và ngành mặc định là "đưa kiến thức thông qua tinh chỉnh", anh đặt cược vào "không di chuyển các tham số mô hình và truy xuất trình cắm", cơ chế và thời gian đều đúng.

Điều cần thành thật mà nói là: anh ấy đã hình dung ra một "truy xuất tĩnh một lần", nhưng thực tế phức tạp hơn - bối cảnh dài, GraphRAG, tác nhân thu hồi Hãy đến và tăng cường. Cuộc tranh luận “RAG đã chết” vào năm 2026 chỉ chứng tỏ rằng phương hướng chung vẫn chưa chết. Nó chỉ từ chối "truy xuất một lần đơn giản". Kết luận là nâng cấp lên truy xuất kết hợp thay vì quay lại và thay đổi các tham số mô hình. Một điểm khác: thuật ngữ RAG đã được đề xuất trong bài báo Meta năm 2020 và anh ấy không phải là người đầu tiên làm như vậy - anh ấy chỉ đặt cược vào việc nó sẽ trở thành xu hướng chủ đạo trong thời kỳ cửa sổ.

LUI là Thế giới mới (Chế độ xem 7)

> Vào năm 2023, Wang Jianshuo cho biết: Điều tuyệt vời nhất về ChatGPT không phải là AIGC, mà là việc mở LUI (giao diện người dùng ngôn ngữ tự nhiên), sẽ tái tạo lại tương tác giữa con người và máy tính giống như GUI đã làm trước đây, khai sinh ra một ngành công nghiệp mới lớn hơn nhiều so với chính "mô hình lớn".

"New World" gần như hoàn hảo. Ngôn ngữ tự nhiên đã trở thành lớp tương tác được công chúng thống trị (ChatGPT có 900 triệu người dùng hàng tuần) và đã tạo ra một ngành độc lập mới - các lớp tác nhân, tác nhân mã hóa và giao thức đều được hiện thực hóa. Câu nói cụ thể nhất “lớn hơn rất nhiều so với chính mô hình” đã được khẳng định một cách mạnh mẽ: giao thức MCP đã trở thành “tiêu chuẩn hệ điều hành” trong kỷ nguyên LUI. Nó sẽ được OpenAI, Google và Microsoft áp dụng hoàn toàn vào năm 2025 và sẽ được chuyển sang Linux Foundation vào cuối năm nay; Sản phẩm duy nhất của Claude Code đã đạt doanh thu hàng năm khoảng 2,5 tỷ USD.

Nhưng anh ấy đã sử dụng cách diễn đạt mạnh mẽ là "tái thiết và thay thế GUI". Ba năm sau, hóa ra đó là lớp phủ và cùng tồn tại, không thay thế. Ba loại phản ví dụ đều rất khó: Báo cáo của MIT cho thấy 95% phi công GenAI của doanh nghiệp không có ROI có thể đo lường được; mô hình tác nhân sử dụng máy tính hàng đầu với giao diện thao tác trực tiếp chỉ đạt khoảng 78% trên bộ thử nghiệm vừa chạm đến mức cơ bản của con người; phần cứng ngôn ngữ thuần túy loại bỏ màn hình gần như đã bị xóa sổ (Humane Pin sẽ ngừng hoạt động vĩnh viễn vào năm 2025). Một tuyên bố chính xác hơn là: LUI là lớp tương tác mới được đặt trên GUI.

Mạng robot và địa chỉ mới (Chế độ xem 9)

> Năm 2023, Wang Jianshuo cho biết: "Robot Networks" sẽ xuất hiện trong khoảng mười năm nữa - các đại lý tự động bắt tay và gọi điện cho nhau bằng ngôn ngữ tự nhiên, không còn yêu cầu API truyền thống; một hệ thống đánh địa chỉ tên miền mới sẽ ra đời. Bộ đồ này "có thể hoàn thành trong hai hoặc ba năm."

Hướng đi này diễn ra tốt một cách đáng ngạc nhiên. MCP và A2A (đã được tặng cho Quỹ Linux và được hơn 150 tổ chức hỗ trợ) giải quyết vấn đề điều chế tác nhân; Ông nói, Giao thức mạng đại lý trực tiếp dựa trên DID của W3C để thực hiện "việc xác định địa chỉ tác nhân mà không cần cơ quan trung ương" và nhằm mục đích "hàng tỷ mạng cộng tác đại lý" - có tính đồng hình cao với "hệ thống tên miền mới".

Có hai điều cần phải sửa: Thứ nhất, "API không còn cần thiết nữa" là không đúng. Lớp dưới cùng của các giao thức chính thống là lược đồ có cấu trúc, về cơ bản là một lớp tiêu chuẩn được xếp chồng lên nhau trên các API; thứ hai, “hoàn thành trong hai hoặc ba năm” vẫn chưa được thực hiện. Dữ liệu của Gartner cho thấy tính đến năm 2026, chỉ có khoảng 17% tổ chức thực sự triển khai các đại lý. Điều thú vị là anh ấy thực sự đã chia lời nói của mình thành nhiều cấp độ khác nhau vào thời điểm đó - “hai hoặc ba năm” cho nguyên mẫu và “khoảng mười năm” cho sự trưởng thành. Nhịp điệu của nguyên mẫu rất chính xác và chu kỳ trưởng thành thực sự là lớp mười. Nhìn vào hai lớp riêng biệt, lớp này có chất lượng cao hơn vẻ ngoài của nó.

Trung Quốc chắc chắn sẽ có thể tạo ra các mô hình lớn có thể sử dụng được (lượt xem 10 và 20)

> Vào năm 2023, Wang Jianshuo cho biết: Trung Quốc chắc chắn sẽ có thể tạo ra một mô hình lớn có thể sử dụng được và khoảng cách với top đầu sẽ nhanh chóng thu hẹp trong khoảng ba năm (tương tự như trình duyệt Red Flag đang theo đuổi Netscape).

Dòng thời gian này trùng khớp một cách đáng ngạc nhiên. Theo phép đo thực tế của Chỉ số AI Stanford 2026, khoảng cách chuẩn giữa các mô hình hàng đầu của Trung Quốc và Mỹ đã thu hẹp từ 17,5–31,6 điểm phần trăm vào tháng 5 năm 2023 xuống còn Hei,sans-serif;">2,7%; trong khi đầu tư vào AI tư nhân của Hoa Kỳ gấp khoảng 23 lần so với Trung Quốc — thu hẹp khoảng cách bằng khoản đầu tư nhỏ hơn nhiều. DeepSeek, Qwen, Kimi và GLM đã trở thành xu hướng toàn cầu và là cơ hội mở hệ sinh thái nguồn thậm chí còn dẫn đầu

Nhưng từ "nhanh" là lạc quan - sự trưởng thành thực sự xảy ra sau khoảng 14 tháng chứ không phải "vài tháng". Và điều này ràng buộc khả năng sử dụng, không xác định biên giới: tính đến đầu năm 2026, không có mô hình Trung Quốc nào vượt qua OpenAI o3. Trong điểm 20, rõ ràng là anh ta đã sai: phán đoán rằng "cánh cửa sẽ không đóng khi nó được mở" đã bị lật ngược trực tiếp bởi sáng kiến cắt API sang Trung Quốc của OpenAI vào tháng 7 năm 2024. Cánh cửa đã bị nhà cung cấp đóng lại; anh ta đặt tên cho Wen Xin, người đứng đầu, nhưng bị tụt lại phía sau, và những người kế nhiệm thực sự là DeepSeek, Doubao và Qianwen, những công ty lúc đó vẫn còn mờ nhạt

Không có ý thức, bài kiểm tra Turing chỉ kiểm tra sự xuất hiện (xem 13)

> Vào năm 2023, Wang Jianshuo cho biết: ChatGPT không có ý thức và là một cách nói khoa trương "người nói không có ý định và người nghe có ý định"; bài kiểm tra Turing chỉ kiểm tra "liệu nó có khiến bạn nghĩ như vậy hay không tồn tại", chứ không phải liệu nó có thực sự tồn tại hay không.

Đánh giá cốt lõi của "thử nghiệm ngoại hình" là rất ổn định và đã được xác nhận một cách trớ trêu bởi một thử nghiệm: Trong thử nghiệm Turing tại UC San Diego năm 2025, tỷ lệ GPT-4.5 được đánh giá là con người dưới sự nhắc nhở "hành động như một Persona" cao tới 73%, cao hơn so với người thật, nhưng nó hoàn toàn dựa vào kỹ năng thực hiện - đây là chú thích cuối trang hay nhất về việc "chỉ kiểm tra xem nó có khiến bạn nghĩ là như vậy hay không".

Điều cần nói thêm là: "Máy móc không được có ý thức." Đâykết luận tuyệt đối và mạnh mẽ đã được đưa vào vùng xám trong ba năm qua. Anthropic đã thiết lập một "Model Wellbeing", đưa ra xác suất nhận thức khoảng 15%–20% và trả lại cho Claude. Đã thêm chức năng "chủ động kết thúc các cuộc hội thoại bị lạm dụng". Điều này biến "không bao giờ" thành "xác suất thấp nhưng không thể loại trừ". hơn "đã được chứng minh". Phần lõi chưa bị đảo ngược, nhưng âm thanh lúc đó quá đầy đủ

Các phần còn lại đều đúng (lượt xem 6, 11, 12, 16, 18, 19)

Không phải AGI mà là một bước tiến lớn
: Đứng ở cả hai đầu. Bản thân Altman vẫn nói ở thời GPT-5 rằng "đó không phải là AGI và thiếu sự học hỏi liên tục", đồng thời, huy chương vàng IMO và ARC-AGI đã tăng vọt từ gần 0 lên 85%, tức là "một bước tiến lớn" không cần bàn cãi
Sẽ không có làn sóng thất nghiệp
: Tỷ lệ thất nghiệp ở Mỹ vào tháng 4 năm 2026 chỉ là 4,3%. Điểm mù nằm ở "phân phối" - Nghiên cứu của Stanford cho thấy những người bị loại bỏ chính xác là những người trẻ mới đến 22-25 tuổi lúc đầu cơ chế "hút êm" không thành công đối với họ
Sẽ không bị rác AI tràn ngập
: Định hướng về phúc lợi ròng là đúng, nhưng ông đã đánh giá thấp tầm quan trọng - Nội dung AI đã chiếm khoảng 52% số trang web mới và "AI trượt" đã trở thành từ của năm.
Năm khởi nghiệp
: Ở bước ngoặt bên phải của làn sóng, xAI (thành lập vào tháng 3 năm 2023) đã đạt mức định giá 230 tỷ. Nhưng ông đã khóa "các công ty lớn" vào năm 2023, vốn quá hẹp - OpenAI và Anthropic, hai công ty này thực sự là những công ty cấp nghìn tỷ, được thành lập trước đó
Khoảnh khắc trình duyệt 1994
: Xếp hạng tương đối chắc chắn, OpenAI thực sự đã ra mắt trình duyệt Atlas vào năm 2025, biến phép ẩn dụ thành hiện thực theo nghĩa đen. Chỉ là ChatGPT lan truyền mạnh mẽ hơn các trình duyệt nên phép ẩn dụ mang tính bảo thủ.
nhắc nhở Thêm dữ kiện để giảm ảo ảnh
: Hướng đã được xác nhận. Tỷ lệ ảo giác của GPT-5 tăng vọt lên 47% khi mạng bị ngắt kết nối và không có truy xuất. Xác nhận ngược lại "sự thật" là biến chính. Người ta chỉ đánh giá thấp rằng nguyên nhân cốt lõi là động lực đào tạo, không nhắc nhở

3. Đọc sai, đọc sai

GPT-4 có tham số 100T (điểm 4) - hoàn toàn sai

> Vào năm 2023, Wang Jianshuo cho biết: (tin đồn) GPT-4 là thông số 100T, lớn hơn khoảng 600 lần so với 175B của GPT-3.

Cả hai con số đều sai. GPT-3 là 175B, và ước tính tốt nhất bị rò rỉ vào tháng 7 năm 2023 là GPT-4 là khoảng 1,8T, 16 MoE của chuyên gia, chỉ khoảng 10 lần Sự khác biệt giữa 100T và thực tế là khoảng 55 lần. câu "xấp xỉ" vào năm 2021. Sam Altman đã tố cáo biểu đồ so sánh là "hoàn toàn nhảm nhí" ngay từ tháng 1 năm 2023.

Những từ ban đầu của ông được đánh dấu là "tin đồn", giữ lại sự không chắc chắn. Ở cấp độ sâu hơn, bản thân khuôn khổ "đo thế hệ theo bội số tham số" đã lỗi thời: GPT-4.5 và GPT-5 sau này của OpenAI đơn giản là không còn tiết lộ số lượng tham số nữa. Điều này là lỗi nghiêm trọng duy nhất khi các con số bị sai và phối cảnh đã lỗi thời

Toán học LLM (Chế độ xem 1) - Chẩn đoán đúng, kết luận giới hạn là sai

> Năm 2023, Wang Jianshuo cho biết: Sự khác biệt trong toán học trong LLM là bản chất. Để nó tự học toán là không thể và cũng không cần thiết. Cách đúng là sử dụng các công cụ plug-in.

"Tuyến đường chẩn đoán cộng với công cụ" hoàn toàn đúng - nguyên nhân cốt lõi là việc tạo từng mã thông báo dẫn đến mang theo không đáng tin cậy (bài viết về cơ chế năm 2025 đã xác nhận chính xác trực giác rằng "bit cuối cùng luôn đúng và bit giữa là misaligned"); sự cải tiến của các công cụ plug-in cũng rất lớn (khi o4-mini cho phép sử dụng Python, AIME 2025 đạt 99,5%).

Sai lầm nằm ở cách viết hoa của từ "không thể và không cần thiết". "Không thể" có thể bị làm sai lệch - Vào tháng 7 năm 2025, các mô hình Gemini Deep Think và OpenAI đã giành huy chương vàng tại IMO bằng ngôn ngữ thuần túy tự nhiên và không cần công cụ. bước ngoặt quan trọng là "mô hình suy luận" sẽ chỉ xuất hiện vào năm 2024–2025, không thể đoán trước được vào tháng 3 năm 2023 - vì vậy dự đoán này nên được đánh giá dựa trên mức độ chấp nhận hơn là thời gian

Nắm bắt giá trị (Chế độ xem 8) - Đặt cược đúng một nửa, khẳng định cốt lõi là sai

> Vào năm 2023, Wang Jianshuo cho biết: Giá trị cuối cùng sẽ rơi vào lớp ứng dụng và các công ty (nhà sản xuất mô hình) tạo ra lớp cơ bản cuối cùng có thể không nhất thiết phải kiếm tiền.

Tiền thực sự đã bắt đầu chảy vào ứng dụng. lớp (Con trỏ đã đạt được 2 tỷ doanh thu hàng năm trong ba năm) - điều này đúng một nửa. Tuy nhiên, "làm lớp cơ bản là không có lãi" đã bị NVIDIA trực tiếp làm sai lệch: lợi nhuận ròng năm tài chính 2026 là khoảng 120 tỷ USD, vốn hóa thị trường là 5 nghìn tỷ +, đây là lớp duy nhất giành được lợi nhuận lớn trên toàn thị trường (mức lỗ dự kiến của OpenAI vào năm 2026 là khoảng 14 tỷ) gần giống như những gì ông ấy đã làm. nói là “lớp cơ bản đốt tiền nhưng không kiếm được tiền”.

Anh ấy không phân biệt giữa "lớp cơ sở sức mạnh máy tính" và "lớp cơ sở mô hình", cũng như không phân biệt giữa "doanh thu" và "lợi nhuận". Giá trị sẽ được lớp điện toán nắm bắt ở mức độ thậm chí còn lớn hơn vào năm 2026 so với năm 2023, thay vì được chuyển sang lớp ứng dụng. Một điều cần nói thêm: Chính nhà máy đám mây mua chip là người thua lỗ, chứ không phải Nvidia bán chip - đây chính xác là điểm tương tự "xây dựng trên đường sắt" của anh ấy bị đặt sai chỗ. chiều cao dòng: 2; họ phông chữ: 'PingFang SC', 'Helvetica Neue', Helvetica, Arial, 'Hiragino Sans GB', 'Heiti SC', 'Microsoft YaHei', 'WenQuanYi Micro Hei', sans-serif; căn chỉnh văn bản: căn chỉnh; độ dày phông chữ: kế thừa; word-break: break-all;">Bản quyền (Xem 14) - Đăng ký đúng, tránh sai sót vi phạm

> Vào năm 2023, Wang Jianshuo cho biết: Nội dung do AI tạo ra có thể lách bản quyền (bảo vệ biểu hiện nhưng không bảo vệ ý tưởng); các sản phẩm được tạo ra không được vi phạm hoặc không được đăng ký.

"Không thể đăng ký" đã trở thành một established legal fact (in 2025, the U.S. Copyright Office made it clear that "merely entering a prompt word is not sufficient to claim authorship"). But "avoiding infringement" is clearly wrong: courts have repeatedly held that AI output still constitutes infringement if it is substantially similar to the original work; Anthropic was sued for piracy of corpus15 Billion dollarsThe settlement is the largest copyright compensation in U.S. history. Not only did AI fail to “circumvent” copyright, it actually paid the highest price in history.

World Harmony (View 15) - The mechanism is right, the trend is wrong

> In 2023, Wang Jianshuo said: ChatGPT uses a "weighted average" of human opinions, which can combat the Douyin-style information cocoon and gives the possibility of "universal world".

The mechanism is correct - multiple studies in 2025 have conclusively confirmed that LLM presses the views of the majority and systematically underestimates the minority. But social judgment turned the tables: What he added by himself, "At least now it is not the same for thousands of people," was overturned within three years - OpenAI will make cross-conversation memory and personalization a default capability starting from April 2025. Hei,sans-serif;">AI is reaching thousands of peopleat a high speed. More importantly, he imagined the "weighted average" as a neutral common denominator of the world, but in actual measurement it is a directional shift, with flattery added to it, and can be used to actively manipulate positions - this points to "creating a new cocoon" rather than "dissolving polarization".

Local wars and costs (View 17) - Qualitative, quantitative falsification

> In 2023, Wang Jianshuo said: Making larger models will quickly become a "local war". The cost is known (the cap is about US$500-1 billion after detours are removed), and many players will enter.

The qualitative direction is astonishingly correct - a large influx of players, rapid commercialization, open source equaling closed source, all fulfilled. But the hard figure of "500-100 million cap" is wrong on both ends: the cutting-edge end is seriously underestimated (GPT-5 level training will reach 200-500 million US dollars in 2026, superimposed on 100 billion-level data centers and 500 billion Stargate); the replica side is overestimated (DeepSeek has reduced the marginal training cost to one million US dollars). The "cost" of the same model can vary by 200 times depending on the caliber, but it is not within the range he gave.

Emergent ability (view 5) - right direction, wrong numbers and framing

> In 2023, Wang Jianshuo said: About 60B parameters and above appear new capabilities that are not in the original corpus and that researchers cannot explain.

Directional intuition is established, but two statements are untenable: First, there is no unified "60B threshold"-the real threshold of the thinking chain is about 100B, and different abilities appear on a scale ranging from 13B to 540B; secondly, "unexplainable" was reported by a NeurIPS article at the end of 2023 Outstanding Paper Challenge - Many "mutations" are artifacts caused by the selection of evaluation indicators. After changing to continuous indicators, the curve is smooth and predictable. To be fair, what he was retelling at that time was an absolutely mainstream narrative. What can really be corrected is to use "60B" as a hard threshold and "unexplainable" as a qualitative conclusion.

Looking back in four or three years, several rules

After checking the accounts one by one, I took a step back and saw that Wang Jianshuo's twenty judgments contained several rules that were more worthy of being written down than any single one.

1. Direction is far more reliable than numbers and degrees. Among the twenty items, almost all of them that judged the mechanism and direction (RAG, LUI, robot network, Turing test) were successful; those that gave specific numbers or capping words (100T parameters, 60B threshold, 500-1 billion cost, mathematical "impossibility"), almost all of them were wrong. For rapidly changing fields, bet on direction and mechanism, bet less on precise numbers, and be wary of catchy words like “impossible, certain, capped, and never”—they are areas prone to being slapped in the face by time.

2. In terms of time, he tends to overestimate the speed and underestimate the degree. Those who say "complete it quickly, in two or three years" generally have a slower maturity period; but they underestimate the ceiling of capability jump - mathematics can go from "impossible" to IMO gold medals, and cutting-edge costs can rise to levels unimaginable back then. In a word: too optimistic in the short term and too conservative in the long term.

3. The most hidden mistake repeatedly occurs in "distribution". It’s not that the direction is wrong, it’s that we only look at the total amount and ignore the distribution. "There will be no unemployment wave" is correct, but the damage is highly concentrated among young newcomers; "Value falls on the application layer" is half correct, but there is no distinction between the computing power layer and the model layer. The total amount is correct, covering up the distribution disaster-This is the most important lesson.

4. Where there is room for words, it will stand the test three years later. "Rumors", "At least for now", "Significantly reduced but not eliminated", "Two or three years in embryonic form, and about ten years in maturity" - all judgments that were made with qualifiers and hierarchies back then are more tenable looking back today. On the contrary, it is the absolute sentences that are blurted out, which are most likely to overturn. Half of the honesty of prediction lies in the courage to speak out, and the other half lies in the courage to mark one's uncertainty.

5. For some problems, three years is simply not enough. Who does the value ultimately belong to, whether emergence is a real change, whether the machine has any consciousness, whether the long context will eat RAG - these debates back then will still be debates in 2026. Being able to distinguish between "things that already have answers" and "things that still have to wait" is more important than rushing to draw conclusions about everything.

Wang Jianshuo three years ago, intuitively pointed in twenty directions in the fog before GPT-4 came out. After checking the accounts today, perhaps the most important sentence to remember is: It is not that difficult to see the general direction in the right direction. What is difficult is to admit that you have taken the numbers, speed and distribution for granted again and again. These twenty accounts are not so much a score for the past as they are a few rules for the next three years. Let’s do it right again in the next three years, 2029.

Ba năm sau: Nhìn lại nhận định của tôi về ChatGPT vào năm 2023

1. Bảng điểm

2. Bạn đã hiểu đúng

3. Đọc sai, đọc sai

Looking back in four or three years, several rules

Artikel Terkait

Tiga tahun kemudian: kembali pada tahun 2023, penilaian saya pada ChatGPT

Mengapa lebih banyak agen AI tidak sama dengan produktivitas yang lebih tinggi

Graysdale peneliti: 14 kali rasio, berapa banyak ruang yang ada untuk tanda Robinwood

Korea enkripsi transfer daya pasar: keuangan tradisional menangkap entri aset digital

Produk

Hukum & Dukungan

Tautan Teman