Di era AI, pertarungan utama Token antara penawaran dan permintaan

Judul video: The Super and Demand of AI Tokens ¡D Dylan Patel Wawancara

Video karya Invest Seperti yang Terbaik

Foto oleh Peggy Block Beats

Editor techadors tekan: Terhadap latar belakang lompatan berkelanjutan dalam kapasitas model AI, akses besar-besaran alat seperti Claude Code dan Cursor ke perusahaan, diskusi industri beralih dari "bagaimana model kuat" ke "bagaimana model yang baik masuk ke produksi". Namun ketika pemrograman AI, analisis otomatis dan pemodelan data muncul sebagai konsensus baru, pertanyaan dasar mulai muncul: ketika biaya implementasi didorong dengan cepat ke bawah, adalah kelangkaan nyata dari tenaga kerja, modal atau akses ke model perbatasan dan token

Kiri untuk Patrick O'Shaughtnessy, tepat untuk Dylan Patel

Jabatan ini diorganisir oleh Patrick O'Shaughtnessy dalam percakapan dengan Dylan Patel, pendiri SemiAnalisis. Dylan telah lama fokus pada AI Infrastructure, Semiconductor Supply Chain and Model Economics, sebuah dialog di mana ia membahas bagaimana AI dapat mengubah organisasi perusahaan, layanan informasi, permintaan token, rantai pasokan komputasi, dan sentimen sosial, mulai dari firmanya sendiri Claude Code ' s melonjak pengeluaran。

Apa yang paling menarik dari percakapan ini bukanlah bahwa model sedang diperbarui lagi, benchmark, tetapi menyediakan cara untuk memahami ekonomi AI — untuk melihat AI sebagai sistem produksi yang merealisasikan kapasitas implementasi, efisiensi organisasi dan keuntungan industri, bukan hanya peningkatan perangkat lunak。

Perbincangan ini dapat dipahami secara kasar dari lima sudut。

Pertama, biaya implementasi rusak。 Pada masa lalu, ide - ide tidak langka, dan yang benar - benar sulit adalah mengubahnya menjadi produk, sistem, dan barang - barang. Sekarang, Claude Code, yang memungkinkan staf non-teknik untuk menulis kode, menerapkannya, dan melakukan analisis data, akan membutuhkan tim pemeliharaan jangka panjang, dimulai dengan beberapa menggunakan model. Pengeluaran tahunan Claude Code dalam Semianalis telah mencapai $7 juta, lebih dari seperempat dari pengeluaran gajinya, yang berarti bahwa AI bukan lagi hanya alat efisiensi tetapi berubah menjadi modal produksi baru untuk perusahaan。

Kedua, industri jasa informasi pertama kali ditulis ulang。 bisnis Dylan pada dasarnya adalah penjualan analitis, penasihat dan set data, yang merupakan area yang paling mudah dikomodifikasi oleh AI. Analisis terbalik Chip verse, pemodelan grid energi, indikator makroekonomi, yang mungkin membutuhkan masukan tim jangka panjang di masa lalu, sekarang dapat digunakan oleh beberapa orang untuk membangun produk yang tersedia dalam beberapa minggu. Ini berarti bahwa tekanan AI pada ISP tidak "akan menggantikan?" Ini "yang dapat kembali-menguasai lebih cepat." Perusahaan-perusahaan yang tidak menggunakan AI akan dikomodifikasi lebih cepat, sementara yang menggunakan AI harus terus-menerus menaikkan standar untuk menghindari digantikan oleh pesaing berikutnya yang lebih efisien。

pada tingkat yang lebih dalam, token menjadi sumber produksi baru。 digunakan untuk membeli langganan perangkat lunak, isu sentral adalah apakah alat tersebut bekerja dengan baik; sekarang, hak akses model garis depan, batas tarif, kontrak perusahaan dan anggaran token mulai menentukan kapasitas produksi secara langsung. Model yang lebih kuat tidak selalu berarti biaya yang lebih tinggi, sebagai token yang lebih cerdas mungkin mengambil langkah lebih sedikit untuk melakukan tugas yang bernilai lebih tinggi. Persaingan sebenarnya bergerak dari "yang menggunakan AI" ke "yang mendapat model terkuat dan menggunakan token termahal dalam skenario nilai tertinggi."。

Permintaan ini juga akan terus disalurkan ke seluruh rantai pasokan。 penggunaan token lonjakan dan akhirnya menjadi tekanan konstan pada pengeluaran modal GPU, CPU, memori, FPGA, PCB, balok tembaga, peralatan semikonduktor dan penggilingan kristal. Ini adalah logika di balik referensi untuk cambuk cambuk "cow effect": hilir, tampaknya, hanya model yang telah meningkatkan permintaan untuk panggilan, tetapi dapat ditransmisikan hulu ke dalam perintah, ekspansi produk dan kenaikan harga yang diperbanyak. AI AI ' s distribusi laba dalam industri oleh karena itu tidak terbatas pada perusahaan model dan NVIDIA, tetapi terus tumpah sepanjang rantai pasokan semikonduktor dan pusat data。

Dan akhirnya, rebound sosial AI bisa datang lebih awal. Kekhawatiran publik mengenai penggantian pekerjaan, konsumsi energi, perluasan pusat data dan konsentrasi kekuasaan akan naik secara bersamaan saat AI memasuki aliran kerja. Dylan bahkan meramalkan protes besar-besaran terhadap AI dalam waktu tiga bulan. Untuk perusahaan model, terus menekankan bahwa "AI akan mengubah dunia" tidak selalu meredakan kekhawatiran, tetapi lebih mungkin memperkuat imajinasi orang biasa tentang kehilangan kendali. Industri AI kemudian perlu membuktikan bukan hanya kemampuan teknologinya saja, tetapi bagaimana menciptakan nilai-nilai publik yang konkret dan dipersepsikan saat ini。

Sekarang ini, isu inti AI bergerak dari "apa model dapat melakukan" kepada " siapa yang dapat mengakses model, bagaimana mereka dapat digunakan, dan siapa yang dapat menangkap nilai yang diciptakan oleh model." Dalam pengertian ini, subjek diskusi ini bukan hanya Claude Code, Anthropic atau sebuah perusahaan AI, tetapi lebih merupakan pengurutan ulang struktural di sekitar produktivitas, pengeluaran modal, efisiensi organisasi dan penerimaan sosial。

Berikut ini adalah teks asli (untuk memudahkan pembacaan dan pemahaman, teks asli telah dikonsolidasikan):

♪ TL;DR ♪

• VARIABEL INTI AI BERGERAK DARI "DAPAT ATAU TIDAK" KE " NILAI TIDAK LAYAK DILAKUKAN," DAN KELANGKAAN NYATA DARI BIAYA IMPLEMENTASI ADALAH IDE BERNILAI TINGGI YANG DAPAT DISKALAKAN OLEH MODEL。

Claude Code menghabiskan 25 persen biaya gaji hanya untuk memulai, AI bergerak dari perangkat lunak ke modal produksi perusahaan baru。

• kompetisi untuk model garis depan bukan lagi hanya kompetisi untuk kapasitas, melainkan kompetisi untuk hak token; hambatan bisnis baru mungkin diciptakan oleh mereka yang dapat memperoleh model terkuat lebih awal dan lebih mantap。

• INDUSTRI JASA INFORMASI AKAN PERTAMA KALI DISIARKAN ULANG OLEH AI, KARENA BIAYA PRODUKSI UNTUK DATA, ANALISIS DAN PENELITIAN JATUH DENGAN CEPAT DAN FIRMA LAMBAT AKAN DIKOMODIFIKASI LEBIH CEPAT。

• Permintaan Token tidak akan melambat karena pengurangan harga model lama, karena setiap model yang lebih kuat melepaskan contoh bernilai tinggi baru dan mendorong pengguna ke arah model maju yang lebih mahal。

• Perubahan terbesar yang dibawa oleh AI bukanlah untuk membuat orang kurang bekerja, tetapi untuk memungkinkan jumlah orang yang sama untuk melakukan beberapa kali hal yang sama; mereka yang tidak dapat menciptakan dan menangkap nilai token akan dikunci pada \"dasar permanen\"。

KEKURANGAN KALKULASI YANG TERSEBAR DI SELURUH RANTAI PASOKAN SEMIKONDUKTOR, DARI GPU, CPU, MEMORI KE PCB, PABRIKAN TEMBAGA DAN PERALATAN, DAN PERMINTAAN AI TELAH MENJADI DORONGAN HARGA UNTUK SELURUH RANTAI INDUSTRI。

Masalah sebenarnya bukan hanya berapa banyak uang yang diperoleh perusahaan model, tetapi berapa banyak "ghost GDP" diciptakan oleh pengambilan keputusan, efisiensi dan efek rantai token。

Penyusun:

Kode Claude menjadi tenaga kerja baru

(Moderator):

kau menceritakan kisah indah tentang perubahan besar timmu tahun ini. bisa kau ulangi? apa yang membuatmu mengerti apa yang terjadi di dunia ini

(SemiAnalisis pendiri):

Tahun lalu, kami pikir kami pengguna berat AI. Semua orang menggunakan ChatGPT, semua orang menggunakan Claude, dan aku memberi tim semua langganan yang mereka inginkan. Pada waktu itu, perusahaan menghabiskan sekitar puluhan ribu dolar。

Tapi tahun ini, pengeluaran mulai melambung. Titik awal sebenarnya mungkin Desember lalu, dengan kemunculan Opus. Ini termasuk Doug, CEO kami Douglas Lawler. Dia pada dasarnya memimpin dalam mendorong non-teknik untuk menulis kode dengan AI. Dia membawa seluruh perusahaan dalam sedikit. Tentu saja, para insinyur sedang digunakan, tapi dari Januari tahun ini, pengeluaran kami jelas naik, dan kemudian pecah cepat。

Kami kemudian menandatangani kontrak dengan Antropik. Terakhir kali saya berbicara dengan Anda, pengeluaran tahunan kami adalah sekitar $ 5 juta; sekarang $ 7 juta。

Kekhawatiran Patrick O:

Dan itu angka minggu lalu。

Apa

Ya, banyak dari itu adalah penggunaan itu sendiri. Apa yang benar-benar menarik adalah bahwa orang-orang yang belum pernah menulis kode sebelumnya sekarang menggunakan Claude Code, dan beberapa orang menghabiskan ribuan dolar sehari. Tapi dalam istilah perusahaan, kita menghabiskan $ 7 juta per tahun untuk Claude Code, dan gaji kita sekitar $ 25 juta. Itu adalah, Claude Code telah menghabiskan lebih dari 25 persen pengeluaran gaji。

JIKA TREN INI TERUS BERLANJUT, BAHKAN MUNGKIN LEBIH DARI 100 PERSEN TOTAL GAJI PADA AKHIR TAHUN. INI SEDIKIT MENAKUTKAN. UNTUNGNYA, SAYA TIDAK PERLU MEMILIH ANTARA "ORANG" DAN "AI" SEKARANG, KARENA PERUSAHAAN BERKEMBANG CEPAT. SAYA TIDAK PERLU MEMPEKERJAKAN ORANG BEGITU CEPAT, TAPI SAYA BISA MENGHABISKAN LEBIH BANYAK UANG UNTUK AI, DAN ITU BERHASIL, DAN PERUSAHAAN BISA TUMBUH LEBIH CEPAT。

Tapi saya berpikir bahwa cepat atau lambat perusahaan lain akan mulai menghadapi masalah: Jika satu orang dapat melakukan lima, sepuluh, atau bahkan 15 pekerjaan dengan Claude Code, apa yang terjadi selanjutnya? Pertama, mungkin ada kebutuhan untuk perampingan; dan kedua, sekarang ada banyak sekali penggunaan seperti itu。

Sebagai contoh, kami memiliki laboratorium rekayasa terbalik di Oregon, yang telah dibangun selama satu setengah tahun. Ada banyak perangkat high-end, seperti mikroskop, mikroskop elektron pemindaian. Kegunaan inti laboratorium adalah chip analisis terbalik, ekstraksi struktur chip dan analisis bahan yang digunakan dalam pembuatannya. Ini juga salah satu data yang kami jual。

Namun, analisis data tersebut telah menjadi proses yang sangat lambat di masa lalu. Sekarang, ada satu orang di tim kami yang hanya ribuan dolar dalam token Claude, dan itu adalah aplikasi. Aplikasi ini dapat mempercepat GPU dan menjalankan server kami di CoreWeave. Kita hanya perlu mengirimkannya gambar chip yang secara otomatis menunjukkan lokasi setiap material pada gambar: Ini tembaga, ini tantalum, ini platinum, ini kobalt. Kemudian Anda dapat melakukan analisis meta terbatas dari seluruh struktur tumpukan chip dengan sangat cepat, dan divisualisasikan, bersama dengan antarmuka grafis lengkap dan dasbor。

Pria ini, yang pernah bekerja di Intel sebelumnya, mengatakan bahwa di masa lalu itu telah menjadi tim lengkap untuk melakukan dan mempertahankan. Luar biasa menempatkan sesuatu seperti itu di perusahaan secara keseluruhan。

Ada contoh lain yang menarik bagiku, adalah Malcolm. Dia seorang ekonom di bank besar. Jurusan ekonomi dari bank itu bisa mencapai 100-200 orang. Dia membuat sesuatu yang menakjubkan sekarang。

IA MEMBAWA DATA TERMASUK DATA FRED, LAPORAN PEKERJAAN DAN SET DATA LAIN DARI API YANG BERBEDA. KAMI JUGA MENANDATANGANI KONTRAK DENGAN BEBERAPA PENYEDIA DATA DAN MENDAPAT AKSES API. DIA KEMUDIAN MENARIK SEMUA DATA DAN MULAI BERJALAN KEMBALI DAN MENGANALISIS EFEK PERUBAHAN EKONOMI YANG BERBEDA PADA INFLASI ATAU DEFLASI DALAM EKONOMI。

Biro Statistik Buruh Amerika Serikat memiliki serangkaian klasifikasi pekerjaan dengan sekitar 2.000 penugasan. Malcolm menggunakan AI untuk menilai tugas mana yang sekarang dapat dilakukan oleh AI, yang tidak dapat, dan yang menunjuk menurut satu set rubric. Hasil tersebut menunjukkan bahwa sekitar 3% dari tugas tersebut sekarang dapat dilakukan oleh AI。

Jadi dia menciptakan indikator untuk mengukur apa yang bisa dilakukan oleh AI dan bagaimana deflasi akan ketika itu dilakukan oleh AI. Keluaran mungkin meningkat, tetapi karena biaya jatuh terlalu banyak, dalam teori PDB mungkin kontrak. Dia menyebutnya "Phantom GDP"。

dia membuat seluruh set analisis berdasarkan konsep ini dan menciptakan model bahasa yang benar-benar baru, benchmark, yang berisi sekitar 2.000 eval。

Kekhawatiran Patrick O:

Dia melakukan semua ini sendirian

Apa

Ya, dia melakukannya sendiri. Dia mengatakan kepada saya, "Saudara, dibutuhkan 200 orang tim ekonom setahun untuk melakukannya." Dia benar-benar di Claude, mengatakan semuanya berubah。

Kekhawatiran Patrick O:

Bagaimana kau mengerti ini? Anda telah pergi dari pengeluaran hampir tidak ada, untuk saat ini hampir 25 persen dari pengeluaran gaji, dan itu masih meningkat. - Tunggu, haruskah aku menginjak rem? Haruskah aku mengontrol biaya?" Mungkin kita tidak harus selalu menggunakan model garis depan yang baru saja keluar hari ini, seperti Opus 4.7, tapi sebaliknya kita bisa beralih ke model yang lebih murah

Apa

Setelah semua, aku dalam bisnis informasi. Kami menjual analisis, kami berkonsultasi, kami membuat set data. Saya tidak melihat alasan mengapa hal-hal ini tidak akan sepenuhnya komersial pada kecepatan yang sangat cepat。

Jika saya tidak terus meningkatkan, produk data pertama yang saya jual pertama, lebih banyak orang sekarang melakukan hal-hal serupa. Kita masih bisa menjualnya karena kita terus melakukannya dengan lebih baik dan lebih baik. Tapi cara kami melakukannya pada tahun 2023, tidak sama dengan cara orang-orang melakukannya sekarang. Jika aku tidak terus meningkatkan standar, aku akan dimodifikasi. Jika aku tidak bergerak cukup cepat, aku akan kehilangan keuntunganku。

JADI MASALAHNYA ADALAH, YA, AI AKAN MENGKOMERSIALKAN BANYAK HAL, SAMA SEPERTI MENGKOMERSIALKAN PERANGKAT LUNAK. NAMUN ORANG-ORANG YANG BERGERAK CUKUP CEPAT UNTUK MENGUASAI HUBUNGAN PELANGGAN, TERUS MEMBERIKAN LAYANAN YANG SANGAT BAIK DAN TERUS-MENERUS MENINGKATKAN LAYANAN MEREKA TIDAK AKAN MENYUSUT, TETAPI AKAN TUMBUH LEBIH CEPAT. MEREKA YANG TIDAK KOMPETEN DAN TIDAK MELAKUKAN APA-APA AKAN KALAH。

JADI ITU SEPERTI MASALAH BERTAHAN HIDUP: JIKA SAYA TIDAK MENGGUNAKAN AI, ORANG LAIN AKAN, DAN KEMUDIAN MEREKA AKAN MENGALAHKAN SAYA。

Contoh sederhana lainnya adalah sektor energi. Kami telah memiliki beberapa analis energi sekitar tahun terakhir mencoba untuk membangun model energi. Model ini sangat kompleks, dan pasar layanan data energi sekitar $900 juta dalam ukuran, jadi jelas pasar besar saya ingin masuk. Namun meskipun beberapa tim kami telah bekerja selama setahun, kami tidak benar-benar dalam bisnis layanan data energi。

Kemudian, Claude Code psikotik. Kita punya orang yang bertanggung jawab atas energi dan industri di pusat data, Jeremy. Setelah ia mulai menggunakan Claude Code, keadaan tiba-tiba berubah. Selama tiga minggu, ia menghabiskan banyak uang, sekitar $600.000 per hari, dan itu benar-benar berlebihan. Namun, ia menangkap setiap pembangkit listrik di Amerika Serikat, setiap jalur transmisi di atas tingkat tegangan tertentu, dan menciptakan peta jaringan seluruh Amerika Serikat dari berbagai sumber data terbuka, dengan akses data samping permintaan yang banyak。

Kami telah membuatnya menjadi dashboard yang memungkinkan kita untuk melihat dan menganalisis kekurangan daya dan surplus di berbagai wilayah mikro Amerika Serikat, serta banyak rincian. Ini akan sampai dalam beberapa minggu。

Kami kemudian menunjukkannya kepada sejumlah pelanggan yang sudah membeli dataset kami, termasuk pedagang energi. Setelah membacanya, mereka berkata, "Wow, berapa lama ini terjadi?" Ini bagus, lebih baik daripada perusahaan." Dan kemudian kita harus tahu bahwa ada 100 orang di perusahaan yang telah melakukan ini selama 10 tahun。

Tentu saja, produk kami tidak selengkap dan kuat seperti mereka, tetapi dalam beberapa hal mereka lebih baik. Jadi sekarang aku menyatukan layanan data energi ini. Tapi pada gilirannya, jika saya tidak berjalan lebih cepat, siapa yang akan komersialkan saya

Jadi, dari sudut pandang bisnis, pertanyaannya tidak, "Apakah saya menghabiskan banyak uang?" Ya, aku menghabiskan banyak uang. Tapi pertanyaannya adalah, apa yang kudapat dari uang ini? Apa itu membawa lebih banyak pendapatan? Jika jawabannya ya, uang itu layak。

Kekhawatiran Patrick O:

Anda khawatir bahwa, pada akhirnya, mereka yang mengendalikan modal dan bertanggung jawab untuk berinvestasi, yang mempekerjakan Anda sering karena apa yang Anda lakukan, akan mengatakan, " Kami memiliki analis sendiri, dan mereka cerdas. Mengapa kita tidak melakukannya sendiri? Jika menjadi begitu mudah, pada titik apa itu semua mengalir kembali ke lembaga investasi? Bagaimanapun, mereka kemungkinan besar akan mendapatkan pengaruh maksimum dari data dan wawasan ini。

Apa

Pertama, setiap bisnis layanan informasi pada dasarnya sama: saya telah mendapatkan nilai dari sebuah pesan, dan jelas tidak ada klien yang mendapatkan nilai dari informasi tersebut。

Jika saya menjual informasi untuk satu dolar, Anda bersedia untuk menghabiskannya karena Anda tahu itu membantu Anda membuat keputusan yang membuat Anda mendapatkan lebih dari satu dolar. Dengan kata lain, Anda mendapatkan arbitrage. Kau menghasilkan lebih banyak uang dariku dari yang kuhasilkan dari menjual informasi ini。

Dana investasi dana investasi mereka sendiri tentu memiliki kapasitas layanan informasi mereka sendiri. Terutama untuk agensi seperti Jane Street dan Citadel, mereka sangat rinci dan mendalam dalam hal data. Tapi mereka masih akan membeli data kita, dan mereka terus melakukannya, dan kerjasama dengan kita semakin berkembang。

Saya pikir ada semacam "itu faktor." Kita bergerak lebih cepat, lebih fleksibel, tim yang lebih kecil, dan fokus pada area yang sangat spesifik: infrastruktur AI, dan perubahan yang sangat besar yang ditimbulkannya, termasuk AI, ekonomi token dan set hal-hal terkait. Kita dapat melihat arah sebelumnya dan membangun sesuatu yang lebih cepat。

Jadi, tentu saja, profesional investasi mencoba melakukan sesuatu untuk diri mereka sendiri. Tapi lebih sering, mereka membeli data kami secara langsung, dan kemudian membangun di atasnya. Bagi mereka, membeli data kami biasanya lebih murah daripada membangunnya dari awal. Dan tentu saja, pada akhirnya seseorang akan mencoba melakukannya sendiri。

Si Token menjadi sumber daya produksi baru

Kekhawatiran Patrick O:

saya pikir setiap kali saya berbicara dengan anda, saya berakhir dengan pertanyaan yang sama: pasokan dan permintaan token. itulah yang paling menarik minat saya sekarang. apakah pengalaman anda sendiri memberikan pemahaman baru tentang sisi permintaan? apa kau mengubah penilaianmu tentang kebutuhan token setelah kau merasa sangat baik

Apa

Jika kita mundur, dari sudut pandang makro, ARR Antropik mungkin tumbuh dari $ 9 miliar menjadi sekitar $ 35 miliar, $ 40 miliar. Pada saat acara ini ditayangkan, mungkin telah mencapai 40 miliar hingga 45 miliar dolar。

Namun, mereka belum berkembang sampai taraf yang sama. Jika Anda menghitung, dan menganggap bahwa mereka belum mengurangi algoritma R & D — jelas mereka belum, karena mereka menerbitkan model baru, seperti Metis, Opus 4, Opus 4,7 — maka satu hal: kalkulus tambahan mereka, bahkan jika mereka semua pergi ke penalaran, adalah sekitar 72 persen lebih rendah daripada rasio Maori mereka。

Kenyataannya, sebuah bagian dari kalkulus tambahan kemungkinan besar berada di R & D, sehingga rasio Māori yang sebenarnya mungkin lebih tinggi dari 72 persen. Kau tahu, di awal tahun ini, seseorang membocorkan beberapa informasi dalam dokumen pembiayaan mereka, dan sekitar 30 persen。

Bagaimana bisnis dapat meningkatkan tingkat Māori ke tingkat ini dalam waktu yang singkat? Prinsipnya, itu karena permintaan terlalu tinggi. Mereka dapat memperketat tingkat penggunaan, batas kecepatan dan pembatasan. Yang paling penting adalah bahwa Anda memiliki manajer pelanggan Antropik, kontrak perusahaan, dan mendapatkan promosi yang Anda butuhkan. Jika tidak, token akan menjadi sangat agresif。

Siapa pun yang mampu untuk mendapatkannya. Antropi sedang menghadapi masalah yang sama — tentu saja, itu bukan masalah, melainkan kenyataan bagaimana kapitalisme bekerja. Ya, klien mungkin membayar mereka $ 40 miliar per tahun untuk token, tetapi token ini jauh lebih dari $ 40 miliar dalam nilai yang diciptakan oleh klien。

nilai setiap token yang diciptakan oleh perusahaan yang berbeda berbeda berbeda. tapi sebagai model menjadi lebih cerdas, yang penting adalah siapa yang mendapatkan token paling cerdas dan menggunakannya untuk hal yang paling berharga。

Kau harus memutuskan bagaimana menggunakan token ini untuk mengembangkan bisnis dan menciptakan nilai. Banyak orang menginginkan token, dan mereka akan mengkonsumsi token. Tapi awalnya SaaS biasa yang memproduksi perangkat lunak di San Francisco dengan Claude tidak benar-benar menghasilkan banyak uang. Jadi cepat atau lambat, mereka akan diremas dari harga token。

Kekhawatiran Patrick O:

Itulah yang saya bertemu hari ini di jalan. Setelah diterbitkan, Opus 4.7, saya ingin menggunakan 4.7 dan segera. Dan kemudian aku terputus. Aku tak bisa menggunakannya. Saya bahkan tidak bisa membayangkan terus menggunakan 4,6, meskipun saya telah puas dengan 4,6 selama beberapa minggu terakhir, itu sudah kuat。

Apakah Anda terkejut bahwa orang - orang begitu bertekad untuk menggunakan model yang paling mahal dan maju

Apa

Tidak sama sekali. Salah satu kenangan paling lucu yang saya miliki dalam satu setengah bulan terakhir adalah bahwa saya berlutut dengan teman saya Leopold, hampir di depan co-penemu Antropik, memintanya untuk memberi kita Metis akses。

Kami tahu itu ada, jadi kami berkata, "Tolong, biarkan kami menggunakannya." Lalu dia berkata, "Aku tidak tahu apa yang kau katakan."

Kekhawatiran Patrick O:

bagaimana reaksimu saat lembar harga itu, atau kartu eval keluar

Apa

Ada rumor sebelum Bay Zone, dan kami mungkin tahu itu akan sangat kuat. Jika Anda melihat benchmark, tentu saja benchmark akan berubah, tetapi Mephisto / Metis mungkin merupakan lompatan terbesar dalam kapasitas model dalam dua tahun terakhir。

Saya pikir ini sangat penting: cukup kuat bahwa Antropik bahkan tidak ingin menerbitkannya sepenuhnya. Meskipun mereka telah menerbitkan harga kepada beberapa klien, mereka juga telah diterbitkan secara selektif, misalnya, untuk pengaturan terkait keamanan. Ini mungkin lima atau sepuluh kali biaya token, tetapi mereka masih tidak ingin dibebaskan sepenuhnya karena mereka khawatir dampaknya terhadap dunia nyata。

Versi Opus 4.7. Dan mereka menjelaskan kepada model Kari bahwa kami sebenarnya sengaja membuat pre-optimasi yang lebih buruk dari kemampuan keamanan cyber. Aku tidak tahu apakah kau membaca bagian itu。

Jadi apa yang saya katakan adalah, siapa pun Anda, selama Anda memiliki modal yang cukup, Anda harus pergi membeli langganan bisnis antropik, pers token dan membayar bukan menggunakan langganan biasa. Karena kemudian Anda tidak akan begitu mudah dikurung。

dan kemudian anda harus berpikir tentang bagaimana menggunakan token ini pada misi bernilai tinggi dan membuat uang dari mereka. karena pada dasarnya, dalam satu atau dua tahun, banyak bisnis pada dasarnya adalah arbitrage token. token kuat, tapi intinya adalah di mana anda menunjuk mereka。

pada tiga atau empat tahun berikutnya, model itu sendiri mungkin tahu bagaimana token harus digunakan dan bagaimana untuk memaksimalkan nilai。

Jika Anda melihat kembali pada tanda aras apapun, Anda akan menemukan bahwa biaya untuk mencapai tingkat kompetensi tertentu di masa lalu adalah X, dan sekarang mungkin hanya satu persen, atau bahkan seribu. Misalnya, ketika DeepSeek mencapai kapasitas tingkat GPT-4, biayanya sekitar satu persen GPT-4. Sejak saat itu, biaya model GPT-4 terus menurun。

TENTU SAJA, TIDAK ADA YANG BENAR-BENAR PEDULI TENTANG MODEL GPT-4 LAGI. APA YANG ANDA INGINKAN ADALAH MODEL GARIS DEPAN, KARENA MENCIPTAKAN SESUATU YANG BENAR-BENAR EKONOMI. NAMUN, MODEL GPT-4 MASIH DAPAT DIGUNAKAN UNTUK BEBERAPA ADEGAN, TETAPI YANG BIASANYA LEBIH KECIL。

Jadi apa yang benar-benar mendorong permintaan bukan bahwa kemampuan lama menjadi lebih murah, tetapi bahwa contoh baru muncul. Sekarang Anda menggunakan Opus 4.6 atau Opus 4.7-level model. Setahun kemudian, jika saya memperoleh kapasitas modelling kualitas yang sama hari ini, saya mungkin menghabiskan $ 70.000, mungkin 100 kali lebih sedikit。

Tapi itu tidak masalah. Karena saat itu, aku akan menggunakan model yang lebih kuat untuk melakukan sesuatu yang lebih berharga。

Metis Anthropic lebih mahal sebagai model sendiri, tetapi mengkonsumsi token yang jauh lebih sedikit untuk menyelesaikan hal yang sama. Jadi dalam kebanyakan misi, sebenarnya lebih murah daripada Opus 4.6。

Apa

karena itu jauh lebih efisien. bahkan jika setiap token sendiri lebih øsmart" dan lebih mahal, perlu lebih sedikit token untuk melakukan pekerjaannya。

Kekhawatiran Patrick O:

Terakhir kali aku melihatmu, Metis mungkin baru saja dirilis, atau kartu model baru saja keluar. Katamu itu cukup kuat untuk menakutimu sedikit. Apa maksudmu

Apa

Tujuan Antropik pada tahun 2025, bahkan dari tahun 2024, adalah untuk memiliki insinyur perangkat lunak tingkat L4 di model pada akhir tahun 2025. Secara keseluruhan, mereka pada dasarnya melakukannya dengan Opus 4.6。

Tapi mereka tidak mengatakan jika Anda melihat Metis, dibandingkan dengan benchmark, itu lebih seperti insinyur L6. OFIL L4 kemungkinan adalah insinyur perangkat lunak yang relatif junior, dan L6 sudah menjadi insinyur yang cukup berpengalaman。

Saya ingat Antropik mengatakan bahwa model ini telah tersedia secara internal sejak Februari. Jadi dalam dua bulan, mereka melompat dari L4 ke L6. Apa yang terjadi selanjutnya

Dan ketika Anda berpikir tentang evolusi model, Anda lihat itu sebenarnya mempercepat. Ritme rilis Andorgio Anthropic dikompresi, dan irama rilis OpenAI dikompresi. Kenapa? Karena biasanya, untuk membuat model yang lebih baik, kau butuh beberapa hal。

Pertama-tama, kau butuh sosok yang kuat. Penghitungan masa sangat mahal dan memiliki skala waktu sendiri. Kami akan melacak hal-hal ini, yang sebenarnya tumbuh, tetapi sebagian besar didirikan dalam jangka pendek. Kau menandatangani matematika. Ini cukup banyak diselesaikan. Tentu saja, akan ada penundaan dan penyesuaian di tengah-tengah, dan mungkin ada beberapa lagi, tetapi keseluruhannya tetap。

Kedua, Anda membutuhkan peneliti yang sangat baik. Perusahaan sekarang bersedia membayar puluhan juta dolar untuk orang-orang ini。

Akhirnya, kapasitas tercapai. Secara historis, ini sangat sulit untuk dicapai. Jika aku punya ide, aku harus mewujudkannya, dan itu sulit. Tapi sekarang ide itu ada di mana-mana, itu menjadi sangat mudah untuk dicapai. Ini mahal, tapi sangat mudah。

Jadi pertanyaannya menjadi: Bagaimana seseorang memutuskan ide mana yang akan dicapai? Akibatnya, ketika menjadi terlalu mudah, Anda dapat mencapai lebih banyak ide dan berlari lebih cepat di treadmill ini。

INI DAPAT TERJADI PADA STUDI MODEL AI, SEHINGGA FREKUENSI RILIS MODEL TELAH BERKURANG DARI ENAM BULAN MENJADI DUA BULAN. INI JUGA DAPAT TERJADI DI DAERAH LAIN. SEBAGAI CONTOH, SAYA INGIN MEMODELKAN SETIAP PEMBANGKIT LISTRIK DI AMERIKA SERIKAT, SETIAP JALUR TRANSMISI, LARI KEMBALI, MENGANALISIS HUBUNGAN PASOKAN-DEMAND DI MIKROREGION — DAN SAYA DAPAT MELAKUKANNYA SEKARANG。

idenya sendiri murah. intinya adalah, mana yang masuk akal? ide mana yang sepadan dengan modalmu untuk membeli token dan mengeluarkannya? karena kemampuan untuk mencapai sudah ada. ini adalah perubahan yang paling kritis。

Jika biayanya terus menurun — dan memang — kita bahkan belum benar - benar mendapatkan Metis. Opus 4,7 baru saja dirilis beberapa jam yang lalu, tapi kami sangat bersemangat di dalam tim。

Apa yang dibawa oleh dunia ini? Saya pikir itu akan reorder cara ekonomi bekerja。

Dahulu, implementasi sangat penting karena sulit; ide murah. Sekarang, ide tidak hanya murah, mereka cukup, tetapi implementasi juga sangat mudah. Jadi, apa yang benar-benar layak dilakukan adalah bahwa hanya ada ide yang cukup baik untuk ... Mereka dapat membuktikan bahwa Anda bernilai uang meskipun itu sudah sangat murah。

Kekhawatiran Patrick O:

Jadi kau benar-benar takut? Atau, apakah hanya menunjukkan ketidakpastian yang sulit dipahami

Apa

Ketidakpastian pasti ada. Tapi aku merasa hal ini membawa semacam ketakutan. Pertanyaannya adalah, bagaimana masyarakat dapat merestrukturkan dirinya sendiri

APA YANG PENTING KETIKA ANDA HIDUP DI DUNIA DI MANA "KEMAMPUAN UNTUK MELAKUKAN SESUATU" TIDAK SEPENTING ITU? HAL YANG PENTING ADALAH, DAPATKAH ANDA MEMILIH IDE YANG TEPAT UNTUK AI MEWUJUDKANNYA; DAPATKAH ANDA MENJUALNYA, ATAU DAPATKAH ANDA MENJUAL APA YANG AI SADARI; DAPATKAH ANDA MENINGKATKAN MODAL UNTUK ARAH INI? ITULAH YANG MEMBUATNYA PENTING。

Dan itu kembali ke pertanyaan sebelumnya: penting untuk memiliki model terbaru selamanya. Siapa yang bisa mendapatkan model terbaru

Antropik memiliki proyek, dan aku tahu itu tidak disebut Earwig, tapi aku suka menyebutnya Earwig sengaja untuk menggoda orang Antropik. Mereka hanya menawarkan Metis ke perusahaan tertentu untuk keamanan cyber. Saya pikir ini akan terjadi: model akan menjadi lebih sempit dan kurang dapat diakses。

Catatan: Earwig dimaksudkan sebagai kutu, serangga kecil, dan sering disebut earplug dalam bahasa Tionghoa. Ini lebih seperti sandiwara: di satu sisi, kedengarannya seperti beberapa jenis bug, di sisi lain, ada hubungan antara "berselingkuh ke telinga" dan "mempersembahkan orang."。

Aku tahu OpenAI, Anthropic dan perusahaan lain mengatakan mereka ingin semua orang memiliki AI yang kuat. Tapi AI sangat mahal. Siapa yang akan membayar triliunan dolar di infrastruktur? Mereka yang memiliki uang dan dapat membangun hal-hal berguna dengan AI。

dan anda tidak ingin siapa pun untuk menyuling model anda, sehingga anda tidak menerbitkannya dalam skala luas. anda akan memberikan kepada klien lebih sedikit dan lebih sedikit. kemudian pelanggan ini akan mulai berjuang untuk token。

Kecuali Antropik memiliki kenaikan harga yang besar. Mereka bisa menggandakan harga Opus, dan aku akan terus membayar. Aku bertaruh kebanyakan pengguna akan terus membayar. Tapi saya tidak berpikir bahwa bahkan menyelesaikan masalah kapasitas besar mereka。

jadi masalahnya adalah: di mana siklus ini berakhir? apa yang terjadi ketika penggunaan token, dan nilai tambahan token ini, semakin terkonsentrasi di tangan beberapa perusahaan

Aku tidak punya Metis sekarang. Tapi siapa yang punya? Bank Top telah. Sekarang mereka mungkin hanya menggunakannya dalam keamanan cyber, tapi saya bisa membayangkan dunia: karena saya memiliki kontrak bisnis untuk Antropik, dan karena orang Antropik seperti saya, mereka mungkin bersedia untuk memberi kita akses sedikit lebih awal, atau sedikit batas tingkat yang lebih tinggi. Kuharap itu terjadi。

Dan kemudian pesaing saya tidak memiliki akses ini, dan aku bisa mengalahkan mereka。

Mungkin juga kasus lain. Misalnya, Ken Griffin dari Citadel, yang memiliki denyut nadi yang sangat kuat dan sangat kaya. Dia mungkin pergi dan menandatangani perjanjian dengan OpenAI atau Antropis, mengatakan, "Saya membeli $ 10 miliar per tahun token pertama. Setiap kali kau menerbitkan model baru, aku akan membeli token 10 miliar dolar terbaik, lalu yang lainnya

Apa yang terjadi kemudian? Dia bisa menghancurkan semua orang di pasar。

Ini hanya satu contoh. Hal ini juga dapat terjadi di area keamanan siber, seperti kekhawatiran Anthropic bahwa model memudahkan untuk meretas sistem. Ini bisa terjadi di layanan informasi sepertiku, dan aku menggunakannya untuk menghancurkan orang。

Saya percaya bahwa hal ini memiliki dampak yang sangat luas. Kami tak tahu apa yang bisa dilakukan model ini. Orang antropik tidak tahu, OpenAI tidak tahu, tidak ada yang tahu. Akhirnya, terserah pengguna akhir untuk mencari tahu: di mana token ini dapat digunakan? Apa yang bisa mereka bangun? Apa yang bisa kau bayangkan

Tentu saja, ini akan sangat meningkatkan produktivitas dan memiliki sisi positif bagi umat manusia. Tapi pertanyaannya adalah, bagaimana sumber daya dan akses bisa terkonsentrasi

Robot-robot akan mengambil gelombang permintaan berikutnya

Kekhawatiran Patrick O:

kini, robot, atau robotika, mengkonsumsi token, hampir tidak sah dibandingkan dengan bidang lain. bagaimana menurutmu? akankah itu menjadi kurva permintaan kedua? setiap hari, dalam satu mil, bisnis robot baru muncul, mencoba membuat sesuatu yang menarik。

Apa

Berikut adalah konsep yang disebut "software-only kekhususan." Dengan kata lain, dunia mungkin dimulai dengan singularitas AI yang hanya terjadi dalam perangkat lunak. Tapi masalahnya adalah sebagian besar dunia masih bersifat fisik. Anda akan melihat bahwa dunia pada akhirnya akan diatur di sekitar perangkat keras, bukan hanya perangkat lunak. Jadi saya berpikir bahwa apa yang disebut "software wonders" hanya jangka pendek, bukan akhir. Karena kita berakhir di dunia fisik。

Apa bagian yang sulit dari robot setelah perangkat lunak menjadi sangat mudah? Ini adalah pemrograman, mikrokontroler, pelaksana, dan mengendalikan semua hal ini. Ini sangat sulit sekarang。

MODEL AI AI MEMILIKI FITUR YANG MENARIK: MEREKA SEBENARNYA SANGAT TIDAK EFISIEN. INI HANYA KARENA KAMI MEMBERI MEREKA DATA BESAR BAHWA MEREKA BELAJAR SESUATU DAN DALAM BEBERAPA CARA MELAMPAUI KEMANUSIAAN。

Tapi model robot saat ini, seperti VLA, yang adalah Vision-Language-Action, visual-linguistik-action model, yang panas sekarang, tapi saya tidak berpikir itu akan menjadi sesuatu yang akhirnya dapat diperluas. Mereka tidak efisien, dan kita tidak bisa memperluas data robot cukup cepat。

Pasti ada cara untuk melatih model robot dalam skala besar. Ini seperti manusia terus melihat data sepanjang hidup mereka. Hal yang nyata tentang kemanusiaan adalah bahwa kita sangat "menampik efisien." Satu contoh, dua contoh, kita bisa belajar。

Jika kemampuan ini diterapkan pada robot, itu akan benar-benar berbeda. Setelah singularitas di tingkat perangkat lunak telah muncul, menjadi sangat murah bagi siapa pun untuk mulai membangun model-model ini. Dan kemudian orang dapat mulai membangun robot yang sangat berguna。

jadi saya pikir dalam enam sampai 18 bulan ke depan, kita akan mulai melihat terobosan nyata dalam robotika. kemampuan kunci adalah beberapa-shot pembelajaran. dan kemudian akan ada model robot pra-latih, dan anda akan menyewa atau membeli robot, dan anda akan menunjukkan beberapa contoh, dan itu akan melakukan pekerjaan。

Kau katakan untuk melipat dua hal ini, itu bisa melakukannya. Dan kau katakan, benda ini sebenarnya memiliki keseimbangan. Ini akan dimulai dan selesai. Percayalah, aku sudah sering melakukannya sendiri。

Jadi saya pikir robot memiliki sedikit kemampuan belajar。

Memang benar bahwa sudah ada perusahaan yang melakukan robotika, beberapa untuk iklan dan beberapa untuk tugas sederhana. Tapi itu akan sangat terbagi. Misalnya, robot yang digunakan untuk melipat pakaian, atau robot yang lebih disubsidi menjadi papan tulis. Ini bisa menjadi layanan sewaan, itu bisa menjadi paket model, Anda bisa mengunduhnya pada robot standar, itu bisa melakukannya, dan kemudian Anda bisa membayarnya。

dalam kasus apa pun, bidang komoditi fisik akan disertai dengan percepatan dan efek deflasi yang signifikan. dan ini akhirnya akan terus mendorong pertumbuhan gila token dalam permintaan. jadi saya pribadi tidak berpikir kebutuhan token akan melambat。

Kekhawatiran Patrick O:

Apakah Anda belajar sesuatu yang baru tentang dunia dari hasil Metis dan bagaimana itu dibangun? Dengan kata lain, jika kau memisahkan semua komponen dari hukum penskalaan, seperti pra-latihan..

Apa

Modelnya jauh lebih besar dari sebelumnya. $100,000 Blackwell, setara dengan ratusan ribu chip dari generasi sebelumnya. Tentu saja, TPU dan Triton memiliki ritme rilis yang berbeda, sehingga mereka tidak bisa benar-benar cocok. Namun akhirnya, ya, Metis adalah model yang jauh lebih besar. Ini membuktikan hukum penskalaan masih berlaku. Semua itu menunjukkan bahwa trend line berlanjut: dengan lebih banyak input ke model, model menjadi lebih baik。

Dan itu tidak hanya "lebih kalkulus untuk membuat model lebih baik." Pada saat yang sama, kita terus memperoleh efisiensi komputasi. Dan semua penelitian dan pengembangan energi yang laboratorium masukkan ke dalamnya berubah menjadi satu hal: Jika saya ingin model untuk tingkat kompetensi tertentu, biaya untuk mencapai kapasitas itu akan menurun secara signifikan setiap enam bulan, atau sekarang setiap dua bulan. Tapi jika aku menariknya cukup besar, aku masih bisa membuat lompatan besar ke depan。

Jadi, ya, itu membuktikan bahwa ini terus terjadi. Google dan Antropika bukan pengguna GPU di sisi pelatihan. OpenAI juga harus meluncurkan model generasi baru. Saya pikir mereka mengambil langkah yang lebih rasional dan berprinsip sedikit maju pada skala. Dan kali ini, Anthropic membuat lompatan besar。

Tahun ini kita akan melihat model yang lebih baik dan lebih baik, dan iramanya akan semakin cepat。

Kekhawatiran Patrick O:

Kami sudah membicarakan percakapan ini untuk waktu yang lama, tapi hampir tidak menyebutkan OpenAI. Ini akan menjadi hal yang aneh di masa lalu。

Apa

Itu bagian yang menyenangkan. Sekarang banyak orang akan mengatakan, "Jadi Anthropic telah menang, kan? Mereka memiliki Metis pada bulan Februari, tetapi mereka bahkan tidak dibebaskan karena merasa tidak perlu. Perhitungan mereka telah terjual habis dan pendapatan meningkat sebesar $ 10 miliar per bulan. Dan hari ini, Opus 4.7 dirilis, dan semua ini terjadi sebelum rumor OpenAI, yang diliput di media seperti The Information。

Jadi di permukaan, Antropik jelas mengarah, OpenAI tampaknya selesai. Tapi yang menarik adalah matematika Antropik sangat terbatas, dan mereka dapat berkembang dengan kecepatan yang sangat terbatas. Dariobia digunakan untuk melebih-lebihkan bahwa OpenAI terlalu radikal dalam hal aritmetika, dan penskalaan Antropik lebih rasional. Tapi sekarang Anthropic mungkin berpikir bahwa kita benar-benar harus memiliki bakat lebih。

OpenAI sepenuhnya mampu membayar tagihan ini. Faktanya, mereka sudah membiayai banyak uang untuk menambah kapasitas mereka. Selain ini, mereka biasa membeli kredit dari perusahaan-perusahaan seperti Oracle, CoreWeave, SoftBank, Microsoft, dll, dalam skala yang sangat radikal dan bahkan "ir responsibility". Sekarang mereka juga mendapat Trainium dari Amazon。

Jadi OpenAI melakukan hal yang sangat gila dalam matematika, dan mereka tahu mereka membutuhkan lebih banyak。

Menariknya, jika kita melihat Opus 4.6, mari kita tidak mempertimbangkan model untuk saat ini, tetapi proliferasi teknologi ini. Kau dan aku bisa menggunakannya segera pada hari pertama rilis model, tapi bisnis lain membutuhkan waktu. Orang-orang juga membutuhkan waktu untuk belajar. Waktu Awakening yang singkat" tidak akan menimpa semua orang pada waktu yang sama. Jadi pada akhir tahun, dengan asumsi model Opus 4,6-grade, seluruh ekonomi bersedia menghabiskan $ 100 miliar per tahun di atasnya, yang saya tidak berpikir adalah berlebihan. Setelah semua, sekarang biayanya $ 40 miliar。

Kekhawatiran Patrick O:

Pada dasarnya itu hanya dorongan linear。

Apa

Ya, linear, bukan eksponen. Untuk mencapai pertumbuhan eksponensial, Anda perlu model yang lebih baik. Tapi Andordan Anthropic tidak memiliki kapasitas untuk memenuhi kebutuhan ini. Jadi, dengan asumsi OpenAI atau Google dengan cepat mencapai tingkat kapabilitas ini, siapa pun dapat melakukannya selanjutnya。

Antropik mungkin mampu menagih 70% dari kadar Māori, tetapi jika OpenAI mencapai tingkat kapasitas yang sama selanjutnya, bahkan jika mengumpulkan hanya 50% dari kadar Māori, maka akan memakan semua tuntutan incremental ini. Dan mungkin juga tidak cukup perhitungan untuk melayani semua pengguna. Jadi mungkin Metis, model seperti ini, jika dunia memiliki bakat yang cukup, bisa membawa $ 500 miliar, bahkan lebih dilebih-lebihkan. Permintaan pasar untuk token ini terlalu kuat dan ketersediaan daya komputasi sangat terbatas。

Kami telah melihat ini di H100 harga boom. Kehidupan pelayanan GPU juga meningkat. Jelas sekali, bahkan laboratorium kelas dua, mereka menjual, belum lagi laboratorium kelas satu. Laboratorium garis-pertama akan memiliki margin keuntungan yang lebih baik, tetapi laboratorium baris kedua akan terjual habis, dan bahkan laboratorium garis ketiga mungkin sudah dekat untuk menjual keluar。

nilai ekonomis dari model terkuat berkembang lebih cepat daripada kemampuan infrastruktur untuk menyediakan token ini kepada orang-orang. jadi celah ini akan terus melebar. laboratorium modelling juga akan terus tumbuh dalam profitabilitas sampai orang-orang dalam rantai pasokan perangkat keras dan rantai pasokan infrastruktur bereaksi: dll, mengapa tidak saya hanya menaikkan margin laba saya

Kekhawatiran Patrick O:

Jadi dapat dikatakan bahwa penilaian Anda hari ini pada sisi permintaan, terutama contoh Anda sendiri SemiAnalisis, adalah benar-benar meledak. Dan lebih luas lagi, ketika orang memasuki apa yang Anda sebut "AI psikosis" dan merasakan apa yang dapat mereka lakukan dan merasa bahwa kesulitan hampir sepenuhnya hilang, seperti yang saya lakukan. Dalam beberapa minggu, pengeluaran token saya sendiri telah melambung。

kedengarannya seperti penilaian yang cukup baik. di pihak yang diminta, apa ada sesuatu yang harus kita lewatkan? jika anda tidak menggunakan lebih banyak token, anda tidak akan pernah keluar dari bawah permanen. kau bisa menyebarkannya

Dengan kata lain, baik Anda menggunakan lebih banyak token, dan melalui token ini Anda menciptakan nilai ekonomi ekstra; tetapi banyak orang bosan dan malas. Mereka akan berpikir, "aku akan bekerja hanya satu jam sehari, bukan delapan jam, jadi AI akan melakukan sebagian besar pekerjaan saya."

Apa

Itu cara yang membosankan. Cara yang lebih dingin adalah: saya masih bekerja delapan jam sehari, tapi saya melakukan delapan kali pekerjaan, mungkin lima kali uang. Mungkin bukan lima kali, tapi harus seperti itu。

Tentu saja, jika Anda hanya melakukan pekerjaan, itu sulit. Ada orang yang melakukan pekerjaan ganda pada waktu yang sama, dan ada orang yang memulai perusahaan dan mulai menjual. Anda perlu menangkap nilai ekonomi AI sebelum digunakan oleh semua orang, dan berubah menjadi label industri. Karena itu bukan bingkai sekarang. Jika Anda tidak menggunakan lebih banyak token, jika Anda tidak menciptakan nilai dari token ini dan menangkapnya, Anda tidak dapat keluar dari bawah permanen。

ada tiga pertanyaan yang berbeda di sini: pertama, gunakan lebih banyak token; kedua, buat nilai dari token ini; dan ketiga, nilai tangkapan dari nilai yang anda buat dari token. jika anda tidak dapat melakukan tiga hal ini, anda tidak akan pernah keluar dari bawah permanen sebagai kemampuan model terus untuk lonjakan dan sumber daya mungkin menjadi lebih terkonsentrasi。

Oke, mari kita bicara sisi pasokan. Apa yang terjadi sekarang? Jika kurva permintaan naik, perubahan apa yang terjadi di depan seluruh depot pasokan untuk melayani semua token ini? Saat permintaan meningkat, semua yang ada di sisi pasokan meningkat. Harga yang naik baik di NVIDIA GPU atau di tempat lain. Pada saat yang sama, kehidupan mereka yang berguna sedang diperpanjang。

Itulah harga tren untuk H100. Pada masa lalu, telah dibantah bahwa GPU memiliki kehidupan yang berguna kurang dari lima tahun, yang benar-benar omong kosong. Beberapa cluster Hopper, tiga atau empat tahun yang lalu, sekarang re-kontrak selama tiga atau empat tahun; beberapa A100 cluster juga memperbarui kontrak untuk tahun-tahun mendatang。

Jadi kehidupan aktif GPU jelas bukan lima tahun, atau bahkan tujuh atau delapan tahun. Kita belum tahu, tunggu sampai Hopper benar-benar sampai ke panggung itu. Tapi jelas, itu bukan lima tahun. Dan pada saat pembaruan, harga meningkat。

INI BERARTI BAHWA KADAR MĀORI UNTUK SEBUAH GUGUS SEBENARNYA BUKAN 35 PERSEN, TETAPI LEBIH TINGGI. KEUNTUNGAN DARI AWAN BERKEMBANG. LAPISAN HARDWARE MEMILIKI MARGIN PROFIT YANG SANGAT SEHAT, DAN NVIDIA MASIH MENGECAS SEKITAR 75% DARI TINGKAT MAORI. SAAT MELIHAT LEBIH JAUH KE BAWAH RANTAI PASOKAN, JELAS BAHWA MARGIN KEUNTUNGAN DARI RANTAI MEMORI TELAH MENINGKAT SECARA SIGNIFIKAN. KEMAJUAN BESAR YANG BESAR JUGA DIBUAT DI DAERAH SEPERTI MODUL CAHAYA DAN CHIP LOGIS, DAN MARGIN KEUNTUNGAN PERLAHAN MENINGKAT。

DAN YANG LEBIH PENTING LAGI, PERUSAHAAN SEPERTI NVIDIA YANG MEMBUAT CHIP MEMBAYAR UANG MUKA YANG BESAR. BIARPUN KADAR MĀORI TIDAK MENINGKAT SECARA SIGNIFIKAN, BIAYA MODAL, TITIK ARUS KAS, ATAU PENGEMBALIAN MODAL INVESTASI MENINGKAT。

Kau bisa lihat ini di rantai pasokan. ASML telah terjual habis sepenuhnya, dan membutuhkan Carl Zeiss untuk berkembang lebih cepat. Along rantai pasokan, setiap rantai dijual habis dan margin keuntungan meningkat; atau kemajuan diterima, sehingga meningkatkan pengembalian modal investasi, yang sebenarnya diperlukan untuk kurang berinvestasi。

INI ADALAH TREN KONSISTEN DI RANTAI PASOKAN. BAHKAN PCB SEPERTI INI. PABRIKAN PCB MEMBUTUHKAN PLATINA TEMBAGA, YANG TERJUAL HABIS, DAN ORANG MULAI MEMBUAT KEMAJUAN UNTUK PLATINA TEMBAGA。

Hal ini dapat dikatakan bahwa selama hal ini memiliki pulsa, selama itu berada di rantai pasokan dan dijual habis, orang akan berjuang untuk persediaan tambahan dan untuk persediaan dalam tahun-tahun mendatang。

Kekurangan tenaga komputasi menyebabkan seluruh rantai industri

Apa

Berantai suplai biasanya bereaksi cepat. Tapi kali ini ada tempat yang unik: rantai pasokan hari ini lebih kompleks dari sebelumnya, dan apa yang kita bangun lebih kompleks dari sebelumnya, sehingga siklus pengiriman lebih panjang. Tidak mengatakan bahwa industri lain tidak memiliki siklus pengiriman 18 bulan, tetapi kali ini pembangunan pasokan baru itu sendiri membutuhkan beberapa tahun。

ITU INGATANNYA. KAPASIASIASI MEMORI KINALIS HANYA DAPAT TUMBUH DENGAN PERSENTASE DOUBLE-DIGIT LEBIH RENDAH PER TAHUN, MISALNYA, 20%, 30%. BAHKAN LEBIH RENDAH, DRAM SEDIKIT LEBIH TINGGI. MESKIPUN SINYAL PERMINTAAN KUAT PADA AKHIR TAHUN 2025 DAN PERUSAHAAN MEMORI SEGERA MERESPON, KAPASITAS BARU YANG NYATA TIDAK AKAN DATANG。

Selain pertumbuhan 20 sampai 30 persen yang akan terjadi setiap tahun, mereka pasti dapat mengurangi sedikit lebih produktif. Tapi itu tidak sampai 2028 untuk pasokan baru yang nyata. Ini bisa menjadi akhir 2027 paling awal, tapi mungkin 2028. Ini sangat unik. Bahkan jika mereka ingin memperluas produksi mereka secepat mungkin, pasokan tidak akan tiba segera。

AKIBATNYA, HARGA MEMORI MENINGKAT. DAN KUKATAKAN PADAMU, TERUTAMA DRAM, HARGANYA SETIDAKNYA DUA KALI LIPAT, DUA KALI LIPAT, ATAU BAHKAN TIGA KALI LIPAT。

BEBERAPA ORANG AKAN MENGATAKAN, "KISAH MEMORI TELAH RUSAK, DAN SEMUA ORANG MENGERTI." TAPI TIDAK BENAR-BENAR, ANDA TIDAK BENAR-BENAR MENGERTI. DRAMA KEMUNGKINAN MASIH BERLIPAT GANDA ATAU TIGA KALI LIPAT DARI SEKARANG, KARENA ITULAH YANG DIPERLUKAN. MEREKA HARUS MEREBUT KAPASITAS DARI TEMPAT LAIN. DALAM EKONOMI KAPITALIS, SATU-SATUNYA CARA MEREBUT KAPASITAS DARI TEMPAT LAIN ADALAH DENGAN MENGHANCURKAN SEBAGIAN DARI PERMINTAAN DENGAN HARGA YANG LEBIH TINGGI. KITA TIDAK DALAM SISTEM PENJATAHAN, JADI ITU PASTI TERJADI. MARGIN KEUNTUNGAN AKAN TERUS MENINGKAT。

Saya pikir ada juga masalah kapasitas besar dengan chip logis. build-up baru saja diterbitkan, dan mereka telah meningkatkan pengeluaran modal. Namun, pembangunan pabrik bundaran akan memakan waktu yang lama. Mereka berusaha mengeluarkan lebih banyak output dari setiap tanaman yang ada. Namun, tidak ada peningkatan cepat harga listrik, karena mereka "orang baik". Pertambahan harga yang mungkin hanya dalam digit tunggal, daripada triple-digit meningkat seperti produsen memori。

Jadi akhirnya Anda akan melihat pasar di mana listrik adalah perusahaan besar, tetapi akan benar-benar mengambil semua nilai? Belum tentu。

AKU BARU SAJA MENYEBUTKAN BEBERAPA HAL, SEPERTI TEMBAGA, KACA, LASER YANG DIBUTUHKAN PCB. INI RELATIF BAIK-BERLEBIHAN, TETAPI SANGAT DISUBSIDI RANTAI PASOKAN, YANG JUGA SANGAT TEGANG. KE HULU, RANTAI PASOKAN PERALATAN MANUFAKTUR BULAT KRISTAL SEMIKONDUKTOR TERUS DIANGGAP TELAH MENINGKAT SECARA SIGNIFIKAN, TETAPI PASAR SANGAT MEREMEHKAN PENTINGNYA。

Pengeluaran modal untuk tahun ini adalah 56 miliar dolar. Kami mulai pada bulan Januari dengan proyeksi sebesar $57,4 miliar, dan kemungkinan akan sedikit lebih tinggi, seperti yang kita lihat beberapa cara meningkatkan pengeluaran modal。

Namun, tidak ada yang perlu dikhawatirkan: apa artinya ini untuk tahun depan? Apa artinya tahun depan

Akibatnya, dalam tiga tahun, pembangunan listrik dapat meningkatkan pengeluaran modal menjadi $100 miliar. Mungkin dua tahun kemudian, pada tahun 2028, mereka benar-benar bisa menghabiskan $ 100 miliar untuk pengeluaran modal. Saya serius mengatakan bahwa pembangkit listrik bisa menghabiskan $ 100 miliar dalam 2028 untuk pengeluaran modal。

Banyak orang tidak bisa membayangkan itu. Tapi apa artinya untuk rantai pasokan hilir? Apa artinya bagi perusahaan seperti Lam Research, Applied Materials, ASML? Apa artinya bagi perusahaan seperti rantai pasokan yang lebih hilir, seperti MKS Industries

Oxen dapat diperbesar lebih lanjut。

Catatan: Istilah Æfrown cambuk" mengacu pada pembesaran dalam rantai pasokan. Secara khusus, kebutuhan AI di bagian bawah terlihat seperti hanya lonjakan penggunaan token, tetapi ketika ditransmisikan ke rantai pasokan hulu, mereka diperbesar oleh lapisan, yang berubah menjadi ekspansi yang lebih dilebih-lebihkan, kenaikan harga dan pengambilan kapasitas。

Jika build-up benar-benar ingin menghabiskan $ 100 miliar untuk pengeluaran modal pada tahun 2028, dan saya pikir mungkin bahwa banyak orang akan berpikir itu gila, tapi itu benar-benar bisa terjadi。

Kekhawatiran Patrick O:

BAGAIMANA DENGAN SISA EKOLOGI CHIP? GPU SELALU SANGAT DOMINAN. TETAPI, APAKAH CPU, ASIK ATAU HAL - HAL LAIN YANG MUNCUL SEBAGAI PELUANG BARU DAN LENTUR? DI LUAR DOMINASI GPU NVIDIA, APA LAGI YANG HARUS FOKUS

Apa

YA, ASCIC TAMPAKNYA LEPAS LANDAS. TAPI PERTAMA-TAMA AKU INGIN MELOMPAT DARI AI CHIP ITU SENDIRI DAN BERBICARA TENTANG SESUATU YANG LAIN. KAMI TELAH MELAKUKAN PROYEK PADA FPGA, DAN TERNYATA SETIAP GENERASI BERIKUTNYA DARI GANTUNGAN AI AKAN MEMBUTUHKAN 120 FPGA. JADI APA ARTINYA UNTUK SEMUA PERUSAHAAN FPGA

Hal yang sama berlaku untuk CPU. Semua ini memperkuat lingkungan belajar, ditambah kode Øspam- yang Anda dan saya ciptakan, Sekarang mereka semua berjalan pada contoh Vercel, contoh AWS, atau sumber awan yang kita mulai dengan. Semua ini membutuhkan CPU. Jadi CPU sekarang benar-benar dijual, dan permintaan meningkat cepat。

Kekhawatiran Patrick O:

MARI KITA LIHAT APA YANG CPU MAINKAN DALAM SISTEM

Apa

ADA DUA ALASAN UTAMA MENGAPA ANDA MEMBUTUHKAN BANYAK CPU。

PERTAMA, MEMPERKUAT PEMBELAJARAN. SAAT MELAKUKAN PEMBELAJARAN INTENSIF, CPU SANGAT PENTING。

Di masa lalu, Anda akan membuang seluruh data Internet ke dalam model, dan kemudian model akan memuntahkan beberapa hasil. Sekarang, Anda masih memasukkan data internet ke dalam model, tetapi kemudian Anda memasukkannya ke dalam lingkungan, dan Anda berkata, "Ayo, cobalah. Model akan mencoba banyak hal yang berbeda. Akhirnya, lingkungan menilai keberhasilan hasil upayanya dan menunjukkannya. Lingkungan ini bisa apa saja. Sebagai contoh, dapat sederhana untuk memeriksa apakah teks output sesuai dengan format yang benar atau apakah output terstruktur benar. Ini bisa sangat rumit。

SEKARANG ORANG-ORANG MASUK KE ADEGAN YANG SANGAT KOMPLEKS. SEBAGAI CONTOH, SAYA INGIN ANDA UNTUK MEMBUKA FILE INI, MENGUBAHNYA, MENGEDITNYA, MEMPERBARUINYA, DAN KEMUDIAN MENGIRIMKANNYA KE SITUS WEB. AKU INGIN KAU MEMBUKA SOFTWARE SIMULASI FISIKA SIEMENS DAN MENYUNTING MODEL CAD INI." JADI LINGKUNGAN INI MENJADI LEBIH KOMPLEKS. DAN LINGKUNGAN INI BERJALAN DI CPU, BUKAN DI GPU DAN BUKAN DI ASIC。

AFIC ATAU GPU BERTANGGUNG JAWAB UNTUK MENJALANKAN MODEL ITU SENDIRI: MENERIMA DATA INPUT DARI LINGKUNGAN, MENGIRIMNYA KE MODEL, MENGHASILKAN JALUR OUTPUT YANG BERBEDA, YAITU, CARA YANG BERBEDA DI MANA MODEL PERCAYA ITU DAPAT MENYELESAIKAN MASALAH. JALUR INI KEMUDIAN DINILAI DAN DINILAI. JALUR SUKSES TERSEBUT AKAN DIGUNAKAN UNTUK MELANJUTKAN MODEL PELATIHAN, MEMPERBARUI MODEL DAN MENGULANGINYA. JADI INI ADALAH TEMPAT PERTAMA YANG SANGAT BERGUNA UNTUK CPU。

Tempat kedua adalah penyebaran。

KETIKA ANDA MEMILIKI MODEL-MODEL YANG KUAT, DAN ANDA MENYEBARKAN MEREKA KELUAR, MEREKA MENGHASILKAN KODE DAN SEMUA JENIS OUTPUT YANG BERGUNA. TAPI OUTPUT INI TIDAK LANGSUNG DARI GPU KE OTAK MANUSIA. MEREKA AKAN KELUAR DARI GPU ATAU ASIC KE DALAM APLIKASI YANG ANDA SEBARKAN, DAN APLIKASI ITU SENDIRI BIASANYA BERJALAN DI CPU。

JADI INI ADALAH DAERAH LAIN YANG SANGAT DIBUTUHKAN. CPU TELAH TERJUAL HABIS。

AIA VALUE SULIT MENDAPATKAN STATISTIK GDP

Kekhawatiran Patrick O:

Anda terus-menerus menilai penawaran dan permintaan tren dan mencoba menjadi yang paling berpengetahuan dunia dari keduanya, apa yang ingin Anda ketahui, tapi belum

Apa

saya pikir bagian tersulit bagi kita, bagi semua orang, adalah tokenomics, atau ekonomi token. biaya untuk menjalankan infrastruktur, biaya token, biaya model, margin keuntungan dari laboratorium ini adalah penilaian yang sangat baik. tapi apa yang benar-benar sulit untuk model adalah penggunaan dan kecepatan adopsi。

Pada bulan Januari, kami membuat beberapa prediksi yang sangat radikal pada bulan Februari, dan akibatnya, Anthropic dengan mudah melebihinya. Bagaimana kita mengkalibrasi model ini? Sumber data apa yang harus digunakan? Pada Februari, kami membuat asumsi yang sangat radikal tentang Maret, dan mereka melampauinya. Ketika Anda melihat angka pendapatan 10 miliar dolar, reaksinya adalah: apa itu? Bagaimana mereka sebenarnya menambah 10 miliar dolar untuk pendapatan mereka? Siapa yang menggunakan token ini? Kenapa? Apa yang mereka bangun dengan token ini? Dan yang lebih penting, bagaimana mereka membangun dengan token ini menyebar ke ekonomi? Berapa nilai yang telah mereka ciptakan

Ini bukan sesuatu yang mudah ditangkap oleh statistik PDB. Sebagai contoh, saya menggunakan semua nilai yang diciptakan oleh token, yang akhirnya diterjemahkan menjadi informasi yang lebih baik. Lalu aku menjual informasi dan menjualnya dengan harga yang lebih murah dari orang lain di masa lalu。

maklumat ini kemudian memasuki seluruh sistem ekonomi, memungkinkan orang untuk membuat keputusan investasi yang lebih baik atau keputusan kompetisi yang lebih baik. apa nilai informasi ini? apa dampaknya terhadap ekonomi

Ini jelas sangat mengkhawatirkan dari setiap indikator subjektif. Tapi pertanyaannya adalah, di mana GDP Ghost? SDP Phantom. Apa itu? Bagaimana kita melacak nilai ekonomi yang nyata

Karena indikator GDP yang ada tidak akurat. Dan jika Anda bertanya Dylan Patel berapa banyak GDP telah dibuat, nomor akan sangat kecil, dan itu akan keluar dari proporsi dengan nilai yang saya pikir saya benar-benar miliki。

jadi pertanyaan terakhir adalah: berapa banyak nilai yang telah dibuat token ini? ini bukan hanya pendapatan langsung, tapi efek riak yang mereka bawa. apa konsekuensi dari semua yang mereka lakukan

saya pikir itu adalah masalah yang nyata dan tantangan yang paling sulit untuk diukur. saya pikir kami memiliki penilaian yang sangat baik di sisi pasokan. kami juga memiliki penilaian yang sangat baik tentang banyak sinyal di sisi permintaan. tapi sulit untuk mengkuantifikasi dan mengukur nilai apa yang telah diciptakan token ini. kuharap kita bisa melakukan ini setiap tiga bulan, karena ini terlalu cepat。

PROTES ANTI-AI, MUNGKIN DALAM WAKTU TIGA BULAN

Kekhawatiran Patrick O:

Menurutmu apa yang terjadi selanjutnya? Sampai jumpa di San Francisco dalam tiga bulan. Apa yang kau harapkan

Apa

Protes massal。

Ketajaman Patrick O'Shaughty

PROTES TERHADAP AI。

- Dylan Patel

Orang-orang membenci AI. AI sekarang bahkan kurang populer daripada ICE, lebih dari politisi. Aku tidak tahu bagaimana Pew melakukannya, tapi tampaknya AI kurang populer daripada politisi。

Sebagai Antropik meningkat begitu banyak pendapatan, mulai memicu perubahan bisnis di hilir. Orang-orang akan takut pada AI. Mereka akan mulai menyalahkan AI untuk semakin banyak masalah mereka, dan juga untuk banyak masalah global yang sudah lama berdiri dan berakar dalam。

MASALAH INI AKAN MUNCUL DAN DIKAITKAN DENGAN AI. KEMUNGKINAN BESAR, BEBERAPA POLITISI, ATAU ORANG DI MEDIA SOSIAL, INFLUENCER, AKAN MULAI MEMPERSENJATAI AI UNTUK MENYERANG ORANG LAIN。

Lihat komentar di bawah beberapa artikel berita. Rumah Sam Altman dilemparkan ke dalam botol terbakar dua kali dalam dua minggu, dan seseorang di bagian komentar berteriak. Ini hanya permulaan. Jadi saya pikir dalam tiga bulan kita akan melihat protes besar-besaran terhadap AI。

Kekhawatiran Patrick O:

APA DAYA UNTUK OFFSET ITU? AI, BAGAIMANA SEHARUSNYA TANGGAPAN INDUSTRI DI MUKA

Apa

Pertama, Sam Altman dan Dario harus berhenti mewawancarai. Mereka terlalu tidak menarik. Aku tidak tahu apa yang mereka lakukan. Setiap wawancara membuat orang biasa semakin membenci mereka. Misalnya, Sam Altman di Tucker Carlson, mungkin membuat semua Republik lebih membenci OpenAI. Dario juga sama. Mereka tidak menarik. Itu poin pertama。

KEDUA, MEREKA PERLU MULAI MEMPERLIHATKAN HAL - HAL POSITIF YANG DAPAT DILAKUKAN OLEH AI。

KETIGA, MEREKA PERLU BERHENTI BERBICARA TENTANG BAGAIMANA KEMAMPUAN "AI AKAN MENGUBAH DUNIA." ORANG-ORANG HANYA BISA TAKUT MENDENGAR ITU. TERUTAMA KETIKA MEREKA TIDAK MEMILIKI HUBUNGAN NYATA DENGAN TEKNOLOGI INI。

Ketajaman Patrick O'Shaughty

Mereka tak tahu cara menggunakannya。

Apa

Dan mereka tidak terhubung dengannya. Orang biasa tidak mengenal karyawan Antropik atau karyawan OpenAI. Orang-orang biasa tidak tahu siapa orang-orang ini atau apa yang mereka menargetkan. Mereka hanya melihat perusahaan-perusahaan ini sebagai kelompok kecil yang licik: ribuan orang berkumpul di satu perusahaan untuk mengubah dunia, mengotomati semua pekerjaan dan menghancurkan masyarakat. Itulah yang banyak orang lihat。

SELAIN ITU, PERUSAHAAN-PERUSAHAAN INI MEMBIAYAI DAN MEMPROMOSIKAN PEMBANGUNAN SEJUMLAH BESAR PUSAT DATA DAN PEMBANGKIT LISTRIK YANG, DI MATA PUBLIK, DAPAT MENCEMARI DUNIA. ORANG-ORANG TIDAK BENAR-BENAR MENGERTI APA YANG TERJADI. JADI PERUSAHAAN-PERUSAHAAN INI HARUS BERHENTI BERBICARA TENTANG PERUBAHAN BESAR YANG AKAN TERJADI DI MASA DEPAN, SEKARANG: BAGAIMANA AI AKAN MEMBUAT PERBEDAAN POSITIF SEKARANG. SAYA PIKIR INI MEMBUTUHKAN ORGANISASI BESAR DAN RENOVASI MEREK。

Kekhawatiran Patrick O:

Aku suka melakukan percakapan ini denganmu. Terima kasih atas waktumu。

Apa

Terima kasih。

Video Link

Di era AI, pertarungan utama Token antara penawaran dan permintaan

♪ TL;DR ♪

Penyusun:

Kode Claude menjadi tenaga kerja baru

Si Token menjadi sumber daya produksi baru

Robot-robot akan mengambil gelombang permintaan berikutnya

Kekurangan tenaga komputasi menyebabkan seluruh rantai industri

AIA VALUE SULIT MENDAPATKAN STATISTIK GDP

PROTES ANTI-AI, MUNGKIN DALAM WAKTU TIGA BULAN

Artikel Berkaitan

Berita Amerika Serikat

Near TGE, MegaETH Eco-Defi emas menggali panduan

Ketika AI Agen mengambil alih rantai wewenang: Seberapa jauh paradigma keuangan baru Web 4.0

Untuk 3 juta cedera sumsum tulang belakang, dia meretas kursi roda

Produk

Undang-Undang & Sokongan

Pautan Rakan