Podcast Wong In- hoon: parit In Weida jauh lebih dalam daripada chip

Judul video: Jensen Huang:?

Foto oleh Dwarkesh Patel

Foto oleh Peggy Block Beats

Editor tersebut menekan bahwa, sementara dunia luar masih mendiskusikan apakah parit Inverda berasal dari rantai pasokan, dialog berpendapat bahwa apa yang benar-benar sulit untuk mereplikasi bukanlah chip itu sendiri, tetapi kemampuan sistem penuh untuk mengubah "elektronik menjadi Token" - dari arsitektur komputasi, sistem perangkat lunak, dan ekosistem lingkungan pengembang。

Pos ini telah diedit oleh Dwarkesh Patel dan berbicara dengan Jensen Huang. Dwarkesh Patel adalah salah satu podcast yang paling menarik di Silicon Valley, yang memimpin saluran YouTube, Dwarkesh Podcast, untuk interview penelitian yang mendalam dan dialog jangka panjang antara peneliti AI dan inti industri teknologi。

Dwarkesh Patel di sebelah kanan, Jensen Huang di sebelah kiri

Di sekitar inti ini, percakapan ini dapat dipahami pada tiga tingkat。

Yang pertama adalah perubahan teknologi dan struktur industri。

Kekuatan Yvette tidak hanya kinerja perangkat keras, tapi ekologi pengembang yang dibawa CUDA, dan jalur di sekitar tumpukan kalkulator. Dalam sistem ini, komputasi bukan lagi satu-satunya variabel, dan algoritma, rekayasa sistem, jaringan dan efisiensi energi bersama-sama menentukan kecepatan kemajuan AI. Hal ini juga mengarah pada penghakiman yang penting: perangkat lunak tidak hanya "komersialisasi" karena AI, tapi nilai dari perangkat lunak lebih besar diperkuat dengan ekspansi Agen, yang akan menghasilkan peningkatan eksponensial dalam penggunaannya。

Kedua, batasan komersial dan pilihan strategis。

DALAM MENGHADAPI PERLUASAN RANTAI AI INDUSTRIAL, YVETTE MEMILIH UNTUK "MELAKUKAN APAPUN YANG DIPERLUKAN TAPI TIDAK SEMUANYA". IA TIDAK MEMASUKI KOMPUTASI AWAN, JUGA TIDAK MELIBATKAN INTEGRASI VERTIKAL YANG BERLEBIHAN, MELAINKAN MEMPERLUAS UKURAN PASAR SECARA KESELURUHAN MELALUI DUKUNGAN INVESTASI DAN EKOLOGI. INI MENAHAN DIRI TELAH MEMUNGKINKAN UNTUK MEMPERTAHANKAN BAIK KONTROL KRITIS DAN MENGHINDARI MENJADI PENGGANTI EKOLOGI, SEHINGGA MEMADUKAN LEBIH BANYAK PESERTA KE DALAM SISTEM TEKNIS。

Ketiga, ada perbedaan tentang penyebaran teknologi dan pola industri。

BAGIAN YANG PALING KUAT DARI DIALOG INI BUKAN TENTANG KESIMPULAN KONKRIT, TAPI TENTANG BAGAIMANA MEMAHAMI "RISIKO" ITU SENDIRI. SALAH SATU SUDUT PANDANG MENEKANKAN KEUNTUNGAN PRE- EMPTIVE DARI MEMIMPIN DALAM ANGKA, SEDANGKAN YANG LAIN LEBIH FOKUS PADA JANGKA PANJANG KEEKOLOGI DAN STANDAR DALAM DIFUSI TEKNOLOGI. MUNGKIN PERTANYAAN YANG LEBIH PENTING DARIPADA KESENJANGAN KAPASITAS JANGKA PENDEK ADALAH APA SISTEM TEKNOLOGI MODEL DAN PENGEMBANG AI MASA DEPAN BEROPERASI。

Dengan kata lain, akhir kompetisi ini bukan hanya "siapa yang memimpin model yang lebih baik" tapi "yang mendefinisikan infrastruktur di mana modelnya beroperasi"。

DALAM HAL INI, PERAN INVERDA TIDAK LAGI HANYA SEBUAH PERUSAHAAN CHIP, TAPI LEBIH DEKAT KE AL ERA "PENYEDIA SISTEM OPERASI BAWAH" -- INI BERUSAHA UNTUK MEMASTIKAN BAHWA JALUR DARI GENERASI NILAI TERUS BERPUTAR DI SEKITAR DIRINYA SENDIRI, TERLEPAS DARI BAGAIMANA KAPASITAS KOMPUTASI MENYEBAR。

Berikut ini adalah teks asli (untuk memfasilitasi membaca dan memahami, teks asli telah dikonsolidasikan):

TL; DR

Moat Inverda bukanlah "chip" tapi "kemampuan sistem- luas dari elektronik ke Token". Inti bukanlah kinerja perangkat keras, tapi kapasitas total untuk mengubah perhitungan menjadi harga (struktur + software + ekologi)。

INTI DARI CUDA BUKANLAH ALAT, TAPI EKOLOGI PENGEMBANG AI TERBESAR DI DUNIA. PENGEMBANG, FRAMEWORKS, MODEL SEMUA TERIKAT PADA GUDANG TEKNOLOGI YANG SAMA UNTUK MEMBENTUK KETERGANTUNGAN JALUR TAK TERGANTIKAN。

KUNCI KOMPETISI BUKAN HANYA KALKULUS, TAPI KOMBINASI DARI "PERHITUNGAN TUMPUKAN X ALGORITMA X SISTEM REKAYASA". ARSITEKTUR, JARINGAN, EFISIENSI ENERGI, DAN SINERGI PERANGKAT LUNAK TELAH MENYEBABKAN PERBAIKAN YANG JAUH MELAMPAUI KEMAJUAN BELAKA。

Pengukuran botol adalah jangka pendek dan pasokan akan diisi oleh demand-didorong sinyal dalam 2- 3 tahun. Batas jangka panjang yang sebenarnya bukan chip, tapi energi dan infrastruktur。

Perangkat lunak AI tidak akan dimodifikasi, tetapi akan menyebabkan pertumbuhan eksponensial yang digunakan sebagai hasil dari wabah Agen. Masa depan bukan perangkat lunak yang lebih murah, tapi lonjakan panggilan perangkat lunak。

Strategi utama dari tidak melakukan awan adalah untuk melakukan apa yang diperlukan, tetapi tidak untuk menelan seluruh rantai nilai. Meningkatkan ukuran pasar secara keseluruhan melalui dukungan investasi dan ekologi, daripada integrasi vertikal。

RISIKO STRATEGIS SEBENARNYA BUKAN BAHWA SAINGAN MENDAPATKAN MATEMATIKA, TETAPI BAHWA GLOBAL AI EKOLOGI TIDAK LAGI DIDASARKAN PADA TEKNOLOGI AMERIKA. SETELAH MODEL DAN PENGEMBANG BERMIGRASI, STANDAR TEKNIS JANGKA PANJANG DAN KEPEMILIKAN INDUSTRI AKAN BERGESER。

Wawancara

Di mana parit di In Weida: rantai pasokan, atau kontrol "elektronik ke Token"

Dwarkesh Patel (Moderator):

KITA TELAH MELIHAT PENURUNAN DALAM PENILAIAN BANYAK PERUSAHAAN PERANGKAT LUNAK KARENA DIHARAPKAN BAHWA AI AKAN MENGUBAH PERANGKAT LUNAK MENJADI KOMODITAS STANDAR. ADA JUGA CARA YANG SEDIKIT NAIF UNTUK MEMAHAMI: ANDA LIHAT, DARI FILE DESAIN (GDS2) KE BUILDING -UP DARI CHIP LOGIKA, LINGKARAN KRISTAL, PEMBANGUNAN SIRKUIT SWITCH, DAN KEMUDIAN SEGEL DENGAN HBM DIHASILKAN OLEH SK HERCULES, MIO, SAMSUNG, DAN KEMUDIAN MENGIRIMNYA KE ODM UNTUK MERAKIT SELURUH RAK。

Catatan: HBM (Memori Bandwidth Tinggi, Memori High-bandwidth) adalah teknologi memori canggih yang dirancang khusus untuk komputasi kinerja tinggi dan AI; ODM (Pembuat Desain Asli, produsen desain asli) berarti sebuah pabrik proxy yang bertanggung jawab tidak hanya untuk produksi tetapi juga untuk Bisnis desain produk

Jadi dari sudut pandang ini, itu pada dasarnya adalah perangkat lunak, dan itu dibuat oleh orang lain. Jika perangkat lunak dimodifikasi, maka juga akan dimodifikasi。

Jensen Huang:

tapi dalam analisis akhir, harus ada proses untuk mengubah elektronik menjadi token. dari elektronik ke token, dan untuk membuat token ini lebih berharga dari waktu ke waktu, saya pikir sulit untuk benar-benar dikomersialisasi。

transformasi dari elektron ke token adalah sendiri proses yang luar biasa. dan membuat satu token lebih berharga, sama seperti membuat satu molekul lebih berharga daripada yang lain adalah membuat satu token lebih berharga daripada yang lain。

dalam proses ini, ada banyak seni, teknik, ilmu pengetahuan dan penemuan untuk memberikan nilai token ini。

Jelas, kita mengamati ini secara real time. Jadi proses transformasi, proses manufaktur dan sinyal yang terlibat jauh dari sepenuhnya dipahami dan perjalanan jauh dari selesai. Jadi saya tidak berpikir itu akan terjadi。

tentu saja, kami akan membuatnya lebih efisien. bahkan, cara anda menjelaskan masalahnya sebenarnya adalah model pikiran saya untuk inverda: input adalah elektron, keluaran adalah token, dan tengah adalah yvette。

Tugas kita adalah "melakukan apa yang diperlukan, sementara melakukan hal kecil yang diperlukan" untuk mencapai transformasi ini dan memberikan kapasitas tertinggi。

KETIKA SAYA MENGATAKAN "LAKUKAN SESEDIKIT MUNGKIN" KITA BERARTI APA YANG KITA TIDAK PERLU LAKUKAN DIRI KITA SENDIRI, KITA BEKERJA DENGAN ORANG LAIN UNTUK MEMASUKKAN KE DALAM EKOLOGI KITA. JIKA ANDA MELIHAT INGGRIS HARI INI, KITA MUNGKIN MEMILIKI SALAH SATU EKOSISTEM KOOPERATIF TERBESAR BAIK DI HULU MAUPUN DI HILIR RANTAI PASOKAN. DARI PRODUSEN KOMPUTER, PENGEMBANG APLIKASI, KE PENGEMBANG MODEL -- ANDA DAPAT MELIHAT AI SEBAGAI KUE 5 LANTAI. DAN KITA MEMILIKI TATA LETAK EKOLOGI DI LIMA TINGKAT INI。

Baca tentang:YIN WEIDA WONG POS TERBARU IN- HOON: "LIMA LAPISAN KUE" OLEH AIHanya itu yang terjadi

Jadi kita mencoba untuk tidak melakukan itu, tapi bahwa bagian dari apa yang harus kita lakukan adalah sangat sulit. Dan saya tidak berpikir bagian itu akan dikomersialisasi。

Bahkan, saya tidak berpikir perusahaan perangkat lunak benar-benar membuat alat. Kenyataannya, bagaimanapun, adalah bahwa hari ini kebanyakan perusahaan perangkat lunak memang alat penyedia。

Ada, tentu saja, pengecualian, beberapa dalam coding dan pembekuan sistem aliran kerja, tetapi banyak perusahaan pada dasarnya perusahaan alat。

Excel adalah alat, PowerPoint adalah alat, Cadence memakai alat, Sinopsys adalah alat。

Jensen Huang:

dan apa yang saya lihat adalah kebalikan dari apa yang banyak orang pikirkan. saya pikir jumlah kemarahan akan meningkat secara eksponensial, dan jumlah pengguna alat akan meningkat secara eksponensial。

Ada juga potensi lonjakan dalam jumlah panggilan untuk alat. Misalnya, penggunaan Synopsys Design Compiller cenderung meningkat secara signifikan。

akan ada sejumlah besar delegasi menggunakan perencana lantai, alat tata letak, aturan desain alat cek。

hari ini, kita terbatas pada jumlah insinyur; besok, insinyur ini akan didukung oleh sejumlah besar kemarahan, dan kita akan menjelajahi ruang desain dengan cara yang belum pernah terjadi sebelumnya. ketika anda menggunakan alat ini hari ini, perubahan ini akan sangat jelas。

penggunaan alat akan mendorong perusahaan-perusahaan perangkat lunak ini untuk boom. ini belum terjadi karena agen saat ini tidak cukup baik untuk menggunakan alat。

jadi baik perusahaan-perusahaan ini membangun kemarahan mereka sendiri, atau marah itu sendiri menjadi cukup kuat untuk menggunakan alat-alat ini. saya pikir itu akhirnya akan menjadi kombinasi dari dua。

Dwarkesh Patel

Aku ingat dalam pengungkapan terakhir Anda, Anda memiliki hampir $100 miliar dalam komitmen pengadaan untuk komponen perbatasan, memori, menyegel, dll. Laporan SemiAnalysis menunjukkan bahwa angka ini bisa mencapai $250 miliar。

Salah satu interpretasi adalah bahwa parit di Inverda adalah bahwa Anda telah mengunci pasokan komponen langka ini selama bertahun-tahun yang akan datang. Dengan kata lain, orang lain mungkin bisa membuat pemercepat, tetapi mereka bisa mendapatkan cukup memori? Bisakah mereka mendapatkan cukup chip logis

Apakah ini keuntungan utama tahun depan

Jensen Huang:

Itu satu hal yang bisa kita lakukan, tapi sulit bagi orang lain untuk melakukannya. Kita telah mampu membuat komitmen besar ke hulu, pada bagian yang jelas, yaitu, dalam komitmen percobaan yang Anda sebut, dan di bagian tersembunyi。

CONTOHNYA, SEBAGIAN BESAR INVESTASI DI HULU KITA DIBUAT OLEH MITRA RANTAI PASOKAN KITA, KARENA SAYA AKAN BERKATA KEPADA CEO MEREKA, "MARI SAYA KATAKAN SEBERAPA BESAR INDUSTRI INI, MARI SAYA JELASKAN MENGAPA, SAYA AKAN BERMAIN DENGAN ANDA, DAN SAYA AKAN MEMBERITAHU ANDA APA YANG SAYA LIHAT"。

MELALUI PROSES TERSEBUT - MENYAMPAIKAN PESAN, MERANGSANG VISI, MEMBANGUN KONSENSUS - SAYA SELARAS DENGAN CEO DALAM INDUSTRI YANG BERBEDA HULU, DAN MEREKA BERSEDIA UNTUK MEMBUAT INVESTASI INI。

Lalu mengapa mereka berinvestasi dalam diriku bukan untuk orang lain? Karena mereka tahu bahwa aku bisa membeli kapasitas mereka dan mencernanya melalui hilir saya. Hal ini karena permintaan hilir dan ukuran rantai pasokan Inverda bahwa mereka bersedia untuk berinvestasi hulu。

ANDA LIHAT GTC, UKURAN MAJELIS UMUM MENGEJUTKAN BANYAK ORANG. INI PADA DASARNYA ADALAH SEBUAH ALAM SEMESTA AI 360 DERAJAT, MEMBAWA SELURUH INDUSTRI BERSAMA-SAMA. SEMUA ORANG BERKUMPUL KARENA MEREKA PERLU SALING BERTEMU. AKU MEMBAWA MEREKA BERSAMA-SAMA UNTUK MELIHAT HILIR, HILIR UNTUK MELIHAT KEMAJUAN DI AI。

DAN YANG LEBIH PENTING, MEREKA MEMILIKI AKSES KE PERUSAHAAN-PERUSAHAAN UTAMA AI DAN STARTUP, DAN MEREKA MELIHAT INOVASI YANG TERJADI, SEHINGGA MEREKA DAPAT MEMVERIFIKASI APA YANG SAYA BICARAKAN。

jadi saya menghabiskan banyak waktu menjelaskan, langsung atau tidak langsung, kesempatan ke depan untuk rantai pasokan dan mitra ekologi kita. banyak orang akan mengatakan bahwa catatan kunci saya tidak berasal dari pers tradisional, tetapi bagian dari itu terdengar seperti sebuah kelas. dan itulah yang sebenarnya kulakukan。

Saya perlu memastikan bahwa seluruh rantai pasokan - hulu dan hilir - memahami apa yang terjadi berikutnya, mengapa, ketika, seberapa besar, dan secara sistematis menyimpulkan seperti saya。

Jadi jenis parit yang Anda bicarakan, itu memang ada. Jika pasar ini mencapai triliunan dolar pada tahun-tahun mendatang, kita memiliki kapasitas untuk membangun rantai pasokan yang menopang itu. Seperti dengan arus uang, ada gerakan dan turnover dalam rantai pasokan. Tidak ada yang akan membangun rantai pasokan untuk struktur jika tidak berjalan cukup cepat. Kita telah mampu mempertahankan ukuran ini karena permintaan hilir sangat kuat, dan kita semua bisa melihat itu。

Hal ini yang memungkinkan kita untuk melakukan hal-hal ini dalam skala seperti ini。

Dwarkesh Patel

Saya ingin melihat apakah saya bisa mengikuti. Selama bertahun-tahun terakhir, pendapatan Anda hampir dua kali lipat selama bertahun-tahun, dan kalkulus global bahkan tiga kali lipat。

Jensen Huang:

Dan itu terus dua kali lipat dalam volume ini。

Dwarkesh Patel

BENAR. JADI JIKA ANDA MELIHAT CHIP LOGIS, SEPERTI ANDA SALAH SATU KLIEN TERBESAR DALAM PROSES N3, PADA N2 JUGA。

MENURUT BEBERAPA ANALISIS, TAHUN INI AI DAPAT MENJELASKAN 60% KAPASITAS N3, ATAU BAHKAN 86% TAHUN DEPAN。

Catatan: N3 mengacu ke 3 nanometer (3nm) node dari TSMC, yang dapat dipahami sebagai salah satu negara bagian - dari - the- art chip proses pembuatan dari generasi saat ini listrik desktop

BAGAIMANA KAU BISA MENGGANDAKANNYA SAAT KAU SUDAH DALAM POSISI INI? DAN GANDA SETIAP TAHUN? APAKAH KITA PADA TAHAP DI MANA PERTUMBUHAN AI DALAM JUMLAH HARUS LAMBAT KARENA BATASAN UPSTREAM? APAKAH ADA CARA UNTUK MENGHINDARI PEMBATASAN INI? BAGAIMANA CARANYA

Jensen Huang:

Pada saat tertentu, permintaan tidak melebihi pasokan untuk seluruh industri, baik hulu dan hilir. Dan dalam beberapa kasus, kita bahkan dapat dibatasi oleh jumlah tukang pipa - ini benar-benar terjadi。

Dwarkesh Patel:

GTC TAHUN DEPAN SEHARUSNYA MENGUNDANG TUKANG LEDENG。

Jensen Huang:

Ya, itu sebenarnya fenomena yang baik. Anda ingin berada di pasar di mana permintaan instan lebih besar dari total pasokan dari seluruh industri. Kebalikan tentu tidak sangat baik。

Jika kesenjangan antara keduanya terlalu besar, sebuah link spesifik, komponen menjadi batas yang jelas, dan seluruh industri bergerak untuk mengatasi itu. Sebagai contoh, saya melihat bahwa CoWos tidak dibahas lagi. Hal ini karena, selama dua tahun terakhir, kami telah berinvestasi dan mengembangkannya dalam skala yang sangat besar, yang telah dua kali lipat。

Sekarang saya pikir semuanya dalam posisi yang lebih baik. Hal ini juga telah diakui bahwa pasokan CoWos harus menjaga kecepatan dengan pertumbuhan dalam permintaan untuk chip logis dan memori. Jadi mereka memperluas COWOS, dan mereka juga memperluas masa depan teknik penahanan maju, dan mereka memperluas pada kecepatan yang sama seperti chip logis。

Ini sangat penting, karena di masa lalu, ingatan CoWos dan HBM lebih seperti "kemampuan khusus" tapi tidak lagi. Sekarang diketahui bahwa mereka adalah bagian dari teknik komputasi arus utama。

PADA SAAT YANG SAMA, KITA SEKARANG LEBIH SIAP UNTUK MEMPENGARUHI RANTAI PASOKAN YANG LEBIH LUAS. DI MASA LALU, PADA AWAL REVOLUSI AI, SAYA TELAH BERBICARA TENTANG PENILAIAN INI LIMA TAHUN YANG LALU。

Ada orang-orang yang percaya dan berinvestasi, seperti tim Sanjay cahaya cukup. Saya masih ingat rapat itu, ketika saya menjelaskan apa yang akan terjadi di masa depan, mengapa hal itu terjadi dan prediksi dari hasil ini hari ini. Mereka memilih untuk menambahkan sejumlah besar pada saat itu, dan kami mendirikan hubungan kerja sama dengan mereka. Mereka telah berinvestasi di banyak arah, seperti LPDDR, HBM dan sebagainya, dan ini jelas telah menghasilkan keuntungan yang cukup besar bagi mereka. Ada perusahaan yang telah mengikuti sejak itu, tapi kita semua pada tahap ini。

Jadi saya berpikir bahwa setiap generasi teknologi, setiap botol, akan mendapatkan banyak perhatian. Dan sekarang kita sudah berbicara tentang botol dari tahun-tahun sebelumnya. Sebagai contoh, kami bekerja dengan Lumentum, Coherent dan seluruh fotonik silikon. Selama beberapa tahun terakhir, kami telah secara efektif membentuk ulang seluruh rantai ekologi dan pasokan。

Dalam kasus cahaya silikon, kami telah membangun rantai pasokan lengkap di sekitar waduk, mengembangkan teknologi dalam kerjasama dengan mereka, menciptakan banyak teknologi baru dan lisensi paten ini ke rantai pasokan untuk mempertahankan keterbukaan ekologi. Kami mempersiapkan rantai pasokan dengan menciptakan teknologi baru, alur kerja baru, peralatan pengujian baru (termasuk dua kali lipat deteksi), berinvestasi di perusahaan dan membantu memperluas produksi mereka。

Jadi Anda dapat melihat bahwa kita secara proaktif membentuk ekologi ini sehingga rantai pasokan dapat mendukung skala masa depan。

Dwarkesh Patel:

Kedengarannya seperti beberapa botol lebih mudah untuk memecahkan daripada yang lain. Sebagai contoh, mereka yang lebih sulit untuk memperluas daripada CoWos

Jensen Huang:

Aku baru saja menyebutkan contoh yang paling sulit。

Dwarkesh Patel:

Yang mana

Jensen Huang:

Tukang ledeng. Ya, itu benar. Aku sedang berbicara tentang yang paling sulit - tukang ledeng dan listrik. Alasan untuk ini adalah bahwa hal ini juga memberi saya perhatian tentang istilah "akhir dari kehidupan" para pelaku, yang selalu berbicara tentang pekerjaan yang menghilang dan pekerjaan diganti. Jika kita mendapatkan orang untuk berhenti menjadi insinyur perangkat lunak, ada kekurangan nyata insinyur perangkat lunak di masa depan。

Proyeksi serupa dibuat 10 tahun yang lalu. (Dan dikatakan) kepadanya oleh yang ada di sekitarnya: Anda masih dapat menemukan video-video tersebut secara online, mengatakan bahwa radiologi akan menjadi pendudukan pertama yang akan dihilangkan dan bahwa dunia tidak akan lagi membutuhkan radiolog. Tapi kenyataannya adalah kita sekarang kekurangan radiolog。

Dwarkesh Patel:

BAIKLAH, MARI KITA KEMBALI KE PERTANYAAN TADI: ADA LINK YANG DAPAT DIPERLUAS DAN TIDAK ADA LINK. JADI BAGAIMANA KITA MENGGANDAKAN KAPASITAS DARI CHIP LOGIKA? SETELAH SEMUA, BOTOL NYATA DI SINI ADALAH BAIK MEMORI DAN LOGIKA. BAGAIMANA DENGAN EUV? BAGAIMANA KAU MENGGANDAKAN NOMORNYA SETIAP TAHUN

Jensen Huang:

Semua ini tidak bisa dilakukan. Memang benar bahwa ekspansi cepat tidak mudah, tetapi tidak sulit untuk melakukannya dalam waktu dua sampai tiga tahun. Kuncinya adalah untuk memiliki sinyal permintaan yang jelas. Setelah Anda dapat membuat satu, Anda dapat membuat sepuluh, setelah Anda dapat membuat sepuluh, Anda dapat membuat satu juta. Jadi tidak terlalu sulit untuk menyalin。

Dwarkesh Patel:

SEBERAPA DALAM KAU AKAN MEMBERIKAN PENILAIAN ITU KE RANTAI PASOKAN? APAKAH ANDA, MISALNYA, PERGI KE ASML DAN BERKATA, "JIKA SAYA MENCARI UNTUK TIGA TAHUN KE DEPAN, UNTUK MEMBUAT PENDAPATAN TAHUNAN INGGRIS $2 TRILIUN, KITA PERLU LEBIH BANYAK EUVS?"

Jensen Huang:

BEBERAPA AKAN SAYA LAKUKAN SECARA LANGSUNG, BEBERAPA SECARA TIDAK LANGSUNG. JIKA AKU BISA MEYAKINKAN PEMBANGUNANNYA, MAKA ASML AKAN YAKIN. JADI KITA PERLU MENGIDENTIFIKASI BOTOL KUNCI. TAPI SELAMA PEMBANGUN PERCAYA PADA TREN INI, ANDA AKAN MEMILIKI CUKUP PERALATAN EUV DALAM BEBERAPA TAHUN。

Maksudku, tidak ada yang akan bertahan lebih dari dua sampai tiga tahun, tidak satupun dari mereka。

Pada saat yang sama, kita meningkatkan efisiensi komputasi. Dari Hopper ke Blackwell, sekitar 10 kali, 20 kali, dan dalam beberapa kasus 30 sampai 50 kali. Kami juga terus-menerus mengusulkan algoritma baru. Karena CUDA cukup fleksibel, kita dapat mengembangkan metode baru untuk meningkatkan efisiensi sementara memperluas kapasitas produksi。

Jadi semua ini membuatku khawatir. Apa yang benar-benar membuatku khawatir adalah faktor-faktor di luar hilir kita, seperti kebijakan energi. Tanpa energi Anda tidak dapat memperluas; tanpa energi Anda tidak dapat membangun industri; tanpa energi Anda tidak dapat membangun sistem manufaktur yang sama sekali baru。

Sekarang kami ingin mempromosikan industri re- Amerika dengan membawa kembali chip, komputer, segel, dan membangun industri baru seperti mobil listrik dan robot. Ketika kita membangun pabrik AI, itu semua energi, dan energi-terkait siklus konstruksi panjang. Sebaliknya, meningkatkan kapasitas chip adalah masalah dua sampai tiga tahun; meningkatkan kapasitas CoWos juga masalah dua sampai tiga tahun。

Dwarkesh Patel:

Menarik. Saya merasa bahwa beberapa tamu yang saya wawancarai memberikan penilaian yang berlawanan. Hanya saja aku tidak punya latar belakang teknis yang cukup untuk menilai。

Jensen Huang:

Tapi hal yang baik adalah, Anda berbicara dengan para ahli sekarang。

Apakah TPU Google mengguncang posisi Inggris

Dwarkesh Patel:

Ya, memang. Aku ingin bertanya sainganmu. Jika Anda melihat TPU, dapat dikatakan bahwa dua dari top dunia tiga model sekarang - Claude dan Gemini -- dilatih dengan TPU. Apa artinya ini untuk masa depan Inverda

Catatan: TPU (Unit Pemroses Tensor) adalah tipe inti khusus yang dirancang oleh Google untuk kecerdasan buatan (khususnya pembelajaran dalam diri). Snippet

Jensen Huang:

Kami melakukan sesuatu yang sama sekali berbeda. Pembangunan YVD adalah "perhitungan dipercepat" daripada "proses skala" (TPU)。

MEMPERCEPAT PERHITUNGAN DAPAT DIGUNAKAN UNTUK BERBAGAI TUGAS, SEPERTI DINAMIKA MOLEKUL, KUANTIUM DINAMIKA WARNA, PENGOLAHAN DATA, FRAME DATA, DATA YANG TERSTRUKTUR, TIDAK TERSTRUKTUR DATA, HIDRODINAMIKA, FISIKA PARTIKEL, DAN, TENTU SAJA, AI. OLEH KARENA ITU, APLIKASI PERHITUNGAN DIPERCEPAT JAUH LEBIH LUAS。

MESKIPUN DISKUSI SEKARANG BERFOKUS PADA AI, YANG MEMANG SANGAT PENTING DAN BERPENGARUH, "PERHITUNGAN" ITU SENDIRI JAUH LEBIH LUAS DARIPADA AI. APA YANG YVETTE LAKUKAN ADALAH MENCIPTAKAN PERHITUNGAN DARI YANG UMUM SAMPAI PERHITUNGAN DIPERCEPAT. CAKUPAN PASAR KAMI JAUH LEBIH BESAR DARIPADA TPU ATAU AKSELERATOR KHUSUS LAINNYA。

Jika kita melihat lokasi kita, kita satu-satunya perusahaan yang dapat mempercepat semua jenis aplikasi. Kita memiliki ekosistem yang besar, dan framework dan algoritma dapat beroperasi pada platform Wida Inggris. Dan sistem komputer kita dirancang untuk dioperasikan oleh orang lain. Operator manapun dapat membeli sistem kita untuk digunakan。

Sebagian besar sistem belajar tidak dirancang untuk digunakan oleh orang lain, dan pada dasarnya Anda harus mengoperasikannya sendiri, karena mereka tidak dirancang untuk fleksibel untuk digunakan oleh orang lain dari awal. Karena sistem kami dapat dijalankan oleh siapapun, kami memiliki akses ke semua platform utama, termasuk Google, Amazon, Azure, OCI。

Apakah Anda mengoperasikan sistem untuk tujuan menyewa komputasi atau menggunakannya untuk penggunaan Anda sendiri, jika Anda akan menyewanya, Anda harus memiliki ekologi pelanggan skala besar meliputi berbagai industri untuk memenuhi tuntutan tersebut. Jika Anda menjalankan sistem untuk Anda gunakan sendiri, kita pasti memiliki kapasitas untuk membantu Anda melakukannya. Misalnya, Elon xAI。

Karena kita bisa mendapatkan industri apapun, operator perusahaan apapun untuk menggunakan sistem kita yang dapat Anda gunakan untuk membangun superkomputer untuk perusahaan seperti Lily untuk penelitian ilmiah dan penemuan narkoba. Kita dapat membantu mereka menjalankan superkomputer mereka sendiri dan menggunakannya untuk spektrum seluruh penelitian narkoba dan pengembangan dan aplikasi biosains, yang merupakan daerah di mana kita dapat mempercepat。

JADI KITA DAPAT MENCAKUP BANYAK APLIKASI, DAN TPU TIDAK BISA MELAKUKAN ITU. THE CUDA SENDIRI, DIBANGUN OLEH IN WEIDA, DAPAT MENJADI PLATFORM PEMROSESAN YANG SANGAT BAIK, TETAPI LEBIH DARI ITU, MENCAKUP SELURUH SIKLUS KEHIDUPAN DARI PENGOLAHAN DATA, KOMPUTASI, AL, DLL. JADI KITA MEMILIKI PELUANG PASAR YANG LEBIH BESAR DAN CAKUPAN YANG LEBIH LUAS. DAN KARENA KITA SEKARANG SEBAGIAN BESAR MENDUKUNG DARI SEMUA JENIS APLIKASI DI SELURUH DUNIA, ANDA DAPAT MENYEBARKAN SISTEM DI MANA SAJA, DAN ANDA DAPAT YAKIN BAHWA AKAN ADA PELANGGAN UNTUK MENGGUNAKANNYA。

Jadi itu adalah hal yang sama sekali berbeda。

Dwarkesh Patel:

Pertanyaannya akan sedikit lebih lama。

PENDAPATANMU SAAT INI LUAR BIASA, DAN TIDAK TERUTAMA DARI PERHITUNGAN FARMASI ATAU KUANTUM. ANDA TIDAK MENGHASILKAN $60 MILIAR PER KUARTAL DARI OPERASI INI, TAPI AI ADALAH TEKNOLOGI YANG BELUM PERNAH TERJADI SEBELUMNYA YANG BERGERAK PADA KECEPATAN YANG BELUM PERNAH TERJADI SEBELUMNYA。

JADI PERTANYAANNYA ADALAH, JIKA HANYA AI, APA PILIHAN TERBAIKNYA? SAYA TIDAK MELAKUKAN GARIS BAWAH, TAPI SAYA TELAH BERBICARA DENGAN BEBERAPA TEMAN PENELITI AI, DAN MEREKA BERKATA, "KETIKA SAYA MENGGUNAKAN TPU, ITU ADALAH ARRAY BESAR YANG SEMPURNA UNTUK PERKALIAN MATRIKS; DAN GPU LEBIH FLEKSIBEL, UNTUK BANYAK CABANG DAN TIDAK TERATUR AKSES MEMORI。

Tetapi jika Anda melihat AI, bukan dasarnya perkalian matriks berulang-ulang dan lagi? Jadi Anda tidak benar-benar perlu untuk mengambil daerah chip untuk fungsi penjadwalan warp, switching linear, bank memori, dll. Jadi TPU sangat teroptimasi untuk aplikasi utama dalam permintaan gelombang saat ini dan pertumbuhan pendapatan。

Bagaimana menurutmu

Jensen Huang:

PERKALIAN MATRIKS MEMANG MERUPAKAN BAGIAN PENTING DARI AI, TETAPI TIDAK SEMUA AI。

Jika Anda ingin membuat mekanisme baru, atau melakukannya dengan cara yang berbeda, jika Anda ingin merancang arsitektur yang benar-benar baru, seperti hybrid SSM, jika Anda ingin membangun sebuah model yang menggabungkan penyebaran dan autogresif -- - Yang Anda butuhkan adalah struktur pemrograman universal, dan kita dapat menjalankan apa pun yang Anda pikirkan。

ITU KEUNTUNGAN KITA. ITU MEMBUAT ALGORITMA BARU JAUH LEBIH MUDAH. HAL INI KARENA SISTEM INI DAPAT DIPROGRAM, DAN ALASAN AI DAPAT MEMBUAT KEMAJUAN CEPAT SEPERTI ITU。

TPU, SEPERTI PERANGKAT KERAS LAINNYA, DIPENGARUHI OLEH HUKUM MOORE. KITA TAHU BAHWA HUKUM MOORE MEMBAWA SEKITAR 25 PERSEN DARI PENINGKATAN SETIAP TAHUN. JADI JIKA ANDA INGIN MELOMPAT 10 KALI, 100 KALI, SATU-SATUNYA CARA ADALAH MENGUBAH ALGORITMA DAN BAGAIMANA ITU DIHITUNG SETIAP TAHUN。

Itulah inti kekuatan Ingweida。

Alasan mengapa kita berhasil membuat Blackwell besar - saya katakan 35 kali - meningkatkan efisiensi energinya 35 kali lebih dari Hope, tidak ada yang percaya。

Lalu Dylan menulis sebuah artikel yang mengatakan bahwa saya benar-benar konservatif dan bahwa saya hampir 50 kali lebih maju, dan ini tidak dapat dicapai oleh hukum Moore saja. Solusi kami untuk masalah ini adalah untuk memperkenalkan struktur model baru, seperti MoE, dan untuk memperluas komputasi ke seluruh sistem komputasi melalui paralel, dekopling dan pengolahan distributif. Sulit untuk melakukan ini tanpa kemampuan untuk pergi ke bawah dan mengembangkan kernel komputasi baru menggunakan CUDA。

Catatan: Ganti ke Dylan Patel, seorang analis terkenal di bidang semikonduktor dan infrastruktur AI, pendiri lembaga penelitian SemiAnalysis

Jadi keuntungan kita adalah kemampuan program arsitektur dan fakta bahwa Yvette adalah perusahaan yang sangat terkoordinasi. Kita bahkan dapat membongkar beberapa perhitungan ke dalam struktur yang saling berhubungan, seperti NVLink, atau lapisan jaringan, seperti Spectaly- X. Dengan kata lain, kita dapat mendorong perubahan pada saat yang sama sebagai prosesor, sistem, interkoneksi, bank perangkat lunak, algoritma. Semua ini dicapai secara bersamaan. Aku bahkan tidak tahu harus mulai dari mana tanpa CUDA mendukung semua ini。

Dwarkesh Patel:

Hal ini juga menimbulkan pertanyaan tentang struktur klien Selandia Baru: Dan jika Anda 60 persen dari pendapatan Anda berasal dari lima superscalpers ini, mereka akan sangat tergantung pada CUDA di era lain, menghadapi berbagai jenis klien, seperti profesor percobaan. Mereka tidak dapat menggunakan akselerator lain, mereka dapat menggunakan PyTorch + CUDA, dan mereka membutuhkan semuanya untuk dioptimalkan。

Tetapi jika ini super- besar produsen awan mampu menulis inti mereka sendiri. Bahkan, mereka harus melakukan itu untuk mengekstrak 5% terakhir kinerja mereka. Anthropic, Google sering berlatih dengan akselerator riset atau TPU. Bahkan OpenAI akan menggunakan Triton ketika menggunakan GPU, dan mereka akan berkata, "Kami membutuhkan Kernel kami". Jadi mereka menulis CUDA C + +, daripada menggunakan cubLAS, perpustakaan NCCL, dan membangun tumpukan mereka sendiri, dan bahkan mengkompilasi mereka pada akselerator lain。

JADI UNTUK SEBAGIAN BESAR KLIENMU, MEREKA BISA MENGGANTIKAN CUDA. JADI, SEJAUH APA CUDA TETAP KUNCI UNTUK MENGEMUDI GARIS DEPAN, DAN AI HARUS MENGANDALKAN INGGRIS

Jensen Huang:

PERTAMA, CUDA ADALAH EKOSISTEM YANG SANGAT KAYA. JIKA ANDA AKAN MENGEMBANGKAN PADA KOMPUTER APAPUN, DARI CUDA ADALAH PILIHAN YANG SANGAT BIJAKSANA. KAMI MENDUKUNG SEMUA FREMEWORKS ARUS UTAMA KARENA KELIMPAHAN EKOLOGI INI。

Jika Anda perlu menulis sendiri, seperti Triton, kami menyumbangkan banyak teknologi Wida Inggris di bagian belakang Triton, dan kami senang membantu frameworks menjadi lebih baik. Ada banyak frame, seperti Triton, vLM, SG Lang, dan banyak lagi。

Area ini berkembang pesat dengan pengembangan pelatihan pos dan pembelajaran intensif. Anda memiliki Vairal, Nemo RL, dan serangkaian frameworks baru. Jika Anda akan mengembangkan struktur, paling masuk akal untuk memulai dengan CUDA, karena Anda tahu bahwa ekologi sudah dewasa. Ketika ada masalah, itu mungkin kode Anda sendiri, bukan tumpukan besar kode di bagian bawah。

Jangan lupa, ukuran kode di belakang sistem ini sangat besar. Ketika ada masalah dengan sistem, Anda ingin tahu apakah itu Anda atau platform itu sendiri。

tentu saja anda lebih suka masalah menjadi anda, bukan platform untuk perhitungan. tentu saja, kita memiliki banyak bug pada kita sendiri, tapi sistem kami begitu dewasa bahwa anda dapat membangun setidaknya pada dasar yang dapat diandalkan。

poin kedua adalah ukuran basisnya. jika anda pengembang, apa pun yang anda lakukan, hal yang paling penting adalah basis instalasi. anda ingin perangkat lunak anda untuk menjalankan komputer sebanyak mungkin. anda tidak menulis perangkat lunak untuk diri sendiri, anda menulis perangkat lunak untuk seluruh kelompok anda, bahkan untuk seluruh industri, karena anda adalah pengembang kerangka kerja。

EKOLOGI CUDA INGGRIS PADA DASARNYA ASET KITA YANG PALING PENTING. ADA RATUSAN JUTA GPU DI SELURUH DUNIA. SEMUA PABRIK AWAN, MULAI DARI V100, A100, H100, H200, KE SERI L, SERI P, BERBAGAI SPESIFIKASI。

DAN MEREKA ADA DALAM BENTUK YANG BERBEDA. JIKA ANDA ADALAH PERUSAHAAN ROBOT, ANDA INGIN CUDA UNTUK MENJALANKAN LANGSUNG PADA TUBUH ROBOT. KITA HAMPIR DI MANA-MANA。

Ini berarti bahwa sekali Anda telah mengembangkan perangkat lunak atau model, dapat digunakan di mana saja. Jadi basis instalasi itu sendiri sangat berharga。

Akhirnya, fleksibel di lokasi penyebaran. Kita hadir di semua platform awan, dan ini membuat kita unik. Sebagai perusahaan AI atau pengembang, Anda tidak yakin produsen awan mana yang akan bekerja dengan atau di mana sistem Anda akan berjalan. Dan kita dapat beroperasi di mana-mana, termasuk penyebaran situs。

Kombinasi kekayaan ekologi, ukuran dasar instalasi dan fleksibel lokasi penyebaran oleh karena itu sangat berharga。

Dwarkesh Patel:

Itu masuk akal. Tapi aku ingin tahu apakah keuntungan ini benar-benar penting untuk klien utama Anda. Ada banyak orang yang akan mendapatkan keuntungan dari keuntungan ini, tapi mereka yang dapat membangun tempat penampungan sendiri -- yaitu, klien yang memberikan sebagian besar pendapatan Anda. - Terutama di dunia dimana AI semakin kuat pada misi "feedback loop" yang dapat divalitable, seperti adegan belajar yang ditingkatkan, optimasi kernel seperti perhatian atau MLP, adalah sebuah loop umpan balik yang sangat mudah。

Jadi produsen awan super masif ini, bisakah mereka menulisnya sendiri, Kernel? Tentu saja, mereka mungkin masih memilih Inggris untuk nilai. Tapi pertanyaannya adalah, akankah ini menjadi perbandingan sederhana: siapa yang bisa memberikan spesifikasi yang lebih baik? Sebagai contoh, pada biaya unit, siapa yang dapat menyediakan daya komputasi yang lebih tinggi (FLOPS) dan bandwidth memori yang lebih tinggi? Karena kita dulu memiliki margin yang sangat tinggi dalam perangkat keras dan perangkat lunak, sebagian besar karena CUDA, parit tersebut。

PERTANYAANNYA ADALAH, JIKA KEBANYAKAN PELANGGAN DAPAT MEMBANGUN TUMPUKAN PERANGKAT LUNAK MEREKA SENDIRI BUKANNYA MENGANDALKAN CUDA, APAKAH MARJIN KEUNTUNGAN INI DAPAT DIPERTAHANKAN

Jensen Huang:

JUMLAH INSINYUR YANG KAMI MASUKKAN KE LABORATORIUM AI INI LUAR BIASA, BEKERJA BERSAMA MEREKA, MEMBANTU MEREKA MENGOPTIMALKAN SELURUH LEMARI BESI TEKNOLOGI. ALASANNYA ADALAH BAHWA TIDAK ADA YANG TAHU ARSITEKTUR KAMI LEBIH BAIK DARIPADA KITA. DAN STRUKTUR INI TIDAK UNIVERSAL SEBAGAI CPU。

CPU SEMACAM SEPERTI "MOBIL RUMAH", YANG ANDA DAPAT MENAFSIRKAN SEBAGAI CRUISER, TIDAK MENGEMUDI SANGAT CEPAT, TETAPI SEMUA ORANG BISA MENGEMUDI DENGAN BAIK, MEMILIKI KONTROL PELAYARAN, DAN SEMUANYA SEDERHANA. TAPI AKSELERATOR GPU LEBIH SEPERTI BALAPAN F1. AKU BISA MEMBAYANGKAN SEMUA ORANG MENGEMUDI ITU 100 MIL PER JAM, TAPI UNTUK BENAR-BENAR MENDORONG KE BATAS, DIBUTUHKAN BANYAK KEAHLIAN。

Dan kita menggunakan banyak AI untuk menghasilkan Kernels ini. Saya cukup yakin bahwa kita akan tetap sangat diperlukan untuk jangka waktu yang cukup. Keahlian kami dapat membantu mitra laboratorium AI ini, dengan mudah menggandakan kinerja mereka. Banyak kali, ketika kita mengoptimalkan teknologi mereka atau beberapa kelnel, model mereka dapat mempercepat tiga kali, dua kali, atau bahkan 50 persen. Ini peningkatan yang sangat besar, terutama saat kau pikir mereka memiliki banyak Hopper dan Blackwell cluster。

JIKA ANDA DUA KALI KINERJA, ITU BERARTI PENDAPATAN GANDA. INI LANGSUNG SESUAI DENGAN PENDAPATAN. DALAM KALKULATOR WEIDA, TCO (BIAYA KEPEMILIKAN TOTAL) MELAKUKAN YANG TERBAIK SECARA GLOBAL, TANPA PERSAINGAN. TAK SATU PUN DARI PERUSAHAAN DAPAT MEMBUKTIKAN KEPADA SAYA BAHWA ADA PLATFORM YANG LEBIH BAIK DALAM KINERJA / TCO DARIPADA YANG KITA LAKUKAN. TIDAK ADA. DAN INI TES BENCHMARK TERBUKA。

Dylan benar. Inferensi Max adalah publik, siapa pun dapat menggunakan. Tapi tidak ada tim TPU bersedia menggunakannya untuk menunjukkan alasan mereka keuntungan biaya. Sulit untuk dilakukan, tidak ada yang ingin membuktikannya。

MLPerf adalah sama. Saya menyambut mereka untuk menunjukkan apa yang mereka telah mengklaim keuntungan 40%. Aku ingin melihat mereka membuktikan keuntungan TPU dalam biaya. Dalam pandangan saya, itu tidak masuk akal, dan tidak masuk akal dalam rasionale. Ini tidak masuk akal。

JADI SAYA PIKIR ALASAN KITA SUKSES ADALAH KARENA TCO KAMI SANGAT BAIK。

Dan hal lainnya, Anda mengatakan bahwa 60 persen dari klien kami berasal dari lima produsen top, tapi sebagian besar bisnis sebenarnya untuk klien luar. Sebagai contoh, pada AWS, mayoritas perhitungan Yvette adalah untuk klien eksternal, bukan AWS. Pada Azure, klien kami kebanyakan eksternal, begitu juga OCI. Mereka memilih kita karena liputan luas kita。

Kita dapat membawa kepada mereka klien terbaik di dunia, yang sendiri berdasarkan platform Inggris. Dan perusahaan-perusahaan ini didasarkan pada Inggris karena cakupan dan fleksibel kita kuat。

JADI SAYA PIKIR RODA INI BEKERJA: TOKOH DASAR, KEMAMPUAN PEMROGRAMAN DARI ARSITEKTUR, AKUMULASI EKOLOGI YANG TERUS MENERUS. DAN SEKARANG ADA RIBUAN PERUSAHAAN AI DI SELURUH DUNIA. JIKA ANDA ADALAH SALAH SATU AWAL AI, STRUKTUR APA YANG AKAN ANDA PILIH? ANDA AKAN MEMILIH ARSITEKTUR YANG PALING POPULER, PALING DASAR, PALING KAYA SECARA EKOLOGIS. ITULAH LOGIKA DARI RODA INI。

Jadi alasannya adalah:

pertama, biaya kinerja unit kami sangat tinggi dan karena itu minimal

Kedua, kita memiliki unit tertinggi yang mengkonsumsi kinerja di dunia; jika mitra membangun pusat data 1GW, mereka harus menghasilkan token tertinggi, pendapatan tertinggi. Dan arsitektur kami dapat menghasilkan token yang paling dengan upaya unit。

Ketiga, jika tujuan Anda adalah rent- perhitungan, kita memiliki pelanggan terbesar di dunia。

Itu sebabnya roda itu diatur。

Dwarkesh Patel:

SANGAT MENARIK. SAYA PIKIR INTI DARI MASALAHNYA ADALAH APA STRUKTUR PASAR INI. BAHKAN JIKA ADA BANYAK PERUSAHAAN, ADA KEMUNGKINAN NYATA BAHWA ADA RIBUAN PERUSAHAAN AI YANG KIRA-KIRA DIBAGI RATA。

Tetapi kenyataannya adalah, melalui pabrik awan supermasif ini, perusahaan model yang mendasari seperti Anthropic, OpenAI, yang memiliki kemampuan untuk mendapatkan akselerator yang berbeda。

Jensen Huang:

Saya pikir premis Anda salah。

Dwarkesh Patel:

Mungkin. Lalu saya akan mengajukan pertanyaan lain, jika semua pembicaraan tentang kinerja dan biaya diatur, mengapa perusahaan seperti Anthropic hanya mengumumkan kolaborasi TPU tingkat dogiva- dengan Chase dan Google hari lain? Dan sebagian besar perhitungan mereka berasal dari sistem ini. Untuk Google, TPU sendiri adalah sumber utama perhitungan. Jadi jika melihat perusahaan-perusahaan AI besar ini, sekali mereka menggunakan seluruh Inggris, mereka tidak lagi。

Jika keuntungan ini adalah teoritis, mengapa mereka memilih akselerator lain

Jensen Huang:

Anthropic adalah contoh khusus. Tanpa Anthropic, pertumbuhan TPU hampir tidak akan ada. TPU tumbuh hampir seluruhnya dari Anthropic. Demikian pula, tanpa Anthropic, pertumbuhan kebutuhan pelatihan hampir tidak ada。

Itu fakta yang sangat jelas. Tidak banyak kesempatan yang sama, sebenarnya hanya satu Anthropic。

Dwarkesh Patel:

Tapi OpenAI juga bekerja dengan AMD dan mereka mengembangkan akselerator Titan mereka sendiri。

Catatan: AMD (Layanan Mikro Lanjutan) adalah sebuah perusahaan semikonduktor di Amerika Serikat, dirancang terutama untuk menghitung chip, dan merupakan pesaing penting antara Inverda dan Intel

Jensen Huang:

Tapi sebagian besar dari mereka masih di Weidar. Kami juga akan terus bekerja sama secara substansial. Aku tidak akan puas dengan orang lain mencoba pilihan lain. Jika mereka tidak mencoba pilihan lain, bagaimana mereka tahu seberapa baik solusi kita

Kadang-kadang benar bahwa ini perlu dikonfirmasi kembali oleh perbandingan. Dan kita harus terus-menerus membuktikan bahwa kita layak untuk saat ini。

SELALU ADA BERBAGAI MACAM REKENING DI PASAR. ANDA DAPAT MELIHAT BERAPA BANYAK PROYEK ASIC DIBATALKAN. HANYA KARENA ANDA MULAI MELAKUKAN ASC, TIDAK BERARTI ANDA DAPAT MEMBUAT SESUATU YANG LEBIH BAIK DARI INGGRIS。

Bahkan, itu tidak mudah. Bahkan dapat dikatakan bahwa, secara rasional, ini tidak terlalu valid. Kecuali Yvette benar-benar membuat kesalahan serius dalam beberapa hal. Tapi mengingat ukuran kami, kecepatan kami - kami adalah satu-satunya perusahaan di dunia untuk membuat lompatan signifikan setiap tahun。

Dwarkesh Patel:

Logika mereka adalah bahwa mereka tidak perlu lebih baik dari Yvette, tapi jangan 70% lebih buruk dari Yvette, karena mereka pikir Anda memiliki 70% keuntungan。

Jensen Huang:

TAPI JANGAN LUPA, BAHKAN DENGAN ASC, MARGIN KEUNTUNGAN BENAR-BENAR TINGGI. DALAM MARJIN KEUNTUNGAN WEIDA SEKITAR 6070 PERSEN, SEMENTARA MARJIN KEUNTUNGAN ASIC MUNGKIN 65 PERSEN. BERAPA BANYAK YANG BENAR-BENAR KAU SELAMATKAN

KAU HARUS SELALU MEMBAYAR SESEORANG. JADI DARI APA YANG SAYA LIHAT, KEUNTUNGAN DARI OPERASI-OPERASI (ASIC) INI SEBENARNYA SANGAT TINGGI, DAN MEREKA SENDIRI PERCAYA ITU, DAN MEREKA CUKUP BANGGA AKAN HAL ITU。

Dulu, kami tidak benar-benar mampu melakukan hal ini. Dan sejujurnya, saya tidak benar-benar mengerti betapa sulitnya membangun sebuah model lab dasar seperti OpenAI atau Anthropic. Juga tidak sepenuhnya sadar bahwa mereka benar-benar membutuhkan dukungan investasi skala besar dari sisi pasokan。

Kami tidak memiliki kapasitas untuk membuat miliaran dolar investasi seperti Anthropic untuk menggunakan kalkulus kami. Tapi Google dan AWS dapat, sebagai imbalannya, menginvestasikan banyak uang di tempat pertama, dan sebagai imbalannya, Anthropic menggunakan algoritma mereka。

Kami tidak memiliki kapasitas untuk melakukannya, dan saya akan mengatakan bahwa itu adalah kesalahan saya: saya tidak benar-benar menyadari bahwa mereka tidak punya pilihan lain. Badan modal ventura tidak bisa berinvestasi $5 miliar atau $10 miliar untuk mendukung laboratorium AI dan berharap untuk tumbuh menjadi anthropic。

Ini salahku. Tapi bahkan ketika saya menyadari bahwa, saya tidak berpikir kita mampu melakukannya pada tahap itu。

Tapi aku tidak akan membuat kesalahan yang sama lagi. Saya senang berinvestasi di OpenAI dan membantu mereka memperluas, yang menurut saya diperlukan. Dan ketika Anthony datang kepada kami, saya senang menjadi investor dan membantu mereka berkembang。

Hanya saja kita tidak bisa melakukannya pada saat itu. Aku akan sangat senang melakukan hal ini jika aku bisa melakukannya lagi dan jika kita sekuat kita sekarang。

Mengapa Young Waida tidak mengerjakan Clouds

Dwarkesh Patel:

Ini menarik. Selama bertahun-tahun, Yvette telah menjadi perusahaan yang menjual sekop di bidang AI dan menghasilkan banyak uang. Dan sekarang Anda mulai menempatkan uang itu masuk Ada laporan bahwa Anda menginvestasikan 30 miliar di OpenAI dan 10 miliar di Anthropic. Penilaian perusahaan-perusahaan ini terus meningkat。

Jadi, jika Anda melihat kembali selama beberapa tahun terakhir, Anda memberi mereka kemampuan untuk menghitung dan Anda melihat tren, ketika penilaian mereka hanya sepersepuluh dari apa yang sekarang, dan bahkan setahun yang lalu itu jauh di bawah itu. Dan kau sudah punya banyak uang。

Bahkan, ada kemungkinan bahwa Yin Weidar akan menjadi perusahaan model dasar sendiri, atau bahwa ia akan membuat investasi besar bahkan sebelumnya pada penilaian yang lebih rendah, sesuatu seperti Anda lakukan sekarang。

Jadi aku penasaran, kenapa aku tidak melakukannya sebelumnya

Jensen Huang:

Kita melakukannya ketika kita bisa. Jika aku bisa, aku akan melakukannya lebih awal. Aku akan melakukannya ketika Anthropic membutuhkan dukungan kita. Tapi kita tidak memiliki kekuatan itu。

Hal ini tidak dalam jangkauan kami, atau dalam inersia kami dalam keputusan-membuat。

Dwarkesh Patel:

Apakah itu masalah uang, atau

Jensen Huang:

Ya, itu ukuran investasi. Kami memiliki sedikit tradisi berinvestasi di luar negeri, apalagi pada skala itu. Dan kita tidak menyadari bahwa ini diperlukan。

Ide saya pada saat itu adalah bahwa mereka bisa pergi ke ibukota ventura, seperti perusahaan lain. Tapi apa yang ingin mereka lakukan tidak didukung oleh modal ventura. OpenAi ingin melakukan sesuatu yang tidak didukung oleh modal usaha。

Itulah yang kusadari nanti. Tapi itulah yang mereka cerdas tentang. Mereka menyadari pada saat itu bahwa mereka harus mengikuti jalan itu. Aku senang mereka melakukannya. Bahkan jika kita tidak terlibat, yang menyebabkan Anthropic untuk beralih ke mitra lain, aku masih berpikir itu adalah hal yang baik. Kehadiran Anthropic adalah hal yang baik bagi dunia, dan aku senang tentang itu. Beberapa penyesalan dapat diterima。

Dwarkesh Patel:

Pertanyaannya akan kembali lagi: bagaimana kita harus menggunakan uang sekarang bahwa Anda memiliki begitu banyak uang dan tumbuh

Salah satu ide adalah sekarang ada ekologi menengah yang membantu laboratorium AI ini mengubah pengeluaran modal (capex) menjadi biaya operasi (optik) sehingga mereka dapat menyewa energi mereka。

Karena GPU mahal, tapi sebagai model, mereka dapat terus menghasilkan token nilai yang lebih tinggi selama siklus hidup. Dan Inggris sendiri memiliki kemampuan untuk menutupi pengeluaran modal muka ini. Sebagai contoh, ada laporan bahwa Anda telah mendukung CoreWeave hingga $6.3 miliar dan menginvestasikan $2 miliar。

lalu kenapa young waida tidak menjadi produsen awan sendiri? mengapa anda tidak menjadi hiperscaller, membangun awan anda sendiri dan menyewa matematika anda? setelah semua, anda memiliki kapasitas kas ini。

Jensen Huang:

Ini adalah filosofi perusahaan, dan saya pikir ini adalah filosofi yang bijak: kita harus melakukan "hal-hal yang diperlukan dan lakukan sesedikit mungkin"。

Ini berarti bahwa jika kita tidak melakukannya, saya benar-benar tidak berpikir itu akan dilakukan。

Jika kita tidak mengambil risiko ini, jika kita tidak membangun NVLink, jika kita tidak membangun seluruh gudang, jika kita tidak membangun ekologi ini, jika kita tidak berinvestasi 20 tahun di CUDA, sebagian besar waktu, jika kita tidak. Jika kita tidak membangun perpustakaan domain CuDA-X ini -- baik itu pelacakan ringan, generasi gambar, model awal AI model, pemrosesan data, pemrosesan vektor -- jika kita tidak melakukan ini, mereka tidak akan ada。

Aku sangat yakin akan hal itu. Kami bahkan mengembangkan perpustakaan bernama culitho untuk perhitungan cahaya, dan jika kita tidak melakukannya, tidak ada yang akan melakukannya。

Itulah sebabnya kita telah melakukan hal-hal ini. Itulah yang harus kita berkomitmen penuh。

Tapi pada saat yang sama, sudah ada banyak pabrik awan di dunia. Bahkan jika kita tidak, seseorang akan. Jadi berdasarkan prinsip "lakukan sebanyak mungkin, tapi lakukan sesedikit mungkin", konsep ini telah ada di perusahaan. Setiap keputusan yang kubuat akan diambil dari sudut pandang itu。

Dalam bidang awan, jika kita tidak mendukung CoreWeave, bentuk baru dari awan AI mungkin tidak ada. Jika kita tidak mendukung mereka, mereka tidak akan mencapai skala ini hari ini. Seperti Nscale dan Nebius, mereka tidak akan berada di sini tanpa dukungan kami. Sekarang, mereka berkembang dengan baik。

TAPI BUKANKAH INI BISNIS YANG HARUS KITA LAKUKAN SECARA PRIBADI? TIDAK. KITA MASIH BERPEGANG PADA PRINSIP ITU: LAKUKAN APA YANG DIPERLUKAN DAN LAKUKAN SESEDIKIT MUNGKIN. JADI KAMI BERINVESTASI DALAM EKOLOGI KARENA SAYA INGIN SELURUH EKOLOGI BERKEMBANG. SAYA INGIN ARSITEKTUR KAMI UNTUK MENGHUBUNGKAN INDUSTRI SEBANYAK MUNGKIN, SEBANYAK MUNGKIN, SEHINGGA AI DAPAT DIBANGUN PADA SKALA GLOBAL DAN DIBANGUN DI ATAS TEKNOLOGI AMERIKA。

Itulah visi kita maju。

Pada saat yang sama, seperti yang Anda sebutkan, ada banyak perusahaan model yang baik, dan kami akan mencoba untuk berinvestasi di dalamnya。

Dan hal lainnya adalah, kita tidak akan "memilih pemenang". Kami ingin mendukung semua orang. Ini adalah kebutuhan bisnis kita dan apa yang akan kita lakukan. Jadi ketika saya berinvestasi di salah satu dari mereka, saya berinvestasi pada orang lain。

Dwarkesh Patel:

Lalu kenapa kau tidak memilih pemenangnya

Jensen Huang:

Karena itu bukan tugas kita. Poin pertama。

POIN KEDUA, KETIKA YOUNG WEIDAR MULAI, SEKITAR 60 PERUSAHAAN GRAFIS, 60 PERUSAHAAN MELAKUKAN GRAFIS 3D. HANYA KITA YANG SELAMAT. JIKA ANDA MEMILIH SALAH SATU DARI 60 PERUSAHAAN, ITU MUNGKIN AKAN MENJADI YANG PALING DISUKAI。

Dan itu sebelum waktu Anda, tapi grafis dari Inverda benar-benar salah. Ini bukan sedikit penyimpangan, itu dasarnya salah. Kami merancang struktur yang hampir mustahil bagi pengembang untuk mendukung, dan ditakdirkan untuk gagal. Kita didasarkan pada teori rasional tingkat pertama, tapi kita berakhir dengan solusi yang salah。

Semua orang berpikir kita tidak bisa berhasil, tapi kami selamat. Jadi aku punya cukup kerendahan hati untuk mengakui itu dan tidak memilih pemenangnya. Biarkan mereka berkembang sendiri atau mendukung semua orang。

Dwarkesh Patel:

Satu hal yang tidak kumengerti. Kau bilang kau tidak secara sengaja memberikan prioritas untuk mendukung produsen awan baru ini, tapi kau hanya menyebutkan bahwa mereka mungkin tidak ada tanpa Weidar. Jadi bagaimana kedua hal ini datang bersama

Jensen Huang:

Pertama, mereka harus sendiri ingin ada dan datang kepada kami untuk membantu. Ketika mereka memiliki kehendak yang jelas, rencana bisnis, kapasitas, gairah - tentu saja, mereka sendiri harus memiliki beberapa kapasitas - dan kita akan berada di sana jika beberapa dukungan investasi diperlukan selama fase awal。

Tapi itu penting bahwa mereka membangun roda terbang mereka sendiri secepat mungkin. Pertanyaan Anda adalah, apakah kita ingin masuk ke bisnis pembiayaan? Jawabannya adalah tidak. Kami tidak ingin menjadi lembaga keuangan. Sudah banyak pemodal di pasar, dan kami lebih bersedia bekerja sama dengan lembaga keuangan ini daripada melakukannya sendiri。

Jadi tujuan kami adalah untuk fokus pada bisnis kami sendiri, membuat model bisnis sesederhana mungkin, sambil mendukung seluruh ekologi。

Jensen Huang:

Ketika perusahaan seperti OpenAI membutuhkan $30 miliar investasi sebelum IPO, kami sangat mempercayai mereka... Dunia membutuhkan mereka, semua orang menginginkannya, dan aku menginginkannya. Mereka memiliki semua elemen untuk menjadi pemenang, jadi kami mendukung mereka dan membantu mereka memperluas。

Jadi kita akan melakukan itu karena mereka benar-benar membutuhkan kita untuk melakukannya. Tapi prinsip kita adalah jangan melakukan sebanyak mungkin, tapi sesedikit mungkin。

Dwarkesh Patel:

MASALAHNYA MUNGKIN SEDIKIT JELAS, TAPI KAMI SUDAH BERADA DALAM KEKURANGAN GPU SELAMA BERTAHUN-TAHUN, DAN INI BAHKAN LEBIH SEHINGGA MODEL MENJADI LEBIH KUAT。

Jensen Huang:

YA, KITA PUNYA KEKURANGAN GPU。

Dwarkesh Patel:

Dalam distribusi sumber daya langka ini, Ying Weida dianggap bukan penawar tertinggi, tapi untuk mempertimbangkan, sebagai contoh, memastikan keberadaan pabrik-pabrik awan baru ini - beberapa untuk CoreWeave, beberapa untuk Crusoe, beberapa untuk Lambda。

Pertama-tama, kau setuju? Kedua, apa untungnya bagi Young Waida

Jensen Huang:

Saya pikir premis Anda salah. Tentu saja, kita akan melihat mereka sangat hati-hati。

PERTAMA-TAMA, JIKA ANDA TIDAK MENEMPATKAN ORDER PEMBELIAN (PO), TIDAK MASUK AKAL UNTUK BERKOMUNIKASI. JADI PERTAMA-TAMA, KITA AKAN BEKERJA DENGAN SEMUA KLIEN UNTUK MEMBUAT PROYEKSI PERMINTAAN KARENA SIKLUS PRODUKSI YANG PANJANG DARI PRODUK-PRODUK INI DAN SIKLUS KONSTRUKSI PUSAT DATA YANG PANJANG. INI ADALAH HAL PERTAMA YANG COCOK DENGAN PASOKAN DENGAN PERMINTAAN MELALUI RAMALAN。

Kedua, kami akan membuat proyeksi dengan klien sebanyak mungkin. Tapi pada akhirnya, kau masih harus memesan. Jika Anda tidak memesan, tidak ada yang bisa saya lakukan. Jadi pada titik tertentu, itu adalah "melayani pertama"。

Tapi sebaliknya, jika pusat data Anda belum siap, atau jika beberapa komponen kunci belum siap, Anda mungkin tidak dapat menyebarkan sistem untuk saat ini, kita dapat memberikan prioritas kepada klien lain. Ini hanya untuk memaksimalkan keseluruhan efisiensi konsumsi pabrik kami。

Selain ini, prinsip prioritas adalah "layanan pertama". Kau harus memesan. Jika Anda tidak memesan, tidak ada cara。

Ada, tentu saja, banyak cerita di luar, seperti orang-orang mengatakan Larry dan Elon meminta GPU untuk makan malam dengan saya -- kami makan malam bersama, dan itu adalah makan malam yang menyenangkan, tetapi mereka tidak pernah meminta GPU. Mereka hanya perlu memesannya. Kami akan melakukan yang terbaik untuk menyediakan kapasitas segera setelah kita membuat perintah. Tidak serumit itu。

Dwarkesh Patel:

Jadi kedengarannya seperti mekanisme antrian, tergantung pada ketika Anda meletakkan urutan dan apakah pusat data siap. Tapi itu masih tidak hanya "penawar tertinggi", bukan

Jensen Huang:

Kita tidak pernah melakukan itu。

Dwarkesh Patel:

Pernah di tawaran tertinggi

Jensen Huang:

Tidak pernah. Karena itu adalah praktek bisnis yang buruk。

Anda menetapkan harga, klien memutuskan untuk tidak. Aku tahu beberapa perusahaan di industri menaikkan harga ketika permintaan naik, tapi kami tidak. Ini belum pernah menjadi pendekatan kami. Klien bisa mengandalkan kita. Saya lebih suka menjadi kehadiran yang dapat diandalkan dan pondasi industri. Anda tidak perlu berspekulasi tentang perubahan harga。

Jika saya memberikan kutipan, itu harga akhir. Bahkan lonjakan permintaan tidak akan berubah。

Dwarkesh Patel:

Itulah salah satu alasan mengapa Anda stabil dengan pasokan listrik, kan

Jensen Huang:

Kami telah bekerja sama selama hampir 30 tahun. Tidak ada kontrak resmi antara Yin Weida dengan bangunan-up, dan ada lebih tentang perjanjian yang adil antara mereka. Kadang-kadang saya benar dan kadang-kadang saya salah; kadang-kadang saya mendapatkan istilah yang lebih baik, kadang-kadang kurang. Tapi secara keseluruhan, hubungan ini luar biasa, dan saya dapat mempercayai atau mengandalkan mereka sepenuhnya。

Dan, bagi Inveida, satu hal yang pasti: tahun ini Rubin akan hebat, tahun depan Vera Rubin Ultra akan diluncurkan, tahun depan Feynman akan diluncurkan, tahun depan -- saya belum mengumumkan nama itu. Artinya, setiap tahun, Anda dapat mengandalkan kami. Anda harus berkeliling dunia dan menemukan tim ASIC lain untuk melihat apakah ada satu yang dapat Anda katakan, "Saya dapat menempatkan seluruh perusahaan, dan saya percaya Anda akan berada di sini setiap tahun untuk mendukung saya"。

token saya biaya akan jatuh pada satu urutan besarnya setiap tahun, dan aku bisa percaya sebanyak yang saya percaya jam. aku hanya mengatakan hal yang sama tentang bangunan-up. tidak ada pabrik tunggal dalam sejarah yang memungkinkan anda untuk mengatakan bahwa。

Tapi hari ini kau bisa mengatakan itu pada Inverda. Kau bisa mengandalkan kami setiap tahun。

JIKA ANDA INGIN MEMBELI SATU MILIAR DOLAR DARI MESIN AI, TIDAK MASALAH; JIKA ANDA INGIN MEMBELI 100 JUTA DOLAR, TIDAK MASALAH; JIKA ANDA INGIN MEMBELI 10 JUTA DOLAR, BAHKAN RAK, TIDAK MASALAH; BAHKAN JIKA ANDA INGIN MEMBELI KARTU GRAFIS. JIKA ANDA INGIN BERIKUTNYA $100 MILIAR PABRIK AI, TIDAK APA-APA。

Hari ini, hanya satu perusahaan di dunia yang bisa mengatakan itu. Dan saya dapat mengatakan bahwa kepada listrik, saya ingin membeli satu miliar dolar, tidak masalah. Yang harus kita lakukan adalah merencanakan bersama, berjalan melalui proses dan melakukan apa yang bisnis dewasa lakukan。

JADI, SAYA PIKIR BUTUH PULUHAN TAHUN BAGI KITA UNTUK SAMPAI KE TANAH INDUSTRI AI. ADA MASUKAN BESAR, FOKUS YANG BESAR, DAN STABILITAS PERUSAHAAN DAN KONSISTENSI SANGAT PENTING。

Mengapa Young Waida menolak untuk mengambil taruhan multi- routing

Dwarkesh Patel:

INI SEBENARNYA MENIMBULKAN PERTANYAAN MENARIK. KAMI TELAH BERBICARA TENTANG AKUMULASI KEKUASAAN DAN BOTOL MEMORI. SEKARANG JIKA ANDA MEMASUKI DUNIA DI MANA ANDA SUDAH MEMILIKI SEBAGIAN BESAR KAPASITAS N3, MAKA ANDA MUNGKIN AKAN MEMILIKI SEBAGIAN BESAR N2. APAKAH ANDA MEMPERTIMBANGKAN UNTUK KEMBALI KE KAPASITAS MENGANGGUR LAMA PROSES NODE SEPERTI 7 NANOMETER

Sebagai contoh, karena kebutuhan AI terlalu besar dan proses yang paling maju adalah tidak mengikuti, Anda akan mengulang Hopper atau Ampere versi dengan semua pengalaman hari ini dengan optimasi numerik dan desain sistem. Apakah Anda pikir ini akan terjadi sebelum 2030

Jensen Huang:

Itu tidak perlu. Alasannya adalah bahwa kemajuan setiap generasi bukan hanya perubahan dalam ukuran transistor. Anda juga telah melakukan banyak pekerjaan teknik untuk menyegel, menumpuk, sistem numerik, arsitektur sistem. Dan ketika Anda sampai pada titik ini dan kembali ke versi lama, skala penelitian dan pengembangan yang perlu diinvestasikan tidak terjangkau. Kita mampu untuk terus berjalan, tapi saya tidak berpikir kita mampu untuk kembali。

Tentu saja, jika ada percobaan intelektual, dengan asumsi bahwa suatu hari dunia akan mengatakan bahwa kapasitas produksi maju tidak akan pernah meningkat lagi. Apakah saya akan kembali untuk menggunakan 7 nanos segera? Tentu saja, tidak diragukan lagi。

Dwarkesh Patel:

Aku sudah berbicara dengan seseorang sebelumnya: Mengapa Inverda tidak memajukan sejumlah proyek chip yang sama sekali berbeda pada saat yang sama? Sebagai contoh, Anda dapat membuat struktur lingkaran kristal seperti Cerebras, sampul besar seperti Dojo, atau sesuatu tanpa CUDA。

ANDA MEMILIKI SUMBER DAYA, ANDA MEMILIKI KETERAMPILAN TEKNIK, ANDA DAPAT MELAKUKANNYA SECARA PARALEL. JIKA TIDAK ADA YANG TAHU DI MANA AI ATAU ARSITEKTUR AKAN, MENGAPA MENEMPATKAN SEMUA TELUR DALAM KERANJANG

Jensen Huang:

Tentu saja kita bisa. Hanya saja kita tidak melihat solusi yang lebih baik. Kita semua mensimulasikannya, dan mungkin lebih buruk dalam simulasi kita. Jadi kita tidak akan melakukannya. Apa yang kita lakukan sekarang adalah item-item yang benar-benar ingin kita lakukan, dan yang kita pikir adalah yang benar。

Tentu saja, jika beban itu sendiri berubah secara dramatis di masa depan - bukan algoritma, tetapi beban benar-benar berubah - maka kita mungkin juga menambahkan jenis akselerator lain。

Sebagai contoh, baru-baru ini kami bergabung dengan Grok, dan kami akan mengintegrasikan Grok ke dalam ekologi CUDA. Kita lakukan ini sekarang. Ini karena nilai token telah menjadi sangat tinggi, sehingga model yang sama, berdasarkan kecepatan respon yang berbeda, dapat sesuai dengan tingkat harga yang berbeda。

beberapa tahun yang lalu, token hampir gratis, atau hampir sama murah sebagai gratis. tapi sekarang, klien yang berbeda menuntut token berbeda. dan pelanggan sendiri dapat membuat banyak uang. sebagai contoh, untuk insinyur perangkat lunak, jika saya bisa memberi mereka token respon lebih cepat dan membuat mereka lebih efisien dari hari ini, saya akan membayar untuk itu。

Tapi itu pasar baru-baru ini. Jadi saya pikir untuk pertama kalinya sekarang kita benar-benar memiliki kapasitas untuk membuat lapisan pasar yang berbeda berdasarkan model yang sama pada waktu respon。

Inilah sebabnya mengapa kami memutuskan untuk memperluas bagian depan Paretto ke cabang alasan yang "merespon lebih cepat, tapi lebih rendah". Karena di masa lalu, itu selalu hal yang paling penting. Tapi sekarang kita percaya bahwa mungkin ada tanda ASP tinggi di masa depan. Bahkan jika itu bahkan lebih rendah di pabrik, harga unit akan cukup untuk mengimbanginya。

Itu sebabnya kita melakukannya. Tetapi jika hanya untuk berbicara tentang arsitektur itu sendiri, saya akan mengatakan bahwa jika saya memiliki lebih banyak uang, saya akan menginvestasikan lebih banyak uang dalam arsitektur yang ada。

Dwarkesh Patel:

saya menemukan ide "token premium tinggi" dan menyimpulkan hirarki pasar sangat menarik。

Pertanyaan terakhir. Dengan asumsi revolusi pembelajaran mendalam tidak pernah terjadi, apa yang akan Young Waida lakukan hari ini

Jensen Huang:

Tentu saja, permainan tidak, tetapi sebagai tambahan, itu mempercepat perhitungan. Itulah yang kami lakukan。

Pemikiran dasar perusahaan kami adalah hukum Moore akan melambat. Perhitungan umum baik untuk banyak hal, tetapi tidak ideal untuk banyak tugas komputasi. Jadi kami menempatkan GPU bersama-sama arsitektur dan CPU dan membiarkannya mempercepat beban CPU. Kode yang berbeda, kandang, algoritma yang berbeda dapat dibongkar untuk dijalankan di GPU. Dengan begitu, aplikasi dapat mempercepat 100 kali, 200 kali。

Jadi di mana itu bekerja? Tentu saja, teknik, ilmu pengetahuan, fisika, pengolahan data, grafis komputer, generasi gambar, berbagai tempat。

JADI BAHKAN HARI INI KETIKA AI TIDAK ADA, INVERDA MASIH AKAN MENJADI PERUSAHAAN YANG SANGAT BESAR. ALASANNYA SANGAT MENDASAR: KEMAMPUAN KOMPUTASI UNIVERSAL UNTUK TERUS MEMPERLUAS SEBAGIAN BESAR TELAH BERAKHIR. DAN SALAH SATU CARA UNTUK MENINGKATKAN KINERJA - BUKAN SATU-SATUNYA CARA, TAPI CARA YANG PALING PENTING - ADALAH UNTUK MELAKUKAN AKSELERASI LAPANGAN-SPESIFIK。

KAMI MULAI DENGAN GRAFIK KOMPUTER, TAPI ADA BANYAK DAERAH LAIN. PERHITUNGAN ILMIAH, FISIKA PARTIKEL, SIMULASI CAIRAN, PEMROSESAN DATA TERSTRUKTUR, DLL, AKAN MENGUNTUNGKAN DARI BERBAGAI JENIS ALGORITMA。

Jadi misi kami telah membawa komputasi dipercepat ke dunia dan untuk mempromosikan pengembangan aplikasi yang berkelanjutan yang mana komputasi universal tidak mungkin, atau yang tidak dapat diperpanjang ke tingkat kapasitas yang cukup, untuk membantu mencapai terobosan dalam ilmu pengetahuan. Beberapa aplikasi awal kami adalah dinamika molekul, pengolahan seismik dalam eksplorasi energi dan, tentu saja, pengolahan gambar。

Di semua daerah ini, perhitungan umum sendiri terlalu tidak efisien. Jadi, ya, tanpa AI, aku akan sedih. Namun justru karena kemajuan komputasi kita, kita mendemokratisasi pembelajaran mendalam. Kami telah mengizinkan peneliti, ilmuwan, mahasiswa, di mana saja, untuk melakukan penelitian ilmiah yang menakjubkan dengan PC atau kartu grafik GeForce. Komitmen dasar ini tidak pernah berubah, tidak sama sekali。

JADI JIKA ANDA MELIHAT GTC, ANDA AKAN MENEMUKAN BAHWA BAGIAN SIGNIFIKAN DARI BAGIAN PERTAMA ITU TIDAK BENAR-BENAR AI. INI BUKAN TENTANG AI, TAPI MASIH SANGAT PENTING. AKU TAHU BAHWA AI MENARIK DAN MENARIK。

Tapi masih banyak orang yang melakukan hal-hal yang sangat penting yang tidak ada hubungannya dengan AI. Tensor bukan satu-satunya cara mereka menghitungnya. Dan kami ingin membantu mereka semua。

Dwarkesh Patel:

Jensen, terima kasih banyak。

Jensen Huang:

Sama-sama, aku menikmati dialog ini。

Tautan Asli

Podcast Wong In- hoon: parit In Weida jauh lebih dalam daripada chip

TL; DR

Wawancara

Di mana parit di In Weida: rantai pasokan, atau kontrol "elektronik ke Token"

Apakah TPU Google mengguncang posisi Inggris

Mengapa Young Waida tidak mengerjakan Clouds

Mengapa Young Waida menolak untuk mengambil taruhan multi- routing

Related Articles

a16z new: forecasting markets, entering the fast-track phase

a16z Founder: Agent, something really important has changed

ATTENTION WILL BE DRAWN NEXT WEEK TO THE LUNCHEON TO BE HELD BY MONTRAMPO FOR TRUMP HOLDERS; HEARINGS ON THE NOMINATION OF THE CHAIRMAN OF THE FEDERAL RESERVE IN WALSH WILL SOON BE HELD (4.20-4.26)

Arthur Hayes: It's no trade time

Products

Legal & Support

Friends