Judul asli: Zhao Chang Peng memilih mahasiswa perguruan tinggi Cina, $11 juta Roda Benih, Pendidikan Argentina
Taman Sumber
Tiga mahasiswa Cina di perguruan tinggi, $11 juta dalam roda benih, dan siswa Silicon Valley saat ini adalah produk yang paling dibiayai。
Satu kalimat digunakan untuk menghasilkan video mengajar / diskusi khusus untuk K12 produk Agen Pendidikan VideoTutur, yang hari ini mengumumkan penyelesaian pembiayaan roda benih sebesar $11 juta. Putaran pembiayaan saat ini dipimpin oleh YZi Labs, dengan partisipasi bersama dari berbagai investor, King Autumn Fund, Amino Capital, BridgeOne Capital dan beberapa investor terkemuka。
Ini juga perusahaan produk AI pertama yang berinvestasi di YZi Labs。
Pendiri, Kai Zhao (Zhao Kai), menyatakan bahwa Video Tutor diakui dan didukung oleh tim investasi CZ dan YZi Labs dan akhirnya dibiayai oleh YZi Labs. Mereka mendapat lebih dari 10 TS, dan mereka akhirnya memilih mereka。
Pada 14 Mei, versi pertama dari produk tersebut, yang diluncurkan di pasar produk Founder Park, disetujui oleh pasar dan disahkan oleh PMF, dan pembiayaan pencari uang $11 juta ini diselesaikan dalam waktu kurang dari lima bulan。
Di Kai, tampaknya bahwa alasan utama mengapa mereka bisa mendapatkan pendanaan ini adalah bahwa, di arah yang benar, "tim jenius" telah membahas rasa sakit belajar di Amerika Serikat maju pemeriksaan pada K12。
"bidang ini lebih cocok untuk orang-orang muda, dengan teknik yang sangat baik dan keterampilan hands- on, dan wawasan yang sangat baik dan pengalaman, dan implementasi yang sangat cepat. aku tidak tahu
Bukan hanya mereka, Cursor, Mercor, Pika, GPTZero, dll., mahasiswa di Silicon Valley, menggunakan produk AI yang tidak berinovasi, untuk menyegarkan persepsi kewirausahaan AI。
ERA AI KEWIRAUSAHAAN BENAR-BENAR BERBEDA。
Kami berbicara dengan orang-orang muda di Video Tutor, dan kami ingin tahu mengapa mereka memiliki akses ke pembiayaan kapal benih ini, dan apa yang terjadi di Silicon Valley hari ini. Dan mengapa mereka ingin mempekerjakan pekerja di pabrik-pabrik besar di negara ini。
Tamu wawancara: CEO Kai Zhao, CTO James Zhan。
Wawancara & Penyunting
Di bawah ini adalah wawancara, diedit oleh Faunder Park。

K12, PEMBELAJARAN VISUAL ADALAH JALANNYA
Taman Pendiri: Begitu banyak institusi yang menjagamu, dan menurut pendapat Anda, apa yang ada di inti yang menggerakkan mereka
Kai:Saya pikir hal pertama adalah arah yang benar. AI, pendidikan adalah lagu yang menjanjikan dan menjanjikan, dan kita akan masuk ke S.A. SAT AS, AP. Populasi target adalah siswa SMA K12, dan kami dan populasi pengguna ini memiliki generasi yang sangat kecil. Kami pergi melalui seluruh pra-test siklus belajar, dan kami tahu di mana rasa sakit ujian dan pra-tes berbaring, dan kita bisa membuat produk yang benar-benar ditangani rasa sakit populasi ini。
Kedua, tim sangat baik. James dari Gemini, di Google adalah insinyur inti untuk rekayasa AI dan algoritma. Saya memiliki tiga tahun mengajar kewirausahaan, dimulai dari awal, dan berpartisipasi dalam pembuatan MathGPTPro selama tahun kedua tahun ini. Ada pengalaman sukses produk pendidikan。
Ketiga, kami melakukan bidang pendidikan AI, inti dari mesin animasi, dan kami adalah pengembang inti dari VidioTutur, tim teknologi inti yang paling berpengetahuan yang dapat membuat mesin animasi sangat tepat。
tim itu sendiri memiliki gen pemasaran yang sangat baik, mengetahui bagaimana untuk menyebar。
Video Tutur sangat sejalan dengan konsensus investasi di mainstream VC di Amerika Serikat, yang disebut "Team of Genius", yang berarti lapangan lebih cocok untuk kaum muda, dengan keterampilan teknik yang sangat baik dan wawasan yang baik dan pengalaman. Saya pikir ini adalah alasan untuk menyetujui bahwa semua investor dapat menghargai。

Guru Video di YZi Labs EASY Hari Demo Residensi
Taman Fourer: Masalah inti mana yang ingin ditangani produk Anda dalam pendidikan
Kai:Produk yang tersedia saat ini di pasar dapat dikelompokkan menjadi dua kategori: produk belajar aktif dan produk belajar pasif. Produk belajar pasif, seperti byte Gauth, Chegg, AnswersAi, mencakup apa yang kita sebut Homework Help, dan link belajar sangat pendek, terutama untuk biaya siswa。
Dan Video Guru mencakup pembelajaran aktif, dan kita tidak harus mempertimbangkan motivasi siswa 'karena mereka harus belajar, mereka harus mengambil ujian, seperti S.S.A. AS SAT, AP. Dalam adegan ini, ada banyak permintaan rasa sakit tervisualisasikan, dan 80 persen dari tinggi AS terkait dengan fungsi, kalkulus, dll pengetahuan yang membutuhkan gambar yang kompleks render. Mesin animasi VidioTutur bisa memecahkan masalah ini dengan baik。

Dan, di bidang ini, itu sangat mahal. Di Amerika Serikat, rata-rata 2,6 juta siswa mengambil SAT pemeriksaan setiap tahun, dan ada permintaan tinggi untuk biaya. Kursus bawah SAT yang mahal, tidak pada set, tetapi berdasarkan jam, mulai pada rata-rata $150 per jam, terutama di $230. Banyak siswa dan orang tua membayar untuk studi mereka. Tapi VideoTutur adalah cara yang baik untuk melonggarkan dan bahkan menggantikan pelatihan guru, karena pada tahap ini video yang dihasilkan oleh AI hampir identik dengan isi pelatihan guru. Dengan cara ini, siswa dapat memiliki guru AI pribadi mereka sendiri pada biaya terendah。
Taman Pendiri: Apa kesempatanmu untuk membuat produk ini
Kai:Sebenarnya, Stanford memiliki tim yang melakukannya sebelum kita. Mereka juga ingin melakukan studi visual. Aku menyadari dampak dari arah itu. Pada kesempatan sebelumnya, produk pendidikan pada dasarnya terhubung ke API dari GPT, mirip dengan produk ChatGPT Wrapper. Tapi kami menemukan bahwa produk tersebut memiliki langit-langit hanya berdasarkan kata-kata dan pertanyaan. Seperti yang Anda lihat, bisnis seperti Chegg dan Gauth sedang jatuh, dan banyak adegan telah digantikan oleh ChatGPT, karena 20 dolar untuk siswa dapat memecahkan banyak masalah dengan ChatgPT。
PRODUK BERDASARKAN SELONGSONG API DAN OPTIMASI TELAH MENCAPAI LANGIT-LANGIT。
Namun, visualisasi multi- modular memiliki janji besar karena ada tingkat yang sangat tinggi pembelajaran visual di Amerika Serikat. Sayangnya, Gatekeep memiliki awal yang baik, tapi tidak berlangsung karena itu sedikit lebih awal, model dasar kapasitas belum matang, dan GPS-4 belum dirilis. Ditambah mesin animasi matematika yang melibatkan render dan algoritma, mereka tidak menyerang. Tapi tim kami menguasai semua pengembangan inti mesin animasi, memecahkan masalah dan membuat video sangat akurat。
PMF: KESEDIAAN PENGGUNA YANG KUAT UNTUK MEMBAYAR
PARK FOODER: Anda bekerja dengan beberapa sekolah ketika produk itu online. Menurut pendapat Anda, kapan atau apa fungsi melakukannya membuat Anda merasa, "Saya melakukan produk yang tepat, saya menemukan produk yang tepat", dan merasa seperti saya menemukan PMF
Kai:Tiga dimensi。
Pertama-tama, VideoTutor telah menerima permintaan API dari 1.000 perusahaan, termasuk semua lembaga pendidikan terkenal di Amerika Serikat, bahkan lembaga domestik. Selain itu, banyak sekolah ingin membeli layanan. Niat akhir-user 's lebih langsung, dengan orangtua siswa dan investor yang, setelah pengalaman dengan produk, memberikannya kepada semua kerabat dan teman untuk pengadilan dan semua bersedia untuk membayar untuk itu. Lalu dia mengambil ponselku dari suatu tempat dan mengirimku pesan untuk memilih kami. Pengguna C End- memiliki keinginan yang sangat kuat untuk membayar。
Poin kedua adalah tingkat permintaan pengguna. Mengapa Guru pendidikan begitu keras pada baris Amerika? Orang tua bersedia untuk membayar untuk ini karena mereka merasa bahwa satu - satu - satu mengajar bekerja dengan baik. Teknologi AI multi- modular sekarang manusiawi untuk memberikan satu-satu pengajaran, dan menjawab pertanyaan. Dan, pada baris Amerika, pelajaran video dari guru satu ke guru lain tidak berbeda dari video yang dihasilkan oleh AI. Itulah yang saya bicarakan, "Kepanikan Kebutuhan", kursus video yang dibeli siswa dengan biaya yang besar, yang tidak berbeda dari satu yang diciptakan I.A.. Kurang mahal dan lebih baik mengajar。
Kami telah menerima umpan balik yang sangat positif dari banyak siswa, dan banyak guru bersedia untuk menyebarkan produk, dengan tingkat penyelesaian yang sangat baik untuk periode sebelumnya dan panjang penggunaannya. 200 pengguna benih yang kami putar sekarang adalah akumulasi awal。
Ketiga, itu adalah produk rasa dan akal. Ketika Anda terus melakukannya, dari kemajuan seluruh industri pendidikan sampai titik permintaan inti di mana siswa dan orang tua membayar, hingga evolusi produk itu sendiri, seluruh logika ditutup. Jadi dari tiga dimensi ini, Anda berpikir PMF cukup. Pada intinya adalah keinginan yang sangat, sangat kuat untuk membayar。

KITA MEMBUAT KESEPAKATAN DENGAN FIZ
Taman Pendiri: Banyak pengguna telah menawarkan untuk membayar, dan lainnya telah menghubungi Anda untuk berinvestasi。
Kai:BENAR. SAT, AP, DI DAERAH INI, ADA KEMAUAN KUAT UNTUK MEMBAYAR. HAL INI BERNILAI 100 SAMPAI 200 DOLAR UNTUK MEMULAI DI BIDANG INI, DAN LEBIH MAHAL UNTUK MENGAMBIL KELAS OFF-LINE, MUNGKIN $800. DI AMERIKA SERIKAT, ADA 2,6 JUTA SISWA AKAN MASUK SAT, 37 PERSEN DARI MEREKA AKAN MEMBAYAR DENGAN INISIATIF MEREKA SENDIRI, PASAR DI MANA KEINGINAN UNTUK MEMBAYAR DAN PERMINTAAN YANG KUAT. PRODUK KAMI DAPAT MEMBUAT PERUBAHAN PERMINTAAN YANG SANGAT BAIK。
Dari Park: SAT, lagu ini, untuk kandidat, guru sejati dan AI, akan dia percaya AI
Kai:Sekarang AI menjawab pertanyaan di tingkat seperti S.S.S.S.S.S.S.S.S.S.S.S.A., AP, dan itu tidak sangat mungkin bahwa akan ada kesalahan faktual. Dalam hal ini, mengapa lebih baik daripada di bawah garis? Yang satu murah, dan dua lainnya adalah siswa yang dapat mengajukan pertanyaan tanpa takut bahwa guru yang mengajukan pertanyaan bodoh akan memiliki pendapat atau ketidaksabaran untuk belajar setiap saat dan setiap saat dalam 24 jam。
Dan pasar dapat dirapikan, dan setelah pasar Amerika, kita dapat dirapikan ke Kanada, British A-Level pemeriksaan, dll, dan permintaan pembayaran sangat besar。
Dari Park: Apa pendapatmu tentang membayar untuk ini
Kai:KAMI ADALAH LANGGANAN BULANAN, DAN SATU ADALAH UNTUK MEMBAYAR UNTUK HASIL. SAYA PIKIR SEKARANG AI SUDAH BISA MEMBAYAR HASILNYA. KITA MUNGKIN MELUNCURKAN SATU SET, SEPERTI ANDA MEMBAYAR $799, DAN KAMI AKAN MEMASTIKAN ANAK ANDA SAT NILAI MATEMATIKA。
Taman Pendiri: Tapi bukankah benar bahwa membayar untuk hasil tes tergantung pada motivasi individu siswa
Kai:INI MUNGKIN TIDAK MUNGKIN DI TINGKAT NASIONAL, KARENA ADA SEJUMLAH BESAR PEMERIKSAAN, DALAM RIBUAN. TAPI S.S.S.S.S. AS HANYA MEMILIKI 62 POIN, 50 YANG BIASA, SEBAGIAN BESAR SISWA BAIK-BAIK SAJA, DAN 12 SISANYA PADA DASARNYA TERSEDIA. KECUALI ADA MASALAH NYATA DENGAN TINGKAT LOGIS SISWA, AKAN ADA SEDIKIT KESEMPATAN UNTUK BELAJAR. DAN EFEK DARI AI SUDAH JELAS。
Bahkan, banyak tutus online AS memiliki layanan ini, dan Anda membayar guru $1.800, guru mengajar anak-anak, dan tingkat keberhasilan hampir 100 persen, karena poin SAT sudah tetap. Selama para siswa memiliki IQ normal, mereka pada dasarnya baik-baik saja. Tapi aku tidak bisa mendapatkannya dalam jangka pendek. Dan ada masalah dengan kebutuhan untuk membuka kesenjangan skor di tingkat nasional, tapi tidak ada masalah mutlak di tingkat Amerika karena ini lebih tentang apakah Anda memiliki titik pengetahuan。
Kaki atas dasar hasil juga model yang sudah digunakan oleh asisten pengajar, dan ini adalah prasyarat。
Taman Pendiri: Apakah biaya model menjadi masalah dalam harga Anda? Persentase tinggi
Kai:kami memiliki harga unit yang sangat tinggi di daerah ini, 69 dolar sebulan, dan biaya model sangat murah dan bukan masalah. pendidikan tidak seperti bidang coding, dan semua orang dalam harga roll karena coding perlu mendukung konteks yang panjang。
Bagi siswa SMA, akhir halaman adalah yang paling penting
PARK FOODER: Ingat terakhir kali Anda mengatakan bahwa versi pertama Anda mengambil hampir dua bulan. Apa siklus perkembangan penuh pada saat itu, seperti pembagian tenaga kerja, menentukan apa fungsi untuk dilakukan dan fungsi apa yang tidak boleh dilakukan
Kai:Konsensus dari kita semua dalam tim adalah bahwa itu cepat karena cepat untuk mendapatkan umpan balik dari pengguna awal。
Versi pertama, yang diposting di Twitter, menghasilkan banyak kegembiraan dan banyak pengguna. Tapi banyak dari pengguna ini adalah programmer, investor, atau pecinta teknologi, dan kita bisa menyebutnya "penguji teknologi". Pada tahap itu, umpan balik yang diterima dari mereka terfragmentasi dan nilai marginal. Hal ini juga penting untuk layar inti sejati pengguna benih, yaitu tinggi kualitas tinggi mahasiswa-sekolah, dari begitu banyak berbagai macam pengguna, dan untuk mendapatkan umpan balik berguna melalui konseling。
UMPAN BALIK INTI YANG KITA DAPAT ADALAH KEINDAHAN RENDER VIDEO HARUS 100 PERSEN, YANG MERUPAKAN PRIORITAS TERTINGGI YANG PERLU DIOPTIMALKAN. APAKAH UI TERLIHAT BAIK ATAU MENDUKUNG PILIHAN SUARA TTS YANG BERBEDA, KITA MEMOTONGNYA. KEMBALI KE INTI DARI PRODUK INI: APA YANG KITA LAKUKAN ADALAH BELAJAR DARI ILMU PENGETAHUAN, DAN AKURASI DARI GAMBAR RENDERING ADALAH INTINYA。
Taman Pendiri: Apa trade- off pada saat generasi
Puncak itu sekitar enam menit. Pertimbangan utama pada saat itu adalah bahwa presentasi topik biasa seharusnya tidak melebihi enam menit. Tetapi dalam umpan balik berikut-up, kami menemukan bahwa ada siswa yang kurang mampu belajar dan ingin menjadi lebih lambat dan lebih dalam. Kita sadar bahwa waktu tidak harus terbatas atau lebih tergantung pada kemampuan pengguna untuk belajar。
Untuk berapa lama
Kai:Ini harus berlangsung sampai satu jam untuk memecahkan casserole. Hal ini dihasilkan secara real time dengan cara komunikasi, meskipun fitur ini baru-baru ini dan versi pertama tidak tersedia。
Taman Pendiri: Apakah ada fungsi yang ingin Anda lakukan dan kemudian menemukan kurang penting untuk tidak melakukan pertama
Kai:Misalnya, App. Idenya adalah aplikasi ini akan dikembangkan dengan cepat, namun ternyata kebanyakan siswa di Amerika Serikat belajar dengan Laptop atau iPad, dan kebanyakan sekolah K12 di Amerika Serikat mengirimkan komputer Cromebook, yang sangat populer, dan pekerjaan mereka dilakukan pada komputer. siswa SMA pada dasarnya memiliki satu komputer, dan akun ponsel kurang dari 5 persen dari adegan belajar, dan sangat sedikit。
Taman Fourer: Jadi jika itu adalah produk pendidikan atau kelompok pendidikan utama, akhir halaman adalah yang pertama dilakukan, dan App tidak begitu penting。
Kai:Ya, itu sudah dikenal, setelah bertahun-tahun sekolah di Amerika Serikat. Lalu kami menggali 100 siswa dari puluhan ribu pengguna awal, dan lebih dari 90 dari 100 siswa memiliki komputer, jadi kami lebih yakin。
Taman Pendiri: Apakah Anda juga menargetkan K12 ketika Anda pergi ke versi pertama
Kai:Ya, dan kemudian menargetkan kelompok ini. Kami tidak bersaing dengan Gauth, kami melakukan pelatihan. Sejumlah besar siswa SMA di Amerika Serikat akan memilih pelatihan offline atau platform pembelajaran online, dan Tutor Vidio telah sangat baik bergeser permintaan ini。
Taman Pendiri: Apakah K12 akan menjadi kelompok pengguna inti Anda selama setidaknya satu tahun
Kai:Ini harus menjadi indikator inti dalam dua tahun。
Gunakan model besar, bukan hanya model besar
Taman Pendiri: Bagaimana dengan pengenalan singkat untuk program kesadaran teknologimu saat ini? Video Guru melakukan jauh lebih baik daripada model video-generasi lainnya, bahkan ketika banyak model tidak bisa menghasilkan teks persis。
James:Video yang kami buat adalah teks dan pola. Proses produksi yang mungkin adalah membiarkan model bahasa besar menghasilkan teks dan instruksi animasi yang sesuai, dan kemudian instruksi animasi melalui mesin animasi kami dan akhirnya ditampilkan pada video。
Teks relatif sederhana, dan kami membiarkan model bahasa besar menghasilkan teks dan kemudian membuatnya secara langsung. Tapi bagian animasi dibuat oleh salah satu mesin matematika animasi kita sendiri. Ini memiliki keuntungan dari menjadi sangat tepat dalam mereproduksi koordinat, geometrik, dan sebagainya, yang merupakan teknologi inti kami。
model bahasa yang besar hanyalah teks, dan yang satu ini kita buat adalah seperti memberikan model bahasa besar secarik kertas dan pena untuk melukis animasi pengajaran yang sesuai yang ia bayangkan. bagian dari lukisan itu adalah teknologi kita。
Taman Fourer: Bagaimana sintesis akhir seluruh video, termasuk audio dan video, bekerja
James:Pada awalnya, pengguna akan memasukkan prompt, seperti "Apa sandiwara saham?" Pada tahap pertama, kita membiarkan model bahasa besar menyimpulkan semua adegan, dan kita biasanya mengatur tiga sampai lima skenario, tergantung pada kesulitan dari masalah. Model kemudian akan menghasilkan naskah perkiraan untuk setiap adegan. Sebuah alasan kedua kemudian dibuat berdasarkan script dari setiap adegan, menghasilkan teks di TKP, pola yang sesuai dan teks suara manusia. Teks suara manusia disintesis dengan TTS。
Dan akhirnya, kami mengumpulkan semua adegan dan membuat video yang lengkap。
Taman Fourer: Aku mengerti versi pertama dari program ini. Apakah proses generasi berubah sekarang bahwa hal itu interaktif
James:Ada perubahan. Sekarang, agar pengguna dapat melihat isinya secepat mungkin, kita akan mendapat adegan pertama yang dapat dilihat pengguna, dan adegan berikutnya akan terus diputar di belakang panggung. Ketika pengguna mengajukan pertanyaan, kita mengubah suara manusia menjadi teks, dan kemudian menyerahkannya ke model large- bahasa, bersama dengan isi dari semua adegan sebelumnya, sehingga dapat merencanakan kursus berikutnya. Adegan berikutnya sama seperti sebelumnya。
Dari Park: Jika pengguna mendengar pertanyaan selama satu menit, ia akan mengajukan pertanyaan secara langsung. Ketika anda ditanya, anda kembali ke model dengan pertanyaan pengguna dan pernyataan sebelumnya. Dalam proses, setelah pertanyaan pengguna telah selesai, animasi akan terus atau akan berhenti
James:Kami telah tertunda dalam 20, 30 detik dari awal, di bawah lima. Pada sisi interaktif, kita akan membuat beberapa transisi sehingga pengguna tidak terlalu memperhatikan lima detik ini, dan seluruh proses akan menjadi lebih halus. Dalam empat sampai lima detik, dia bisa melihat cerita baru berdasarkan pertanyaannya。
DESAIN PADA TAHAP INI ADALAH BAHWA GURU DI AI AKAN BERKATA, "YAH, SAYA AKAN MEMIKIRKANNYA", DAN KEMUDIAN MENGHAPUS PAPAN TULIS, SEPERTI GURU MODEL ASLI. KAU PIKIR ADA SESUATU YANG SALAH, DAN AKU AKAN MENGHAPUSNYA DAN MENULISNYA LAGI. INI AKAN TERASA LEBIH ALAMI。
Dan tidak hanya kita menunggu pasif untuk pertanyaan dari pengguna, kita akan melakukan Quiz di tengah. Kami akan alasan dengan umpan balik Quiz dan pertanyaan pengguna. Dan kita tidak benar-benar bebas gandum, tapi kita perlu pengguna untuk menghidupkan mikrofon dan memiliki tindakan untuk menyalakannya dan off。
Taman Pendiri: Jadi berdasarkan mekanisme tersebut, dapat menghasilkan pidato selama sekitar satu jam。
James:Tidak ada batas untuk titik, dan jika ia memiliki masalah, ia bisa terus bertanya。
Kai:Ya, tidak ada batas yang ditentukan. Bahkan, VidioTutur melakukan hal ini dengan cara yang tidak kita buat permintaan, namun lebih baik bertemu permintaan yang ada, sebagai kemajuan AI multi- model. Mengapa orang tua Amerika membayar begitu banyak uang? Karena industri pelatihan Amerika lebih satu-satu-satu, dimulai dari $100 per jam. Hanya karena seorang guru di bawah garis dapat memimpin pertanyaan, saya dapat melihat di mana Anda tidak akan, dan kemudian saya dapat meminta Anda. VideoTutur juga berusaha untuk mencapai kinerja guru sejati ini, sehingga setiap anak dapat berinteraksi dan mengajar secara langsung。
Taman Pendiri: Akankah siswa meminta untuk menyalakan kamera selama kelas
Kai:Tidak juga. Apakah seorang siswa memiliki akses ke kamera tergantung sebagian besar pada Amerika Serikat Undang-Undang Privasi. Hal ini tidak mudah untuk merancang pembukaan wajib dalam produk, dan itu tergantung pada keinginan para siswa. Interaksi utama juga melalui pertanyaan dan umpan balik suara。
Taman Pendiri: Secara teknis, apa kau menggunakan model kecil dan ukuran awan atau apa
Kai:Ini kolaborasi. Kita punya data di dalamnya, dan sekarang kita punya lebih dari 100.000 data video. Data yang lebih baik secara manual ditandai dan kemudian digunakan untuk melatih model finetuning. Sebagai contoh, kita memiliki lebih dari 800 SAT sampel pelatihan data. Ini baik - disetel model kecil akan dilakukan dengan awan-berbasis generik model komersial seperti Claude, Gemini。
Taman Pendiri: Apakah penggunaan Claude, Gemini atau GPT mempengaruhi kinerja inti produk
Kai:Kami terutama berurusan dengan bidang K12, dan model dasar sudah pada tingkat yang cukup. Tetapi untuk memastikan bahwa 100% benar, kita akan memanggil dua model pada saat yang sama, dan jika kedua model memiliki jawaban yang sama, maka mereka pada dasarnya tidak salah. Dalam hal pembuatan kode, ini lebih tentang Claude, dan lebih baik。
Taman Pendiri: Berapa banyak teknologi dalam produk ini? Modelling kapasitas atau pembuatan kode
Kai:MODELLING KAPASITAS ADALAH SALAH SATU DARI MEREKA. DAN KEMUDIAN ADA RENDERING, DAN SEKARANG DI BAWAH LIMA DETIK, DAN SEBAGAI GPU MENYEBAR LEBIH CEPAT. YANG LAINNYA ADALAH MEMORI JANGKA PANJANG. KITA PERLU MENGUMPULKAN DATA PERILAKU JANGKA PANJANG PADA SISWA, MENGETAHUI APA YANG DIA TIDAK MENGERTI, MISALNYA, BAHWA DIA LUPA SATU BULAN PRA-SEKOLAH, DAN DAPAT DIINGATKAN LAGI。
James:Kami benar-benar menempatkan banyak usaha ke dalam Rendering waktu, dan kami telah melakukan terobosan teknologi, dari 2 menit sampai 1 menit di awal, sampai 10 detik sekarang. Tujuan utama kami adalah untuk mencapai rendering sebagian besar tertunda, dan segera setelah pengguna bertanya, penalaran berakhir. Ini adalah tugas yang sulit untuk tim kami saat ini, tapi kami telah menemukan arah baru。
Jika Anda tidak menonton tingkat finish, Anda akan melihat skor akhir
Taman Pendiri: Bagaimana bisa indikator utama produk diukur pada tahap ini? Bagaimana Anda menilai video berguna bagi pengguna
Kai:salah satu indikator inti adalah pemeriksaan. dalam versi baru, setelah anda membaca video, ada kuis di akhir, dan anda melakukan hal yang benar, dan anda tidak tahu itu。
Hasil penelitian tidak dapat dilihat hanya dalam tingkat cakupan, dan beberapa siswa dapat membaca setengah. Beri dia tes ketika dia setengah jalan, melewatinya, dan sisanya tidak diperlukan. Indikator utama dari produk kami adalah berapa banyak siswa telah meningkatkan nilai mereka di sini。
Finder Park: Tapi ujian terakhirnya dilakukan di adegan lain. Bagaimana Anda mendapatkan hasil ini bahwa ia lulus
Kai:Hal ini untuk mengatakan bahwa budaya produk di Amerika Serikat adalah bahwa ketika produk digunakan oleh pengguna, hasil yang baik diperoleh dan ada berbagi spontan. Banyak siswa akan datang untuk berbagi pengalaman dan prestasi mereka setelah menggunakan Video Tutor. Kami juga akan membuat mereka duta kampus untuk penyebaran sekunder。
Kami memiliki 20 siswa SMA terdiri dari duta besar kampus. Anda lihat, Mercor sangat sukses pada hari-hari awal, menggunakan cerita sukses pengguna khas. Mercor membantu banyak programmer India menemukan pekerjaan di Amerika Serikat pada hari-hari awal, dan kemudian mereka menghubungi pengguna dan menembak mereka cerita pengguna tentang bagaimana mendapatkan pekerjaan dengan Mercor. Ini menciptakan reputasi yang baik untuk penyebaran. Video Guru juga alasan kita ingin lebih banyak siswa untuk menggunakan produk untuk mencapai hasil yang sangat baik, dan kemudian berbagi pengalaman mereka dengan cerita pengguna。
Taman Pendiri: Dimana saluran utama untuk berbagi siswa
Kai:Siswa terutama di TikTok, orang tua dalam kelompok Facebook。
Taman Fourer: Apa rencanamu untuk mengembangkan produkmu jika kau menghabiskan waktumu setengah tahun atau satu tahun dimensi waktu
Kai:Intinya, saya pikir inti Tutor Vidio masih produk pengguna-C, dan sangat penting untuk menyebarkannya. Banyak aplikasi AI yang sukses awalnya didasarkan pada reputasi pengguna benih, seperti perancang merasa baik, dan menyebar. Bagi kami, indikator intinya adalah berapa banyak kandidat SAT telah menggunakan produk tersebut dan memberikannya kepada anak-anak dan orang tua lainnya. Orang tua terutama menggunakan Facebook dan Instagram, siswa menggunakan TikTok, dan kami akan menyebar di platform ini. Ketika persetujuan tersebut terbentuk, adalah wajar bagi guru-guru sekolah untuk menyadarinya. Kami dikenal dengan banyak sekolah pada tahap awal karena banyak guru menggunakannya dengan baik dan merekomendasikan kepada manajer pengadaan sekolah. Jadi, intinya adalah penyebaran slogan pengguna C-end, dan ini adalah indikator kunci dari berapa banyak anak yang telah menggunakannya, dan peningkatan skor。
Taman Fourer: Apa status perkiraan dari versi baru dan waktu peluncurannya
Kai:Kami ingin menjadi pejabat dalam waktu dua bulan sesegera mungkin. Dan pada saat itu, siswa akan mampu menjawab dengan penundaan yang sangat rendah, dan gambar rendering ilmu layar akan 100% akurat. Tentu saja, untuk saat ini, kita tidak akan membahas adegan kompetisi atau pengetahuan universitas kompleks seperti aljabar linear, lebih atau lebih, K12。
Taman Pendiri: Video Tutor apa hambatan atau parit sekarang
Kai:Kurasa ada beberapa poin. Yang pertama adalah selebaran data. Video ini didukung oleh kode, dan data video yang baik yang dihasilkan oleh pengguna dapat dilatih kembali dalam baik-tuning model setelah menandai ulang. Semakin banyak data video bekerja. Terlebih lagi adalah mempelajari data perilaku, dan kita tahu titik mana dari ilmu pengetahuan yang lemah bagi siswa yang berbeda-beda, dan kita dapat membangun selebaran data, dan semakin banyak orang menggunakannya, semakin baik produknya untuk siswa. Yang kedua adalah keunggulan teknologi terkemuka, seperti algoritma mesin animasi. Meskipun algoritma tidak dalam diri mereka keuntungan yang paling sentral, keuntungan akan menjadi lebih jelas saat kita berkembang dengan cepat。
Ketiga, merek, Video Tutor, telah menjadi merek utama dalam pendidikan di Amerika Utara, dan kepercayaan orang tua adalah penghalang tak terlihat。
Taman Pendiri: Tiga sampai lima tahun kemudian, jenis produk apa yang Anda harapkan VidioTutur tumbuh menjadi
Kai:Kami ingin Guru Video menjadi guru AI untuk semua orang belajar ilmu pengetahuan. Kami hanya melakukan sains. Saya pikir itu akan menjadi lebih dari tetangga di masa depan. Multi- tetangga adalah produk belajar bahasa kelas dunia, tetapi dalam adegan ilmiah STEM, produk kelas dunia tidak pernah muncul di masa lalu karena ilmu pengetahuan membutuhkan terlalu banyak rendering grafis. Sekarang bahwa teknologi model dasar siap, saya pikir ilmu adegan akan menjadi multi-tetangga berikutnya。
Aku ingin orang, terutama orang dari negara ini
Taman Pendiri: Berapa banyak pengalaman bisnis yang kau miliki sebelumnya
Kai:Aku senior sekarang. Di tahun pertama, kami memulai bisnis dengan James untuk membuat produk pendidikan, dengan investasi malaikat seharga $200.000. Meskipun kegagalan itu, pelajaran berharga telah dipelajari: Anda tidak bisa jatuh ke dalam kompetisi homogen. Aplikasi yang kami buat pada saat itu, ada banyak produk serupa di pasaran, dan sangat sulit untuk mengisinya pada tahap awal。
Untuk kedua kalinya, aku bergabung dengan tim lain, MatniGPPPro, sebagai pendiri, selama berbulan-bulan. Pada tahap itu, saya belajar bagaimana melihat indikator produk, bagaimana membangun produk, bagaimana mengembangkan pengguna. Dan saat itulah saya sampai pada kesimpulan bahwa hasil akhir teks berdasarkan jenis produk pendidikan adalah pada akhirnya. Karena itu tidak berbeda dengan ChatGPT, dan telah digantikan oleh kapasitas editorial dari model besar oleh basis pengetahuan terstruktur yang digunakan untuk dilakukan dengan biaya besar oleh para pembantu. Jadi untuk ketiga kalinya, saya tahu visualisasi adalah tren yang tak terelakkan。

Foto dari Sam Altman Pitch di Harvard
Taman Fourer: Apa yang membantumu melakukan Video Guru sekarang, selain membuat Anda menyadari keterbatasan produk berbasis teks, dalam sebuah tim atau sebaliknya
Kai:Sangat membantu。
Pertama, penilaian yang lebih baik arah dan masa depan produk. Aku akan menilai evolusi seluruh produk dengan melihat kompetisi lalu lintas web, pendapatan。
Poin kedua, penciptaan produk, lebih baik dapat menilai laju pengembangan produk, termasuk rancangan produk, antarmuka back- end, dan indikator apa yang dapat dilihat。
Ketiga, manajemen tim dan budaya organisasi. Saya telah menempatkan sistem manajemen yang lebih lengkap termasuk pembagian tenaga kerja, insentif dan pilihan untuk setiap siswa. Dan aku belajar bagaimana membiayai itu. Ronde ini $10 juta dalam pembiayaan, kita selesai dalam 20 hari。
Dari Park: berapa banyak orang di tim Anda sekarang
Kai:Enam orang, semua orang tinggal bersama。
Taman Pendiri: Bagaimana tim mulai
Kai:Aku dan James memulai bisnis dua kali. Kami berdua lulus dari sekolah, dan kami membuat sebuah App di tahun pertama. Ketika saya masih mahasiswa tahun kedua, saya memulai bisnis dengan dua orang lain. Dan ketika kita menyadari bahwa teknologi ini dapat menyebabkan visi produk yang sangat besar, kita menghubungi tim untuk melakukan hal ini. Kami semua alumni, termasuk mitra lain dalam tim, Nick, dan teman sekamar kuliahku。
Taman Pendiri: Pria macam apa yang akan kau pekerjakan sekarang
Kai:Sumber utama kami dari pengalaman adalah back end, front end, model bahasa yang besar dan UI / UX. Karena kita sekarang telah melewati fase uji dan kesalahan, dan kita telah memasuki pembangunan cepat produk, dan kita membutuhkan orang-orang berpengalaman untuk membantu kita tumbuh。
Pendiri Taman: insinyur berpengalaman, manajer produk dan manajer pertumbuhan diperlukan untuk mendapatkan produk dari 1 sampai 10, atau bahkan dari 10。
Kai:Ya, itu panggungnya. Kami berharap untuk memperluas tim untuk sembilan sampai sepuluh orang, dan inti masih fokus pada mempekerjakan insinyur。
panggilan ini mungkin berasal dari rumah tangga, jadi itu adalah orang dalam dan campuran jarak jauh。
Taman Pendiri: Apa gambar orang ini
Kai:Kami lebih suka dia pergi melalui itu di beberapa pabrik besar, seperti byte, misi. Karena byte adalah budaya organisasi yang sangat cepat dan sebanding yang menghargai kaum muda. Mereka yang telah dilatih dalam bita memiliki metodologi yang lebih baik dan kemampuan untuk bergabung dengan kami untuk membawa ini sukses pengalaman untuk pembelajaran terpadu。
Orang-orang yang ingin berjuang keras di pabrik-pabrik besar di negeri ini dan memiliki pengalaman cepat. Kami telah melalui fase start- up siswa, tidak banyak untuk merekrut baru merekrut, jauh lebih berpengalaman, tapi tidak jenis full- ditiup "Bisnis-majikan". Hal ini tidak mungkin karena tua-timer tidak bisa mengurus keluarga mereka. Jadi tingkat menengah, muda dan mampu roll。
KAMI BERSEDIA MEMBERIKAN PILIHAN UNTUK BAKAT YANG BAIK. KAMI MELEBUR $11.000.000, TAPI MENGAPA KITA TIDAK MENYEWA INSINYUR DI AMERIKA? HAL INI KARENA KITA BERPIKIR KAPASITAS DOMESTIK UNTUK PRODUK DAN TEKNIK BENAR-BENAR BAIK. GELOMBANG 100 PERSEN INI AKAN MEMILIKI TIM CHINESE- LARI MEMBUAT PRODUK BESAR DAN KELUAR SECARA INTERNASIONAL. BANYAK APLIKASI AI SEKARANG DIBUAT OLEH ORANG-ORANG CINA, DAN KAPASITAS REKAYASA NEGARA BENAR-BENAR BESAR. HAL INI JUGA KEUNTUNGAN KITA UNTUK MENGAMBIL KEUNTUNGAN DARI KEUNTUNGAN ANTARA CINA DAN AMERIKA SERIKAT。
MAHASISWA UNIVERSITAS DI SILICON VALLEY MEMULAI DARI AI
Taman Pendiri: Kecenderungan terhadap kewirausahaan universitas sangat jelas, terutama di Silicon Valley, dan apa negara yang Anda lihat
Kai:Lihatlah fakta bahwa Mercor, pemilik perusahaan AI- direkrut, telah menyelesaikan pembiayaan baru lebih dari $300 juta dan telah dihargai di $10 miliar; dan Cursor sudah dipaku $10 miliar valuasi. Ada GPTZero, Pika, dan sebagainya. Ini adalah proyek start- up universitas, terutama pendiri Cursor dan Mercor, yang mahasiswa baru。
Gelombang kewirausahaan pemuda ini ditandai dengan kompetisi yang sangat berbeda. Mereka telah berfokus pada daerah yang sangat sempit dan tidak melakukan sesuatu yang sama. Mercor, contohnya, melakukan perekrutan AI, dimulai dengan perekrutan programmer India。
Poin kedua adalah lingkungan. Lingkungan modal Silicon Valley sebagai inovasi keseluruhan dan dasar, seperti Stanford, YC, dana Peter Thiel, mendukung mahasiswa universitas pada tahap awal memulai bisnis, apakah Anda memiliki ide-ide dewasa atau tidak, dan bersedia untuk mendukung Anda dan menyediakan jaringan manusia yang kuat。
Ketiga, saya pikir itu adalah kualitas mahasiswa ini. Para siswa ini, baik kita atau dari Silicon Valley, memiliki semangat petualangan yang sangat berani dan kemampuan besar untuk belajar. Banyak siswa di negara ini mungkin tidak memiliki semangat yang berani. Karena di Silicon Valley ada banyak contoh kesuksesan rekan yang menginspirasi Anda, dan lingkungan modal bersedia mempercayai anak muda。
Bagi saya, biaya dan manfaat juga dibandingkan. Jika saya memilih untuk menyelesaikan universitas dan mencari pekerjaan, saya mungkin tidak mampu membayar biaya belajar di rumah, atau saya tidak akan dapat kembali signifikan. Tapi jika aku memilih memulai bisnis, aku bisa marah pada yang termuda, dan hidupku memiliki kemungkinan tak terbatas. Aku ingin memulai perusahaan besar sejak aku masih kecil。
Dari Park: Mengapa generasi mahasiswa universitas ini memulai perusahaan bernilai miliaran dolar, dan luar biasa jika mereka bisa menjual 12 juta dolar? Apakah ada faktor panas dan busa dalam hal ini
Kai:Saya tidak berpikir itu semua busa. Kursor memiliki nyata $450 juta koleksi, yang sangat dapat diandalkan. Di balik ini adalah metodologi dan pengakuan dari generasi ini tim muda yang penting. Anda lihat tim-tim ini, mereka memiliki latar belakang yang sangat baik, mereka memiliki keterampilan belajar yang besar。
Kursor adalah pemrogram awal dengan penerimaan AI tingkat tinggi dan umpan balik yang kuat. Para pendiri sendiri adalah insinyur berbakat yang memiliki pemahaman mendalam tentang pengguna dan lintasan rekayasa yang kuat, dan pada tahap awal empat orang mengeringkan produk tersebut. Dan ketika mereka selesai dengan produk, mereka menciptakan reputasi pengguna, dan investor takut kehilangan Mark Zuckerberg berikutnya, jadi modal membantu。
Intinya adalah banyak teknologi di AI adalah orang baru dan muda yang belajar dengan cepat, praktis, dapat diandalkan dan berani, sehingga ada tingkat yang sangat tinggi dari pemahaman pengguna dan kecepatan iteratif yang sangat cepat untuk mengalahkan produk tradisional. Sebelum Cursor, misalnya, GitHub Copilot melakukannya dengan baik, tapi kenapa tidak? Ini karena pengalaman pengguna dan kecepatan implementasi。
Taman Pendiri: Apakah mungkin untuk mengatakan bahwa karena Al adalah teknologi baru, banyak pengakuan produk juga perlu dilihat dalam perspektif baru
Kai:YA, GENERASI MUDA MEMILIKI PERSPEKTIF KOGNITIF YANG LEBIH DALAM DARI GENERASI SEBELUMNYA PENGUSAHA DAN BISA LEBIH DEKAT DENGAN PENGGUNA. SEKARANG PENGGUNA AI MAINSTREAM SETELAH 0000, DAN MEREKA BELAJAR DAN MEMBERIKAN UMPAN BALIK PADA TINGKAT ITERATIF DAN LEBIH INKLUSIF DARIPADA PENGUSAHA SEBELUMNYA。
Jadi, lintasan kognitif berada di inti. Pada era Internet bergerak, tumpang tindih teknologi adalah tahun atau seperempat, tapi di era AI, tumpang tindih teknologi mungkin berbasis langit. Anda harus belajar dengan cepat, sebagai baseer, sementara anak muda bergadang dan bekerja lebih keras。
Taman Fourer: Bagaimana menurutmu
Kai:aku di sekitar beberapa teman pengusaha kulit putih, banyak uang juga. mereka seperti kita, menyewa rumah besar, semua tinggal bersama. saya pikir 996 lebih lingkungan, dan sekarang silicon valley sedikit terburu-buru emas, dan tidak ada yang ingin tertinggal, tapi lebih cepat daripada produk, dan harus tetap terjaga terlambat. ini adalah lingkungan yang memaksa orang untuk melakukannya。
Finder Park: Apakah para siswa di Silicon Valley memulai usaha mereka sendiri
Kai:Saya berpikir bahwa ada kecenderungan untuk semua orang, apakah kita melakukan pendidikan atau orang lain, untuk memulai bisnis di zona kenyamanan mereka. Lingkaran yang nyaman berarti Anda memiliki pemahaman yang baik tentang bidang dan pengguna. Pendiri Cursor tahu betul tentang coding, dan kita melakukan pendidikan karena kita mengenal populasi ini dengan baik. Orang-orang muda sekarang lebih mungkin untuk memulai bisnis dalam lingkaran kognitif yang sudah ada dan tidak lagi melompat ke bidang yang tidak diketahui. Karena itu adalah bagaimana Anda mendapatkan umpan balik dari pengguna yang cukup cepat untuk menjadi benar。
Ada overlap kognitif. Kami telah melakukan pendidikan tiga kali, dan persepsi saya terus-menerus dikenakan. Anak-anak kuliah ini tidak melakukan apa yang mereka tidak pernah lakukan di masa lalu. Mereka mencoba untuk berbuat lebih baik. Mereka memiliki generasi baru dalam berpikir, berkembang dalam lingkaran kognitif mereka sendiri, dan dengan berani menciptakan peluang。
Ada juga roh pemberani yang tidak mengurus apa yang kau pikirkan tentangku. Di belakangnya adalah budaya dari "eksperimen berkecepatan tinggi", dan saya tahu bahwa produk saya belum siap, tapi saya tidak peduli, cepat online, cepat iteratif, umpan balik cepat。
Taman Pendiri: Kapan gelombang ini dimulai
Kai:Saya pikir itu adalah keberhasilan konsensus. Ketika Anda melihat proyek seperti GPTZero, yang tumbuh dari asrama, berkembang dari waktu ke waktu dan mendapatkan modal dan pengakuan pengguna, ada banyak kasus sukses kesalahan cepat dan ledakan cepat。
"Lebih baik dilakukan daripada sempurna". Dan orang-orang tidak terlalu peduli tentang kompetisi, dan banyak orang di Silicon Valley bersedia berbicara tentang ide-ide produk mereka, dan mereka tidak takut Anda menirunya. Saya pikir gelombang kaum muda ini memiliki kemampuan yang baik untuk bercerita yang tidak palsu, namun berdasarkan realisme dan visi mereka sendiri tentang masa depan。
Pemasaran dirimu dulu。
Kai:Benar. Saya pikir intinya adalah semangat petualangan dan kepercayaan diri ekstrim. Didorong oleh ini, mereka terus mencoba dan membuat kesalahan, tanpa takut mengatakan hal-hal yang salah. Ini adalah kesalahan besar untuk berbicara tentang ide produknya dan untuk menerapkannya. Budaya ketakutan akan kesalahan ini telah berkontribusi pada antusiasme dan kesuksesan dari gelombang mahasiswa ini。
VC DARI AS JUGA MELIHAT PROYEK MAHASISWA, DAN YC SECARA TERATUR BERINVESTASI DALAM PROYEK MAHASISWA。
Pembiayaan adalah Video Tutor
Finder Park: Apa yang Anda sarankan untuk diri sendiri jika Anda kembali menjadi Guru Video? Apakah ada sesuatu yang lebih baik untuk dilakukan
Kai:Saya pikir itu harus lebih cepat. Dan ada formasi tim. Video Tim Tutor adalah grinding melalui beberapa roda. Jika aku tahu, aku akan melakukan lebih baik untuk membangun tim berdasarkan keterampilan yang diperlukan oleh produk. Saya pikir itu penting untuk kembali ke bisnis. Saya akan menghabiskan lebih banyak waktu untuk keterampilan organisasi: memilih orang, mengenal orang, menggunakan orang-orang baik。
Sekarang tim ini cocok untuk tumbuh dari 0 ke 1, tetapi untuk berbuat lebih banyak dengan Video Tutor, atau membutuhkan seseorang dengan lebih pengalaman kerja untuk membawa pengalaman dan kemampuan mereka kepada tim dan membantu tim tumbuh bersama。
Finder Park: Dalam enam bulan ke depan, jenis produk atau kesulitan teknis apa yang Anda pikir Video Tutor mungkin miliki
Kai:Saya pikir salah satunya adalah perbaikan, dan untuk turun ke nol delay nyata, kita perlu terobosan. Yang kedua adalah pertumbuhan, dan saya pikir ini adalah rasa produk, dan ada banyak hal di belakangnya, seperti UI, apakah desain interaktif itu halus, apakah interaksi fungsional bukanlah bug, apakah tata letak visual itu indah, dll. Ini semua adalah tes untuk kita。
James:Saya pikir pada awalnya kami menargetkan Guru Vidio untuk bimbingan visual dalam semua disiplin ilmu, tapi kemudian kami melakukannya sangat vertikal, hanya dalam matematika, karena itulah yang kami lakukan yang terbaik. Mesin rendering matematika kami adalah yang paling khusus. Apa yang berikutnya adalah terobosan, mungkin ekspansi horisontal. Sebagai contoh, bagaimana visualisasi dapat dibawa ke adegan sastra? Sebagai contoh, itu adalah penjelasan untuk "hari manis, keringat dan bumi". Itulah yang akan kita lakukan secara teknis。
Taman Foreman: Apakah akan ada masalah dengan ekspansi berikutnya karena latar belakang pendiri
Kai:Tidak juga. Sebenarnya, ada banyak VC besar mencari kita, seperti a16z, dan mereka tidak melakukannya terlalu awal, tetapi mereka melakukannya ketika tim memiliki tanda keberhasilan, sehingga mereka tahu bahwa investasi tidak akan gagal. Kami memiliki hubungan yang baik dengan banyak VC besar。
Keuangan adalah hal terakhir yang perlu dikhawatirkan Video Tutor, hal terakhir yang perlu dikhawatirkan adalah tentang ekologi pengguna dan produk。
Tautan Asli