Pada 18 Oktober, Laboratorium Penelitian AI, berfokus pada pasar keuangan, Nof1, meluncurkan percobaan yang belum pernah terjadi sebelumnya: enam model AI papan atas dunia — — GPT-5, Gemini 2.5 Pro, Grok-4, Claude Sonet 4.5, DeepSeek V3.1, Qwen3 Max & mdash; — mengelola dana nyata sebesar $10,000 masing-masing pada Hyperliquid untuk melakukan transaksi mata uang terenkripsi。
Peringkat dan nilai rekening saat ini: Mulai malam 30 Oktober, peringkat terbaru adalah sebagai berikut:
Daftar ini mewakili perubahan dramatis dari data beberapa hari yang lalu. DeepSeek, saat masih memimpin, menarik diri secara signifikan dari 95,71 persen menjadi 56,71 persen, dan nilai rekening jatuh dari $19,570 menjadi $15.671, menguap hampir $4.000. Waaž Qwen3 juga mengalami mundur dari 53,68 persen menjadi 25,20 persen. Lebih diperhatikan lagi, Claude Sonet 4.5 berubah dari mikro-interest menjadi kerugian 7 persen, sementara kerugian GPT 5 semakin bertambah menjadi 72 persen, yang tidak lagi jauh dari gudang ledakan。
Pasar-pasar berada di jalur ke atas, dan perbedaan strategi antara model yang berbeda mulai muncul:
Kesuksesan DeepSeek didasarkan pada pendekatan Øswing-in": 95 persen waktu dihabiskan, dan dipercaya bahwa tren akan terus berlanjut. Dalam tren ke atas, strategi menghasilkan pengembalian tertinggi 95 persen. Tapi ketika tren terbalik, strategi yang sama harganya 30 persen。
Ini mengekspos isu kunci: Strategi susulan Trends perlu dipadankan dengan mekanisme efektif untuk menghentikan perolehan dan kerugian. *** Jika hanya "biarkan keuntungan berjalan" dan tidak "potong kerugian", sebuah pembalikan besar dapat melahap sebagian besar keuntungan。
DeepSeek mungkin terlalu yakin akan nilai "long hold", mengabaikan ketidakpastian pasar. Keuntungan maksimum tunggalnya sebesar $7.378 berasal dari kesepakatan ETH 60 jam, dan pengalaman sukses ini mungkin telah memperkuat kepercayaan jangka panjangnya. Namun, pasar keuangan bukanlah jalan satu arah, dan tren bisa terbalik kapan saja。
- Qwen3 menunjukkan nilai silo dalam istilah praktis. Ini 82,4 persen waktu silo tampaknya "kehilangan kesempatan" di upswing, tetapi menjadi "menahan kerugian" pada kejatuhan。
Penarikan mundur 26 persen vs 32 persen, yang tampaknya adalah perbedaan 6 persen poin, kemungkinan meningkat di bawah efek kompaun. Yang lebih penting lagi, Qwen3 mempertahankan keuntungan yang lebih pokok dan psikologis dan, setelah pasar stabil, dapat dengan cepat membentuk kembali dirinya sendiri. Dan DeepSeek, jika ia terus mundur, bisa jatuh ke dalam lingkaran ganas dari "float-suspensif-miss-kembali"。
BTC Buy Buy & Hold bertindak sebagai tamparan pada semua Øsmart" AI. Strategi ini tidak memiliki analisis teknis, tidak ada algoritma canggih, tidak ada reposisi yang sering, tetapi sekarang peringkat ketiga, melebihi setengah model AI。
Hasil ini memberi tahu kita bahwa lebih penting untuk mengurangi kesalahan dalam transaksi daripada berbuat lebih benar. *** Gemini Gemini kehilangan 66 persen dengan 193 transaksi, BTC Buy & Hold menyelamatkan kepala sekolah dengan 0 transaksi. Siapa yang lebih sukses? Jawabannya jelas。
Dengan pengecualian Qwen3, hampir semua AI telah mengungkapkan kekurangan serius dalam manajemen risiko:
HAL INI MENUNJUKKAN BAHWA MESKIPUN AI INI MAMPU "MEMBACA" DATA PASAR DAN "EXECUT" INSTRUKSI TRANSAKSIONAL, MEREKA JAUH DARI MATANG DALAM HAL INTI KOMPETENSI MANAJEMEN RISIKO。
Setelah membaca data dan analisis, kami mudah tertarik dengan 56 persen pengembalian DeepSeek atau 66 persen kehilangan Gemini. Namun sebelum menarik kesimpulan apapun, kita harus menghadapi keterbatasan sistem dari eksperimen itu sendiri, yang mungkin lebih penting dari hasil itu sendiri。
Eksperimen tersebut hanya berlangsung selama 12 hari, dari 18 sampai 30 Oktober. Apa artinya 12 hari di pasar enkripsi? Ini mungkin hanya akord penuh。
Apa yang kita lihat adalah "up, atas, atas, atas." Ini kebetulan menjadi siklus penuh, tapi itu lebih seperti keberuntungan. Jika percobaan dimulai dari puncak pasar, atau ada "519" penurunan satu hari sebesar 30 persen, peringkat saat ini dapat sepenuhnya dibalik。
Pendapatannya mungkin sangat tergantung pada pola 12 hari. 95-95 persen dari strategi multi-salahnya adalah raja dalam kenaikan unilateral, tetapi jika terkena kejutan tiga bulan, itu akan dihapuskan dengan biaya transaksi dan stoppage berulang。
Demikian pula, 82 persen dari tingkat penyimpanan udara Qwen3 berada pada posisi terbaik di pasar kejang, tetapi pada tahun 2021 sapi gila akan kehilangan keraguan. Sebuah kota sapi BTC yang meningkat dari $10,000 menjadi $100,000, dan 80 persen waktu di gudang berarti Anda hanya mendapatkan 20 persen。
Data untuk 12 hari tidak cukup untuk menunjukkan efektivitas jangka panjang dari strategi apapun。
Semua enam model AI menerima kerangka kerja yang sama dari data pasar dan arahan perdagangan. Ini seperti memiliki enam manajer dana membaca penelitian yang sama untuk pengambilan keputusan; itu bukan keterampilan penelitian mereka yang Anda uji, itu disiplin mereka。
di dunia nyata transaksi, alpha berasal dari asimetri informasi. dana kuantitatif tingkat atas memiliki sistem pelacakan rantai eksklusif yang memungkinkan untuk deteksi transfer paus; data pada off-site aliran pesanan besar tersedia untuk mendeteksi gerakan institusional di muka。
TAPI DALAM PERCOBAAN INI, AI MELIHAT INFORMASI YANG SAMA PERSIS. INI LEBIH SEPERTI KOMPETISI "EXECUTION" DARIPADA KOMPETISI "TAKTIS INOVASI"。
Kita tidak bisa menilai dari percobaan ini siapa yang akan menjadi pemenang nyata jika kita memberikan data eksklusif DeepSeek pada rantai, dan eksklusif Gemini di Twitter。
Setiap AI hanya mengelola $ 10.000 kepala sekolah. Ini adalah jumlah yang sangat kecil uang — &mdash pada Hyperliquid; Anda dapat masuk dan keluar setiap saat, titik slide adalah neglible, kejutan likuiditas tidak ada, dan split besar tidak perlu dipertimbangkan sama sekali。
Tapi di dunia nyata transaksi kuantitatif, mengelola $ 10 juta dan mengelola $ 10.000 adalah dua spesies。
Eksperimen ini menguji kelenturan dana kecil, bukan keteguhan strategi yang tajam。
Pasarnya relatif stabil selama percobaan, dengan tingkat volatilitas yang sedang. Kami tidak melihat
Semua sistem kontrol angin AI tidak diuji untuk stres ekstrim, dan ini adalah tantangan nyata untuk pedagang terenkripsi. Apa yang terjadi pada mekanisme pemotongan DeepSeek ketika itu "tidak dapat membuat kesepakatan"? Kami tidak tahu. Apa gudang Qwen3 masih berfungsi saat pertukaran macet? Aku tidak tahu。
Keberuntungan, dalam percobaan 12 hari, bisa jauh lebih besar dari yang kita duga。
Ini adalah percobaan satu kali, dan tidak ada musim kedua untuk memverifikasi stabilitas strategi. Kita tidak bisa menilai:
Sekarang, lebih seperti enam orang melempar dadu, dan DeepSeek melemparkan poin terbesar. Tapi itu tidak berarti itu lebih baik. Mungkin lebih beruntung。
Setelah melihat keterbatasan ini, Anda mungkin bertanya, "Apakah percobaan masih relevan
Ya, tapi itu tidak berarti "siapa juara." Nilai nyata eksperimen ini adalah untuk menunjukkan kepada kita:
Tapi jika Anda akan meninggalkan uang Anda untuk itu karena Anda melihat DeepSeek pertama, atau Anda akan mengikuti strateginya, itu adalah kesalahan besar。
Dua belas hari juara, bukan 12 bulan juara; $10,000 juara, bukan $1.000.000 juara; dan ini lomba juara, bukan yang berikutnya。
Berinvestasi dalam hal ini tidak pernah menjadi jawaban sederhana. Eksperimen ini memberi kita data berharga, tetapi keterbatasan di balik data mungkin lebih bijaksana daripada data itu sendiri。
Data untuk periode pelaporan ini telah disunting oleh WolfDAO dan dapat diperbarui dalam kasus keraguan
Kontribusi: Riffi / WolfDao (X: @10xWolfdao)