Litecoin

Kode Claude 20 kali menguap oleh ruang kosong, dan resmi mengatakan, "Simpan itu."

2026/04/04 02:30
👤ODAILY
🌐ms

Claude Kode cache semua catatan Bug Bug

Kode Claude 20 kali menguap oleh ruang kosong, dan resmi mengatakan, "Simpan itu."

4-17 persen. Ini tingkat pembacaan Claude Code selama sebulan terakhir. Tingkat normalnya adalah 97-99%。

Ini berarti bahwa ketika Anda kembali ke sesi sebelumnya, Claude Code tidak kembali ke konteks yang sudah diproses sebelumnya, tetapi berurusan dengan seluruh konten dari atas setiap kali dan mengkonsumsi antara 10 dan 20 kali jumlah normal. Kau pikir kau melanjutkan percakapan, dan kau memulai yang baru setiap kali。

Sosok ini didasarkan pada pengawasan proksi oleh pengembang independen ArkNill. Dia mencatat setiap permintaan antara Claude Code dan Anthropic API dengan mendirikan agen transparan, dan menemukan setidaknya dua klien cache bug yang membuat API server tidak dapat mencocokkan awalan dialog tercache, memaksa setiap putaran untuk melakukan rekonstruksi token lengkap。

Angka di atas menunjukkan perbandingan tiga tahap tingkat pembacaan cache. Selama periode v2.1.69 hingga v.2.1.89 (yaitu seumur hidup Bug), hanya 4-17 persen dari tingkat akses cache yang tersedia untuk versi Bandalone. 22.11.90 Setelah memperbaiki salah satu tombol bug, tingkat pembacaan cache yang dimulai dingin kembali menjadi 47-99,7 per sen. Pada v2.1.91, tingkat pembacaan cache yang berjalan stabil telah kembali menjadi 97-99%。

Hal ini layak dicatatkan detail dalam grafik: kisaran v2.1.90 sangat lebar (47 hingga 99.7 per sen), karena masih perlu \"dipanaskan\" ketika percakapan kembali, dengan hits rendah di putaran sebelumnya, tetapi segera kembali ke tingkat normal. Dan dalam versi Bug, preheat ini tidak akan pernah terjadi - Pembacaan Cache Cache akan selalu ada pada 14.500 token petunjuk sistem, dan setiap riwayat percakapan akan selalu dibayar penuh。


28 hari, 20 versi

ini bukan jenis bug yang diperkenalkan dalam salah satu pembaruan dan berikutnya. menurut catatan rilis registry npm, v2.1.69 yang diperkenalkan untuk bug diterbitkan pada 4 maret, dan v2.1.90 untuk perbaikan bug diterbitkan pada 1 april. 28 hari antara 20 versi。

Garis waktu menunjukkan detail yang menarik. Saat bug diperkenalkan pada 4 Maret, pengguna tidak langsung mengajukan keluhan massa. Baru pada 23 Maret, keluhan itu pecah, dengan selang waktu hampir tiga minggu. Alasan untuk hal ini adalah bahwa, menurut GitHub terbitan #41930, dari 13 sampai 28 Maret, Antropik pergi online untuk penjualan ganda (wice off-peak time), yang secara objektif menutupi pengaruh bug. Setelah promosi selesai, konsumsi kutu tembolok kembali ke dasar pengisian biaya normal, dengan jumlah pengguna \"dievaporasi\" dalam sekejap。

Respon Antropik tidak datang cepat. Pada 26 Maret, tiga hari setelah pecahnya keluhan pengguna, insinyur Tariq Shihipar mengumumkan pada akun pribadinya X bahwa langit-langit untuk jam puncak (5am-11am PT) telah diperketat. Pada 30 Maret, Anthropic mengakui pada Reddit bahwa Øuser mencapai batas pada tingkat yang jauh lebih cepat daripada yang diharapkan" dan menyatakan bahwa telah diberikan prioritas tim tertinggi. Baru pada tanggal 1 April, anggota tim Lydia Hallie merilis temuan resmi tersebut。

Sepanjang proses tersebut, Antropika tidak menerbitkan pos blog apapun, tidak mengirim email, dan tidak memperbarui halaman status. Semua komunikasi resmi hanya dilakukan melalui pos media sosial pribadi insinyur dan sejumlah kecil komentar Reddit。


Berapa banyak yang kau bayar? Berapa lama

Terbitan gitHub #41930 menyatukan ratusan laporan pengguna. Kasus yang paling ekstrem adalah kasus pelanggan Max 20x ($200/bulan), yang jendela penggulung lima jam sepenuhnya habis dalam 19 menit. Pengguna Max 5x ($100/bulan) melaporkan 5 jam jendela akan habis dalam 90 menit. Menurut The Letter Two, sebuah "hello sederhana" digunakan untuk mengkonsumsi 13% kuota sesi. Salah satu pengguna Pro ($20/bulan) mengatakan dalam Discord bahwa kuotanya "dipakai pada hari Senin dan diganti pada hari Sabtu" dan hanya 12 hari dalam 30 hari。

Menurut uji benchmark ArkNill, pada versi bug v2.1.89, kuota 100% program Max 20x akan habis dalam waktu sekitar 70 menit. Dia juga menghitung biaya operasi resume tunggal untuk sesi konteks token 500K pada kira-kira 0,15, karena sistem akan sepenuhnya diatur ulang。


"Kau salah sangka."

Temuan Lidia Hallie mengkonfirmasi dua poin, salah satunya adalah bahwa batas waktu maksimum memang telah diperketat dan lainnya dari konteks 1 juta token dengan peningkatan konsumsi percakapan. Dia mengklaim bahwa tim memperbaiki beberapa bug, tetapi menekankan bahwa "tidak ada salah satu bug mengakibatkan biaya tambahan"。

Dia kemudian membuat empat rekomendasi:

1. Penggunaan Sonnet 4.6 daripada Opus (nilai konsumsi opus kira-kira dua kali)

memurangi penalaran atau menutup ketika penalaran in-depth tidak diperlukan

Jangan melanjutkan sesi panjang yang telah menganggur selama lebih dari satu jam dan membuka kembali sesi

BAHASA MENETAPKAN VARIABEL LINGKUNGAN CLADE CODE AUTO COMPAK WINDOW=200000 UNTUK MEMBATASI UKURAN JENDELA KONTEKS。

Tidak ada referensi yang dibuat untuk setiap bentuk penggantian kuota atau kompensasi。

AI pembawa podcast Alex Volkov menyimpulkan tanggapan sebagai "Anda memegangnya salah" dan menunjukkan bahwa Anthropic sendiri menetapkan konteks 1 juta token sebagai baku, mempromosikan Opus sebagai model flagship, dijual sebagai titik jual, dan sekarang menyarankan pihak penerima untuk tidak menggunakan fungsi ini。

None more fees" klaim juga berada dalam ketegangan dengan rekaman Claude Code yang diperbarui sendiri. Hanya satu hari sebelum Lydia mengeluarkan tanggapannya, v2.1.90 memperbaiki cache yang dikembalikan bug dari v2.1.69: ketika menggunakan --resume untuk melanjutkan sesi, permintaan yang seharusnya menekan cache memicu Cache Promp sepenuhnya meleset dengan harga penuh. Ini dikonfirmasi anomali biaya tidak disebutkan dalam tanggapan Lydia。

Sebagai kontras, Codex of OpenAI memiliki masalah konsumsi abnormal yang serupa sebelumnya. Pendekatan Vichalado OpenAI adalah untuk mengatur ulang kuota pengguna, mengeluarkan ulang nomor kredit dan mengumumkan pada bulan Maret bahwa langit-langit Codex akan dihapus. Pendekatan anthropic ' s adalah untuk merekomendasikan bahwa pengguna menurunkan model, mematikan fungsi, membatasi konteks dan atribut tanggung jawab ke pengguna ' s mode penggunaan。

Anthropic menjual langganan "Strength Model + Context Maksimum + Maksimal Kemampuan Logika" untuk antara $20 dan $200 per bulan. A 28-hari cache bug memungkinkan membayar pengguna menguap pada 10-20 kali tingkat, dan respon resmi adalah untuk menyelamatkan Anda。

บทความที่เกี่ยวข้อง

QQlink

ไม่มีแบ็คดอร์เข้ารหัสลับ ไม่มีการประนีประนอม แพลตฟอร์มโซเชียลและการเงินแบบกระจายอำนาจที่ใช้เทคโนโลยีบล็อกเชน คืนความเป็นส่วนตัวและเสรีภาพให้กับผู้ใช้

© 2024 ทีมวิจัยและพัฒนา QQlink สงวนลิขสิทธิ์