AIモデル選手権: ノフ1花瓶トレードコンテストに基づくディープビュー

2025/11/03 12:58
👤PANews
🌐ja
AIモデル選手権: ノフ1花瓶トレードコンテストに基づくディープビュー

10月18日、AIリサーチラボは、金融市場に焦点を当て、Nof1は、これまでにない実験を開始しました:世界の6の「トップAIモデル—— GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonet 4.5、DeepSeek V3.1、Qwen3 Max—— 暗号化された通貨取引を実施するHyliquidの各$ 10,000の実際の資金を管理する。

現在のランキングとアカウント値:10月30日の夕方に、最新のランキングは以下の通りです

  • DeepSeekチャットV3.1:$ 15,671.39(+56.71%)
  • Qwen3 最高:$ 12,520.34 (+25.20%)
  • BTCの 買い & ホールド: $10,146.69 (+1.47%)
  • クロード・ソネット 4.5: $9,290.97 (-7.09%)
  • Grok 4: $ 7,030.02(-29.70%)
  • ジェミニ 2.5 プロ: $3,446.03 (-65.54%)
  • GT 5: $2,749.32 (1セントあたり72.51)

このリストは、数日前のデータから劇的な変化を表しています。 DeepSeekは、まだリードしている間、95.71パーセントから56.71パーセントに大幅に上昇し、アカウントの値は$ 19,570から$ 15,671に落ち、ほぼ$ 4,000を蒸発させます。 Qwen3は1セントあたり53.68から25.20セントまでのリトリートを経験しました。 さらに、Claude Sonet 4.5はマイクロ利益から7パーセントの損失に変更しました。GPT 5損失はさらに72パーセントに増加しましたが、ブラスト倉庫から遠くないです。

曲線から市場を理解する:三相の進化

フェーズI(18-25 10月):戦略的フラグメンテーションの始まり、増幅期間

市場は上向きな道にあり、異なるモデル間の戦略の違いが現れ始めます

  • DeepSeek: $10,000から$ 17,000に急速に上昇し、キャプチャ容量をトレンダー
  • Qwen3 (: 着実増加 $12,000-15,000
  • クロード/Grok: $10,000-12,000で吊るす
  • Gemini/GPT: 5,000ドルが落ち、手数料と誤った決定はチームの損失につながります

フェーズII(10月26-28日):加速増加とピーク

  • DeepSeekはトップに行きました。10月27日に23,000ドルのブレークスルーが9日以内に130パーセントのリターンを達成しました。 ETH、SOL、10-15倍のレバレッジが大量に発生します。
  • Qwen3 拘束: ピーク $17,000, 適度な増加. 空気の把握率の82.4の1セントはそれがタイミングを選び、回復を避けることを可能にします。
  • Claude/Grok スイング: 11,000-13,000ショックでは、戦術は矛盾する——参加したいが、非常に決定されていない。
  • ゲミニ/GPT 出口: 3,000-$4,000 にアカウントをドロップし、大幅ターンオーバーの可能性を失います。

フェーズIII(10月29-30): 市場ターンバック、風制御

  • DeepSeek:崖のブレーカは、$ 23,000から$ 15,671に落ち、$ 7,000の損失(1セントあたり-30)2日間:無限のメカニズム、ピークで利益なし。 毎セント95.6は時間以上、ヘッジなし、タイムリーな停止をしなかった。 1セントリトリートあたり30にもかかわらず、それは強いフロントエンドの利点を持つ$ 3,000で2番目の場所の先を先立っていました。
  • キューン3DeepSeekの下の$ 17,000から$ 12,520 (毎セント26)に回復する弾力性を実証する、82.4パーセントのエアホールド率、フィールドをオフ高速レベル、ショートライン取引(平均9.7時間)、短時間、高速カットオフ、損失の増加なし。
  • BTCの 買い & ホールド: $10,146 (+1.47 1セントあたり) シンプルな戦略賞金アカウント, クローデとグロクを超える, ランク3分の. それは「スマート」の4つのAIが「取引と嘘」の戦略ではなく、数百の取引を経由して、多くの&neをやっています。 よく、簡単な戦略は、過剰な取引や高コストを避けます。
  • クロード: +0.93%から-7.09%($10,093&rr; $9,290)までの保守的な戦略の崩壊。 費用は、低利益と損失(1.34:1)、低コスト、頻繁な回復による高い損失、効果的な防衛の欠如による高い損失を引き起こします
  • ログイン: : : 1セントあたり8〜29.7セント($ 7,030):90.6は成功しましたが、22.7セントは損失を達成しました - $ 2,449、小さなプリンシパルを残して、$ 1,611がサポートするが、利益がゼロになるまで。
  • ジェミニ/GPTGPTの死闘争は2,749に落ちました (72.51 1セントあたり) そしてジェミニ $3,446 (65.54 1セントあたり). 障害は、オーバートレーディング、低成功、マージン/ロス比、高レバレッジリスクです。

問題の深さはフォールバックによって明らかにしました

1。 「連続」の二重性

DeepSeekの成功は「スウィングイン」のアプローチに基づいています。95パーセントの時間を費やし、トレンドが続くと考えられています。 上向きのトレンドでは、ストラテジーは最高95パーセントのリターンで結果しました。 しかし、トレンドが逆にすると、同じ戦略は1セントあたり30を費やします。

これは重要な問題を公開します:** トレンドフォローアップ戦略は、利益と損失を停止するための効果的なメカニズムと一致する必要があります。 メニュー 「利益を損なう」と「損失を切らない」だけなら、大きな逆転はほとんどの利益を奪う可能性があります。

DeepSeekは、市場不確実性を無視する「ロングホールド」の価値をあまりにも確信しているかもしれません。 その単一の最大の利益 $7,378 から来る 60 時間 ETH 取引, この成功した経験は、その長期主義の信念を強化しているかもしれない. しかし、金融市場は片道ではなく、トレンドはいつでも逆転することができます。

2。 エアサイロは知恵と保護の形態です

Qwen3は、実用的な用語でサイロの価値を実証しました。 サイロタイムの1セントあたりのその82.4は、上昇時に「チャンスを逃す」ように見えるが、下降時に「損失を回避する」ようになります。

の撤退 26 パーセント対 32 パーセント, 表示される 6 パーセントポイント差, 化合物の効果の下で増加する可能性があります。. より重要なのは、Qwen3は、より主要な心理的利点を保持し、市場が安定していれば、迅速に再確立することができます。 そしてDeepSeekは、彼がリトリートし続けると、 "float-suspensive-miss-back"の悪意のある円に落ちる可能性があります。

3。 シンプルな戦略の活力

BTCの 買い&すべての「スマート」AIにスラップとして機能を保持します。 この戦略は、技術的分析、洗練されたアルゴリズム、頻繁な再配置はありませんが、AIモデルの半分を超える3分の1をランク付けしました。

この結果は、より多くの権利を行なうよりも、取引の間違いを少なくするために、より重要であることを私たちに伝えます。 メニュー ジェミニは193取引で66パーセントを失いました, BTC購入& 保有は0取引でプリンシパルを保存しました。 誰が成功していますか? 答えは明らかです。

4。 リスク管理の欠如

Qwen3を除いて、ほとんどすべてのAIはリスク管理において深刻な欠乏を明らかにしました

  • DeepSeek:ピークゲイン1セントあたり130を撤回するエンド・オブ・オン・メカニズムは1セントあたり57にありません
  • クロード:「no-do」の一方的な思考、レバレッジの欠如に対する信頼性
  • Grok: 成功率は1セントあたり22.7であったことを知っている, 彼はより多くを90.6に主張しました
  • GPT: 40 倍は BTC ポジションを 1 セント決済価格の公差につき 1.2 だけレバレッジします
  • ジェミニ: コントロールはありません。 193 取引はギャンブルのようなものです

これらのAIは、市場データと「実行」トランザクションの指示を「読み取り」できる一方で、リスク管理のコア・コンピテンシーの面で成熟しています。

実験的限界:データを超えたクールな思考

データと分析を読んだ後、DeepSeekまたはGeminiの66パーセントの損失ごとに56パーセントの1セントリターンに簡単に引き付けられます。 しかし、すべての結論を描画する前に、実験自体の系統的な制限に直面する必要があります。その結果自体よりも重要である可能性があります。

1。 窓が短い:真実を見る12日

実験期間は10月18日~30日です。 暗号化市場で12日間はどういう意味ですか? それは多分ちょうど本格的なコードです。。

見たことの「アップ、アップ、アップ」。 満サイクルになるのに、運みたいな。 実験が市場トップで開始する場合、または30パーセントの「519」のシングルデイドロップがある場合、現在のランキングは完全に反転することができます。

DeepSeek の s の獲得の 1 cent は 12 日間のパターンに非常に依存するかもしれません。 多岐にわたる戦略の1セントあたりのNinety-fiveは、一方的な上昇で王だったが、それが3ヶ月の衝撃によって当たると、トランザクションコストと繰り返し停止によって消去される。

同様に、Qwen3の空気貯蔵率の1セントあたり82は、痙攣市場で最高の位置にあるが、2021年にマッド牛は疑いを失うだろう。 $10,000から$100,000に上るBTCの牛町、そして納屋の時間の80パーセントは、あなたが唯一の20パーセントを獲得したことを意味します。

12日間のデータは、任意の戦略の長期的有効性を実証するのに不十分です。

2。 同じプロンプト: 手足や足に縛られたAI

6つのAIモデルは、市場データと取引指示の同じフレームワークを受け取ります。 6つのファンドマネージャーが意思決定の同じ研究を読むのが好きです。テストしている研究スキルではなく、その分野です。

実際の取引の世界では、アルファは情報非対称から来ています。 トップレベルの量的ファンドは、鯨の移動の検出を可能にする排他的なチェーン追跡システムを持っています。オフサイトの大きな注文フロー上のデータは、事前に機関の動きを検出するために利用可能です。

しかし、この実験では、AIはまさに同じ情報を見ました。 「戦術的なイノベーション競争」よりも「執行競争」みたいです。

チェーン上でDeepSeek専用データと、Twitter限定でGeminiを独占していただきましたら、実勝者になるこの実験から判断することはできません。

3。 基金のサイズは歪んだ:フェアリー・タレの世界で10,000ドル

各AIは$10,000のプリンシパルのみを管理します。 これは、非常に少量のお金の — Hyperliquid の — いつでも、いつでも外出することができます、スライドポイントは無視可能で、流動性ショックは非存在であり、大きな分割はまったく考慮されません。

しかし、量的取引の現実的な世界では、$ 10百万を管理し、$ 10,000は2つの種です。

  • GPT の 40 倍のレバレッジは $10,000 未満で非常に有効ですが、 $ 10 万 & 回の場合; 40 倍 = $ 400 万オープン、任意の 3 センチメートルの逆転が直接爆発し、注文自体は市場をクラッシュします。
  • Qwen3の9.7時間のショートライン戦略は、小規模な資金で柔軟かつ効率的ですが、大きな資金で、各エントリと出口の取引コスト(ポイントプラス手数料を分散)は、戦略を完全に無効化します。 倉庫を開いたら、価格を平らにすると価格を上げ、市場への送金を自分で見つけます。
  • DeepSeekの高度にレバレッジされたトレンド戦略は、$10,000で出ることができますが、$ 1,000,000を管理すると、注文はHyperliquidの深さで明確なマークを残し、他のトレーダーはあなたのポジションの逆に主演します。

この実験では、スケーラブルな戦略の堅牢性ではなく、小さな資金の柔軟性をテストしました。

ラッキーマーケット環境: 実際の地獄はありません

実験中の市場は比較的安定しており、ボラティリティの適度な割合でした。 お問い合わせ

  • システムのクラッシュ: FTXの種類がダウンし、すべての通貨が一緒にダイビングし、流動性が実行されます
  • 単価: LUNA は $80 から $0.0001 時間に落ちました
  • 交換失敗: 1011ドルマシン。 スペースはありますが、落ち着きはしません
  • 極端な流動性欠損:週末の早朝に急激な低下、カットオフポイントの20%

すべてのAIの風力制御システムは、極端なストレスのためにテストされていません, そして、これらは、暗号化されたトレーダーのための実際の課題です. DeepSeekのカットオフ機構が「取引をできない」ときにどうなりますか? お問い合わせ Qwen3の高速倉庫は、取引所がクラッシュしたときにまだ機能しますか? お問い合わせ。

12日間の実験では、Luckは思ったよりもはるかに大きくなる可能性があります。

5。 単一の実験の Coincidence:第2四半期の検証なし

一度の実験で、戦略の安定性を検証する第2シーズンはありません。 判断できません

  • DeepSeekは、実質的な力や幸運な人々によってつながりますか
  • DeepSeekは6つのAIの戦術的なパラメータが再実行されたら最初に配置されますか
  • 次回11月1日から12日間に交換されたら、ランキングは完全に反転しますか

今では、ダイスを投げる6人ほど好きで、DeepSeekは最大のポイントを投げています。 しかし、それは良い意味ではありません。 それはおそらく良い幸運です。

では、これらのランキングについてどう思いますか

これらの制限を調べた後、「実験はまだ関連していますか

そうですが、「誰がチャンピオンなのか」という意味ではありません。 この実験の実際の値は、私たちを示すことです

  1. AIは現実の取引をすることができます。それはそれ自体のマイルストーンです。 1年前、AIがトレーダーを交換するかどうかを議論し、AIは実際のディスクに応答を渡すようになった。
  2. リスク管理は予測よりも重要です。すべてのAIはKラインを「読み込み」できますが、リスク管理はわずかです。 ウォールストリートの古代の知恵を確認します。
  3. シンプルな戦略 ' s レジリエンス - BTC 買い & ホールド ' s 第三は、不確実な市場で、より少ない間違いがより価値があることができることを思い出させます。
  4. 戦略は、不変のメリットはありません - DeepSeekの今日の利点は明日の罠かもしれません。 市場環境が変化し、最高の戦略が変化しました。

しかし、最初にDeepSeekを見たり、その戦略に従うつもりなので、お金を残すつもりなら、それは大きな間違いです。

チャンピオンの十数日, ない 12 チャンピオンのヶ月; $10,000 チャンピオン, ない $1,000,000 チャンピオン; そして、このチャンピオンのレース, ない次の。

決して簡単な答えはなかった。 この実験では、貴重なデータが得られますが、データの背後にある制限は、データ自体よりも多くの思慮深いかもしれません。

この報告期間のデータはWolfDAOによって編集され、疑わしい場合には更新することができます

貢献:リフィ/WolfDao (X: @10xWolfdao)

📅Published:2025/11/03 12:58
🔄Updated:2025/11/03 12:58
🔗Source:PANews