なぜAIエージェントが生産性を向上しないのですか

2026/06/01 01:03
🌐ja

デザインシステムのようなこだわりをデザイン

なぜAIエージェントが生産性を向上しないのですか
原題:組織税
原作:アディ・オスマニ
ペギーによる写真

編集者:AIエージェントがアクセスしやすくなるため、ソフトウェア開発は新しいフェーズに入ります。 より多くのエージェントがアクティブにできるかどうかは問題ありませんが、人間が自分の出力を管理、判断、統合するのに十分な注意を持っているかどうか。

本記事では、「配合税」という発想が込められています。 エージェントを始める費用は非常に低く、プロンプトまたはクリックだけではありません。しかし、本当に高価なものはフォローアップです。結果が正しいかどうかを確認し、システムアーキテクチャへの影響を理解し、異なるエージェント間の競合に対処すること、そして最終的にどのコードが主要なブランチに入ることができるかを決定します。 これらの取り組みは単純な並列に減ることができませんが、彼らはまだ同じシリアルリソースに戻る必要があります: 人間の判断。

著者は、共同制作システムの最終スループットを制限するAIエージェントシステム内の「GIL」に開発者を比較します。 複数のエージェントは同時に操作できますが、アーキテクチャの判断、コードレビュー、競合の統合の段階に入る限り、開発者の ' s 脳によって再設計する必要があります。 その結果、エージェントの数が大きいほど、出力が高まり、レビューされるタスクが長ければ長いほど、開発者にとってより頻繁なコンテキスト切り替えと認知疲労が増加します。

これは、AIプログラミングツールの現在の波で簡単に見落とされるポイントです。効率性と実際の生産性は必ずしも同じではありません。 完全にスクリーニングされたAgentダッシュボードは、「高照度」の錯誤を作成します。しかし、開発者がこれらの変更を本当に理解し、見直し、統合しない場合は、システムは最終的に生産性ではなく、技術的および認知債務に蓄積する可能性があります。

そこで、ここでの実際の議論は「より多くのエージェントを使う方法」ではなく、「人々の注意の周りのワークフローを再設計する方法」ではありません。 エージェントの年齢では、重要な機能は単なる質問ではなく、タスクを割り当てるだけでなく、どのタスクがマシンに並行して残せるかを知ることではなく、タスクは人間の判断に残さなければならない。レビューが行われるべきで、それが中止され、コアの問題に再焦点を合わせなければならないとき。

人工知能は共同製作能力を拡張していますが、人間の注意は、システム内で最も希少で非信頼性のリソースです。 マシンにすべてのタスクを投げるのではなく、真に成熟したエージェントワークフローは、設計生産システムのような独自の注意構造を慎重に設計しました。

以下は元のテキストです

これからは、AIエージェントの方が簡単になりました。 しかし、より多くのエージェントが同時に実行され、変更したという意味ではありません。 認知帯域幅は同期できません。 本当にそれらを導くすべての判断, 自分の結果を判断します, 変更をマージ, 最終的に同じシリアルプロセッサを通過しなければなりません — つまり, 自分自身。

いわゆる「配合税」は、忘れた時に支払う価格です。 そして、唯一の本当の解決策は、任意のコジェネレーションシステムのようなあなた自身の注意を設計し始めることです。

私はRichard Seroter、Aja Hammerly、Ciera JaspanとGoogle I/Oのラウンドテーブルディスカッションに参加しました。 結局のところ、Richardは「デベロッパが聞いた後に取り去り変化する最も重要なことは何か?」と尋ねました

過去数か月以上経ちてきたことの1つを言います。忙しい感じは、実際の出力と同じではありません。 同時に20のエージェントを実行し、忙しさを感じることができます。 しかし、それはあなたが配信したという意味ではありません 20 エージェントの対応するワークロード。

その会話の初期に, リチャードは、この質問に名前を与えました. 彼は言った。「あなたが話していたことは、税金の設定でした。」 ヘッドに20のエージェントを管理できません

彼は絶対に正しいでした。 自己規制の問題ではなく、アーキテクチャの問題ではないので、私はこの概念をもっと完全に排除したいと思います。

私はほとんど言っていたラウンドテーブルにフレーズがありました、そしてそれはいつも私の心の中にありました: 複数のエージェントを実行しても、世界中にもう1つあります。

人々は非対称的にカウントしません

エージェントのワークフローに隠された非対称があります。

代理店を非常に安く始める。 キーボードをノックしたり、プロンプトを書くだけです。 しかし、エージェントのリングを終了するのは安くはありません。 正しく返し、他のエージェントの変更で再座標するかどうかをチェックする必要があります。

この男はあなたです。 あなただけの1を持っています。

先月、私はあなたのパラレルエージェントの上限でこの問題の一部を書きました, あなたがどの平行糸がサイレントに失敗しているかわからない環境不安の種類に焦点を当てます. 記事は、このコストの背後にある構造についてです。

エージェントをコジェネレーションシステムとして見始めると、人間は単なるシステムコンポーネントであることがわかります。 遅いシリアルコンポーネント。

片道リソースです

同時コードを書くと、それを理解するために本能を持っていた。 間違った場所でその本能を使用するために使用しただけです。

Python は GIL のグローバル通訳者ロックを持っています。 複数のスレッドを作成できますが、同時にこのロックを最初に取得する必要があるため、Python バイトを実行するスレッドが 1 つだけあります。

AIエージェントのGilです。

同時に実行できます。 しかし、その作品がシステムのアーキテクチャや統合の競合の解像度の真正な理解を必要とする限り、ロックを取らなければならない。 左のロックは1つしかありません。

Amdalの法則は、この問題は非常に正確になります:並列化に起因する加速キャップは、まだタンデムで行わなければならない作業の一部に依存します。 並列にできないものがたくさんあれば、コアに入れる量に関係なく、硬い天井で終わるでしょう。

エージェントの開発では、このシリアル部分が判断されます。

8つのエージェントが判断時間をスピードアップしません。 待ち行列だけを長持ちさせます。

これは、パフォーマンスエンジニアリングの古い事実ですが、それでも多くの人が、それが非ボトルネックを最適化し、全体的なスループットを増加させないことを驚かせています。 あなたは、ボトルネックの先に、より洗練された作業を積むだけです。

最適化するエージェントを追加すると、その部分がそれによってバインドされていないということです。 実質の制約はレビューリンクであり、システムのスループットは正確に同じ量のスループットです。

税務は、エージェントの生産能力と実際にマージできるものの間の構造的ギャップです。 片道のリソースを取得してコジェネレーションシステムを管理するときに発生します。

構造的な天井を解決しません

そして、その表で私は言った:私は私の手段でそれほど効率的を感じていないが、私は飽きたことがない。

どちらの感情も全く本物であり、同じ理由から来る。

この疲労の非常に特定のソースがあります: それは、余分な時間を与えずに、シリアルプロセッサを100%に押し続ける感です。

あなたの心から出ているエージェントを見返すたびに、コンテキストスイッチを支払います。 脳をクリアし、別の言語をスクラッチからリロードする必要があります。

CPUはマイクロ秒でこれを行うことができるので、建築家は頻繁に切り替えることを避けるように試みます。 そして、完成まで数分かかります。そして、コンテクストを完璧にすることはできません。

5つのエージェントは、ワークロード5回を倍増しません。 それは5回コールドスタートのコンテキストリロードです, そして、あなたは常にあなたが今チェックすべきエージェントについて心配しています。

「さらなる努力」で構造的制約を解決することはできません。 税金は必ず支払われます。

あなたがそれをプッシュしようとすると、それは別の形で終わるでしょう:コードは浅くなります、またはあなたは「認知降伏」の状態に入ります。あなた自身の判断の形成は、あなたが単にエージェントによって書かれたコードを受け入れることをとても退屈しています。

自分のイニシアチブに税金を払うか、暗闇の中であなたのシステムの理解をゆっくりと破壊してみましょう。

デザインシステムのようなこだわりをデザイン

そのため、あなたの注意を説得力のあるリソースとして扱う必要があります。

配布システムの設計時にボトルネックを見るつもりはありません。 まあ、あなたの脳に同じ敬意を表します。

本当に私のために働く方法は次のとおりです

エージェントチームは、UI 機能によるとアクセス機能に応じて拡張します。

優れたコジェネレーションシステムは、無限のキューの成長を避けるために、カウンター圧力機構を使用します。 生産者は、消費者の能力に合わせて減速する必要があります。

あなたのエージェント番号はプロデューサーであり、あなたの能力は消費者です。 並列エージェントの正しい番号は、コードレビューを真剣に完了できる数字の数でなければなりません。 ほとんどの人にとって、これは通常非常に少ない番号です。

AI ツールは 20 のエージェントを立ち上げるのを喜んでいますが、それだけで UI 機能です。

タスク分類へ。

リチャードがこれを処理する方法を私に尋ねたとき、私はそれを述べました。 ミッションを2つの山に分割します。

最初は比較的独立した作業で、クラウドの後ろに走るエージェントに渡すことを望んでいます。 これらのタスクは、通常、最後のゲートで1回だけ実行することができます。

2つ目は複雑なタスクで、実際の作業自体が判断されます。 奇妙なバグやアーキテクチャ設計のように。

最大の間違いは、タスクの2番目のカテゴリを並列しようとしていました。 複数の複雑なタスクを並列で処理することは、出力を拡張するだけでなく、ロックが何度も何度も何度も何度も何度も何度も何度も何度も何度も何度も繰り返して、最終的にはすべての結果が劣化します。

バッチレビュー。

あらゆるコンテクストスイッチは、多くの費用がかかります。 一度に座ってみると、もう1つ見てみるよりもずっと安く、何かをやって、寒くなり、もう1つ見ている。

Agenに長い牽引されたロープを与えます。 仕事が少し蓄積し、それをバッチとして扱いましょう。

判断のためにこのロックのみを使用してください。

自分の脳を無駄にしないでください。 エージェントは、パスするテストを書いて、スクリーンショットを生成します。

乾燥の80%が疑わしい部分であることを証明しましょう。 そのため、あなたの傷の注意は、本当に人間の判断を必要とするものの20パーセントに費やす必要があります。

シリアルタイムを保護します。

Bottlenecks は、複数の Agent チェックの残骸ではなく、最高の時間を要します。

時には、最も強力な動きは完全にシャットダウンすることです。エージェントに詰められたコンピュータをオフにするには、問題に焦点を合わせ、プロセス全体にしっかりとロックを保持します。

組織は本当に仕事ではありません。 仕事の周りのコストだけ。

Ajaは、アーキテクチャの能力が今最も緊急のスキルであることを指摘しました: あなたは、エージェントとそれのためにあまりにも大きな何であるかを知る必要があります。

システムの一部であるものを追加したい。 既知の低ボリュームの群れに注意を払っています。 システムは、あなたの基準を静かに下げることによって、その番号またはバイパスを尊重する。

繁忙期は生産的ではありません

失敗のこのパターンがあなたにほとんど見えないので、これは非常に重要です。

20代のランニングエージェントは、生産性の感覚を与えます。 ダッシュボードがいっぱいで、すべてが動く。 しかし、この感情と主要なブランチに高品質のコードの実際の統合の間にデカップリングがあります。

限界まで到達できますが、実際の出力はほとんどありません。 どちらも内部経験の面でほぼ同じです。

CieraはMargaret-Anne Storeyの債務調査を参照しています。 技術的な債務と認知債務について話しました。

構造税の支払いに失敗すると、両方のタイプの債務を蓄積することができます。

あなたは本当に読んでいなかった何かをマージしました. コードライブラリのマインドモデルは、完全に日付外です。 これらの質問は、今日のダッシュボードにはありません。 そして、生産環境が落ちるとき、彼らは現れようとしています - そして、あなたはシステムを見て、あなたは突然、それがどのように動作するかわからないことを実現しています。

そのため、実際の結論は、アジェンが能力ではないということです。 誰でも20を実行できます。

実際の機能は、クローニングできないシリアルリソースの周りにシステムを設計し、同期することができませんでした。

このリソースはフォーカスです。

生産環境に依存する重要なコンポーネントのように設計します。

[ チャック ]オリジナルリンク]

QQlink

Không có cửa hậu mã hóa, không thỏa hiệp. Một nền tảng xã hội và tài chính phi tập trung dựa trên công nghệ blockchain, trả lại quyền riêng tư và tự do cho người dùng.

© 2024 Đội ngũ R&D QQlink. Đã đăng ký Bản quyền.