為什麼更多人工智能代理不等于高產率

2026/06/01 01:07
🌐zh-Hant

把注意力設計成一個設計系統

為什麼更多人工智能代理不等于高產率
原件:
原件:艾迪·奧斯曼尼
照片來自Peggy

編輯器:由于AI Agent更便宜, 問題不再是能否啟動更多特工 而是人類是否有足够的注意力去管理 審判和整合他們的輸出。

這篇文章提出了令人振奋的概念, 啟動代理的成本非常低, 且只有提示或點擊; 但真正的貴處是追蹤: 檢查結果是否正確, 了解它對系統架构的影響, 處理不同代理之間的衝突, 但他們仍得回到相同的串行資源:人性的判斷。

作者將開發者比作AI Agent系統中的"GIL",即限制合製系統最终吞吐量的單向鎖. 多重代理可以同步運作,但只要他們進入架构判斷,代码審查和衝突整合的舞台,他們必須被開發者的大腦重塑. 因此,代理商的數量越大,輸出越多,被審查的工作越長,上下文切換和發展者认知疲劳的频率越高。

這也是目前AI編程工具潮流中容易忽略的點:效率和真正的生产力并不总是一樣的. 但若開發者不真正理解、審查及整合這些變化。

所以真正的討論不是"如何使用更多的特工" 而是"如何重塑人們的注意力範圍的工作流程" 在特工時代, 關鍵能力不只是問問, 分配工作, 而是知道哪些任務可以平行地留給機器。

但人權關注仍是系統中最稀少且不可复制的資源。 真正成熟的Agent工作流程 而不是把所有的任務都扔給機器 精心設計了自己的注意结构 像一個設計的製作系統。

原文如下:

現在,啟動更多的AI特工已經變得容易了。 但更多特工同时在跑 也不代表你變了 你的认知帶寬不能同步 所有真正引導他們的判斷, 判斷結果。

所謂的"造型稅" 基本上就是當你忘記它時付出的代价 唯一真正的解決辦法 就是開始設計你自己的注意力 像任何熱力發電系統一樣。

我與理查德·塞羅特(Richard Seroter), 阿賈·哈默利(Aja Hammerly), 西拉·賈斯潘(Ciera Jaspan)討論軟體目前如何運作, 最後理查德問我們 "在開發商聽到之後 拿走和改變最重要的東西是什么?"

過去幾個月來, 你可以同时經營20名特工 覺得很忙 但這不代表你已經完成了20個特工的相应工作量。

理查在之前的談話中給了這個問題一個名字 他說:「你們所說的是定稅。」 你腦子裡不能有20名特工

他說得對 我想把這個概念更完整地分開 因為這不是自律 而是建築。

我在那個圓桌裡幾乎說了一句 我總是在想: 經營多個特工不代表你還有一個。

人不算不对称

探員的工作流程中有隱瞞的不对称。

找個便宜的特工 你只需要敲鍵盤或者寫個提示 但完成特工的戒指不便宜 必須檢查它是否傳回正確, 並重新协调它與其他代理變更 。

這人就是你 你只有一個。

上個月,我在你的平行代理上限上寫了這一篇文章, 專注於環境的焦慮, 這篇文章是關於這個成本背后的結構。

當你開始把Agent看成一個熱力發電系統時 你發現人類只是系統的一部分 慢序元件。

你是單向資源

如果你寫了同時代碼 你就有本能理解它 只是你以前在錯地方用那本能。

Python 有一個全域解譯器鎖, 這是 GIL 。 您可以建立任何多串線, 但同時只有一串線要執行 Python 字節, 因為它們必須先得到這個鎖 。

你是你的人工智能特工的吉爾。

他們可以一起跑 但只要他們的工作需要真正了解系統的結構, 你只剩一個鎖了。

Amdal 定律使此事非常精确: 平行化所產生的加速度上限, 如果有很多事情你不能平行地做 不管把多少投入到核心裡 你都會被硬天花板撞死。

在Agent的發展中,這個系列部分是判斷性的。

第8個開始 特工不會加快你的判斷時間 它只會讓排隊等待你更久。

但許多人仍感到驚訝的是, 它能优化非瓶颈, 你只是堆起更多未完成的工作 之前的瓶颈。

添加代理來优化 是不受它约束的部分 。 真正的制约因素是審查連結,系統的吞吐量完全相同。

稅金是代理產能與你實際上的合併之間的结构性差距 當你得到一個單向資源 管理一個熱力發電系統時就會發生。

它不能解開結構天花板

我 在 桌子 上 說 、 我 從未 有 過 如此 有效率 的 生活 、 卻沒 有 如此 疲倦。

兩種感覺都是真實的 都來自同一原因。

這種疲勞的來源很特別: 一种感覺是繼續按下序列處理器到100%,而不給任何额外的時間。

每次你回頭看一個你瘋了的特工 你就得付上下文開關的錢 你必須清除腦袋 重新裝填另一個語言。

CPU可以在微秒內完成, 即使如此建筑師會試著避免频繁的切換 。 需要幾分鐘才能完成 你永遠也無法完善背景。

5 特工不比工作量多5倍。 這是一次5次的冷啟動上下文重載 加上在后台繼續的腦子進展 你總是擔心你現在該檢查哪個特工。

你無法用"更多努力"來解決结构性限制 這稅總是付的。

如果你試圖推動它,它會以另一种形式結束:要么密碼變浅,要么你進入"認知投降"的狀態——因為你自己的判斷的形成是如此的乏味,以至于你只接受特工寫下的密碼。

要麼你主动交稅 要麼讓它慢慢毀了 你對黑暗中的系統的理解。

把注意力設計成一個設計系統

所以,你必須把注意力當做 串通的稀缺資源。

當你設計一個分布式系統時, 好吧,也尊重你的大腦。

以下是一些對我真正有效的方法:

根據存取能力 而不是UI能力 擴展特工團隊。

良好的熱力發電系統使用反壓机制避免無止境的排隊增長. 制片人需要放慢速度,以配合消費能力。

你的代理號碼是制片人 你的能力是消費者 平行代理的正确數量 應該是您能完成密碼檢查的數量 對大多數人來說 這通常數量非常低。

AI工具肯定會很高興讓你開始20個特工 但這只是UI的功能 而不是說你真的有管理他們的能力。

工作分類。

當理查問我該怎麼處理的時候 我提到過 我會把任務分成兩堆。

第一個是相當獨立的工作 我愿意把它交給代理商 經營在云端 這些工作可以有不同方式, 通常只在最後一個門口做一次 。

其二是複雜的工作,而真正的工作本身就是判斷. 像是怪蟲 或是建筑設計。

最大的錯誤是試圖與第二類工作平行。 同時處理多項複雜的任務不會擴大您的輸出量, 只能讓鎖被一次又一次地爭取。

批評。

每一個上下文開關都會花很多錢 總比看一眼、做別的事、開始冷淡、觀察另一件事便宜得多。

給阿根更長的拖繩 讓工作稍稍堆積,然後把它當成批量。

只用這個鎖來判斷。

不要把大腦浪费在機器能證明的東西上 讓特工寫下通過的測試 或者產生截圖。

讓他們證明自己 80%的干但可核查的部分 所以,你很少的注意力 只是需要花在20%的 真正需要人類判斷。

保護你的序列時間。

Bottlenecks花你最好的時間, 而不是剩下的碎片 之間的代理檢查。

有時候,最強的行動是完全關閉它:關閉裝滿特工的電腦,專注於一個問題,並牢牢地把鎖鎖關在整個过程中。

組織不是真正的工作。 這只是工作費用。

Aja指出建築能力是目前最緊急的技術: 你需要知道什么是對的,什么是對它太大的。

我要补充的是 你是系統的一部分 你注意的是 已知的,低量的群。 系統要么尊重這個數字 要么悄悄地降低你的標準。

忙碌不代表有生产力

這很重要 因為這種失敗模式 你幾乎看不到。

20名執行特工會給你增強力感 儀表板滿了,一切都在動 但這種感覺和將高品質的代碼實際整合到主要分支之間,是有分解的。

你可以達到极限 但實際輸出很少 在內部經驗方面。

Ciera提到瑪格麗特·安妮·斯托利的債務研究 我們談到了技術債務 和认知債務。

不付有條理的稅 會讓你累积兩種債務。

你合并了一些你沒讀過的東西 你對密碼庫的心理模型已經完全过时了 今天這些問題不會在儀表盤上 當生产環境破裂時,它們會出現, 然後你看著系統,突然發現你不知道它是如何運作的。

所以,真正的結論是,開始Agen不是能力。 任何人都可以跑20。

真正的能力是围绕着一個不能克隆和不能同步的串行資源來設計系統。

這是你的焦點。

設計它像任何關鍵的元件 依赖于生产環境。

[ 笑 ]原始链接]

QQlink

Tidak ada "backdoor" kripto, tidak ada kompromi. Platform sosial dan keuangan terdesentralisasi berdasarkan teknologi blockchain, mengembalikan privasi dan kebebasan kepada pengguna.

© 2024 Tim R&D QQlink. Hak Cipta Dilindungi Undang-Undang.