ทําไม เอไอ เอเจ้นท์ ไม่เท่ากับผลผลิตที่สูงกว่า

2026/06/01 01:06
🌐th

ออกแบบความสนใจของคุณเหมือนระบบการออกแบบ

ทําไม เอไอ เอเจ้นท์ ไม่เท่ากับผลผลิตที่สูงกว่า
ชื่อ: ภาษี ของ องค์การ
ต้นฉบับโดย:แอดดี ออสมานี
รูปของเพ็กกี้

บรรณาธิการ: เมื่อ AI ตัวแทนถูกกว่าและง่ายต่อการเข้าถึง การพัฒนาซอฟต์แวร์กําลังเข้าสู่ขั้นตอนใหม่: คําถามคือไม่อีกต่อไปว่า จะสามารถเปิดใช้งานตัวแทนมากขึ้นหรือไม่ แต่มนุษย์มีความสนใจเพียงพอ。

บทความ นี้ เสนอ แนว คิด ที่ ก่อ แรง บันดาล ใจ — “การ เสีย ภาษี. ” ค่าใช้จ่ายในการเริ่มต้นของเจ้าหน้าที่มีน้อยมาก และมีเพียงการกระตุ้นหรือคลิกเท่านั้น แต่ที่แพงจริงๆคือ การติดตามผลที่ตามมา: การตรวจสอบว่าผลถูกต้องหรือไม่ เข้าใจผลกระทบที่มีต่อสถาปัตยกรรมของระบบ ความพยายามเหล่านี้ไม่สามารถลดให้เหลือความเหลื่อมล้ําธรรมดาได้ แต่พวกเขายังคงต้องกลับไปที่ทรัพยากรต่อเนื่องเดิม。

ผู้เขียนเปรียบเทียบนักพัฒนากับ "GIL" ในระบบเอไอ เอเจ้นท์ล็อคทางเดียวที่จํากัดการประมวลผลสุดท้ายของระบบผลิตรวม เจ้าหน้าที่หลายคนสามารถดําเนินงานพร้อมกันได้ แต่ตราบใดที่พวกเขาเข้าสู่ขั้นตอนของการตัดสินสถาปัตยกรรม โค้ดรีวิว และการรวมความขัดแย้ง ผล ก็ คือ ยิ่ง มี ตัว แทน มาก เท่า ไร ก็ ยิ่ง มี ผล งาน มาก เท่า นั้น ยิ่ง มี การ ทบทวน งาน ที่ ต้อง ทํา นาน ขึ้น เท่า นั้น ท้อง เรื่อง ก็ ยิ่ง เปลี่ยน ไป และ ความ เหนื่อย ล้า ทาง การ แพทย์ มาก ขึ้น เท่า นั้น。

นี่ยังเป็นจุดที่ถูกมองข้ามได้ง่ายๆ ในเครื่องมือโปรแกรมเอไอในปัจจุบัน: ประสิทธิภาพและผลผลิตที่แท้จริง แต่หากนักพัฒนาไม่เข้าใจจริงๆ ทบทวนและรวมการเปลี่ยนแปลงเหล่านี้。

ดังนั้น การสนทนาที่แท้จริงตรงนี้ ไม่ใช่ "วิธีการใช้เจ้าหน้าที่มากขึ้น" แต่เป็น "วิธีการออกแบบงานใหม่ ในยุคของตัวแทนความสามารถที่สําคัญไม่ได้เป็นเพียงการถามคําถาม, การมอบหมายงาน แต่รู้ว่างานใดสามารถที่เหลือให้กับเครื่องจักรในคู่ขนานและที่งานจะต้องเหลือให้กับการตัดสินของมนุษย์; เมื่อ ควรทําการทบทวนและเมื่อไหร่ควรจะยุติการทํางานและกลับมามุ่งเน้นไปยังประเด็นหลัก。

AI กําลังขยายความสามารถในการผลิตร่วมกัน แต่ความสนใจของมนุษย์ยังคงเป็นทรัพยากรที่หายากที่สุด และไม่สามารถแก้ไขได้ในระบบ แทน ที่ จะ โยน งาน ทุก อย่าง ของ มัน ไป ให้ เครื่องจักร ออก แบบ โครง สร้าง ความ สนใจ ของ ตน เอง อย่าง รอบคอบ เช่น ระบบ การ ออก แบบ。

ต่อ ไป นี้ เป็น ข้อ ความ เดิม:

ตอนนี้ การเริ่มต้นของเอไอกลายเป็นเรื่องง่าย แต่เจ้าหน้าที่กําลังวิ่งพร้อมกัน ซึ่งไม่ได้หมายความว่าคุณเปลี่ยนไป วงจรการรับรู้ของคุณไม่สามารถประสานกันได้ การตัดสินใจทั้งหมดที่นําพวกเขาจริงๆ ตัดสินผลลัพธ์ของพวกเขา รวมการเปลี่ยนแปลงของพวกเขา ท้ายที่สุดก็ต้องผ่าน。

สิ่งที่เรียกว่า "ภาษีอุปทาน" ก็คือ ราคาที่คุณต้องจ่ายเมื่อคุณลืมมันไป และทางออกที่แท้จริงเพียงอย่างเดียวก็คือ การเริ่มออกแบบความสนใจของคุณเอง เหมือนระบบโคเมชันใดๆ。

ผมมีส่วนร่วมในการอภิปรายรอบตารางใน Google I/O กับริชาร์ด Seroter, Aja Hammerly, Cira Jazpan เกี่ยวกับวิธีการที่ซอฟต์แวร์ทํางานในขณะนี้และวิธีการที่มันอาจจะพัฒนา ในตอนจบ ริชาร์ดถามเราว่า "อะไรสําคัญที่สุดที่จะพรากและเปลี่ยนแปลง หลังจากนักพัฒนาได้ยิน?"

ผมพูดถึงสิ่งหนึ่งที่เกิดขึ้นตลอด 2-3 เดือนที่ผ่านมา ความรู้สึกยุ่งๆ ไม่เคยเหมือนกับการมีผลลัพธ์ที่แท้จริง คุณสามารถดําเนินการ 20 ตัวแทนในเวลาเดียวกันและรู้สึกไม่ว่าง แต่นั่นไม่ได้หมายความว่า คุณส่งงานให้เจ้าหน้าที่ 20 คน。

ก่อน หน้า นั้น ใน การ สนทนา นั้น ริ ชาร์ด ให้ ชื่อ คํา ถาม นี้. พระองค์ตรัสว่า “ดังนั้น แท้จริงเจ้าอยู่ในหมู่ผู้ถูกนับว่าอ่อนแอ” คุณจัดการเจ้าหน้าที่ 20 คนในหัวคุณไม่ได้

เขาพูดถูกที่สุด ผมอยากจะให้แนวคิดนี้ แตกแยกออกไปอย่างสิ้นเชิง เพราะมันไม่ใช่การจําลองตัวเอง แต่เป็นสถาปัตยกรรม。

มีวลีอยู่ในโต๊ะกลมที่ผมเกือบจะพูด และอยู่ในใจผมเสมอ: การใช้เจ้าหน้าที่หลาย ๆ คน ไม่ได้หมายความว่าจะมีคุณอีกคนหนึ่งในโลก。

คนเราไม่นับความไม่สมมาตร

มีการปกปิดความไม่สมมาตร ในงานของเจ้าหน้าที่。

เริ่มให้เจ้าหน้าที่ถูกๆ คุณแค่ต้องเคาะคีย์บอร์ด หรือเขียนทันที แต่มันไม่ถูกนะ ถ้าจะทําให้แหวนเจ้าหน้าที่เสร็จ ต้องตรวจสอบว่าการคืนค่าถูกต้องหรือไม่ และทําการแก้ไขตําแหน่งเดิมกับการเปลี่ยนแปลงตัวแทนอื่น ๆ。

ผู้ชายคนนี้คือคุณ และคุณมีแค่อันเดียว。

เดือนที่แล้ว ผมเขียนส่วนหนึ่งของประเด็นนี้ ในระดับความสามารถของคุณ อัพเปอร์ จํากัด มุ่งเน้นไปที่ความวิตกกังวลด้านสิ่งแวดล้อม บทความ นี้ กล่าว ถึง โครง สร้าง ที่ อยู่ เบื้อง หลัง ค่า ใช้ จ่าย นี้。

และเมื่อคุณเริ่มมองตัวแทนเป็นระบบโคเลจ คุณจะตระหนักว่า มนุษย์เป็นแค่ส่วนประกอบของระบบ องค์ประกอบต่อเนื่องที่ช้า。

คุณคือแหล่งข่าวทางเดียว

ถ้าคุณได้เขียนรหัสพร้อมกัน คุณมีสัญชาตญาณที่จะเข้าใจมัน มันก็แค่คุณเคยใช้สัญชาตญาณนั้น ผิดที่。

Python มีล็อคล่ามระดับโลก ซึ่งก็คือ GIL คุณสามารถสร้างเธรดใด ๆ มากมาย แต่ในเวลาเดียวกัน มีเพียงเธรดเดียวที่จะประมวลผล Python โดยเนื่องจากพวกเขาจะต้องได้รับล็อคนี้เป็นครั้งแรก。

คุณคือ เอไอ เอเจ้นท์กิล。

พวกมันวิ่งพร้อมกันหมด แต่ ตราบ ใด ที่ งาน ของ พวก เขา เรียก ร้อง ความ เข้าใจ อย่าง แท้ จริง เกี่ยว กับ สถาปัตยกรรม ของ ระบบ นี้ หรือ มติ เกี่ยว กับ ความ ขัด แย้ง ที่ เพิ่ม ขึ้น ก็ ต้อง ยึด กุญแจ นั้น. และคุณเหลือกุญแจแค่ดอกเดียว。

กฎของอัมดัลทําให้เรื่องนี้แม่นยํามาก หมวกความเร่งที่เป็นผลมาจากความคล้ายคลึงกัน ขึ้นอยู่กับส่วนของงาน ถ้ามีหลายสิ่งที่คุณไม่สามารถทําในคู่ขนาน ไม่ว่าคุณจะใส่เท่าใดในแกน。

ในการพัฒนาของเจ้าหน้าที่ ส่วนนี้ต่อเนื่องเป็นการตัดสิน。

เริ่ม 8 เจ้าหน้าที่ ไม่ได้เร่งเวลาตัดสินของคุณ มันจะทําให้คิวรอคุณนานกว่านี้。

นี่คือข้อเท็จจริงเก่าในวิศวกรรมการแสดง แต่หลายคนยังคงประหลาดใจ ว่ามันช่วยเพิ่มความเหมาะสม คุณเพียงแค่กองขึ้นงานที่ยังไม่เสร็จมากขึ้นก่อนของคอขวด。

การเพิ่มเอเจ้นท์เพื่อความเหมาะสม คือส่วนที่ไม่ได้ผูกพันกับมัน เงื่อนไขที่แท้จริงคือลิงก์การทบทวน และผ่านระบบ มีปริมาณเท่ากับการใส่ผ่าน。

ภาษีเป็นช่องว่างของโครงสร้าง ระหว่างความสามารถของเจ้าหน้าที่ กับสิ่งที่คุณสามารถรวมได้ มันเกิดขึ้นเมื่อคุณได้ทรัพยากรเพียงทางเดียว เพื่อจัดการระบบโคเมชัน。

มันจะไม่แก้ปัญหาเพดานโครงสร้าง

และบนโต๊ะนั้น ผมพูดว่า ผมไม่เคยรู้สึกมีประสิทธิภาพขนาดนี้มาก่อน แต่ผมไม่เคยเหนื่อยขนาดนี้มาก่อน。

ทั้งความรู้สึกที่แท้จริงและมันมาจากเหตุผลเดียวกัน。

มีแหล่งที่แน่นอนของความเหนื่อยล้านี้ คือความรู้สึกที่จะกดตัวประมวลผลต่อเนื่องถึง 100% โดยไม่ให้เวลาเพิ่ม。

ทุกครั้งที่คุณมองย้อนกลับไป ที่เจ้าหน้าที่ที่เสียสติของคุณ คุณต้องจ่ายสําหรับการเปลี่ยนบริบท คุณต้องล้างสมองคุณออก และเปลี่ยนภาษาจากรอยขีดข่วน。

CPU สามารถทําสิ่งนี้ได้ในไมโครวินาที แม้ว่าสถาปนิกจะพยายามที่จะหลีกเลี่ยงการสลับที่บ่อย ๆ และจะใช้เวลา 2-3 นาทีกว่าจะเสร็จ และคุณจะไม่สามารถทําให้บริบทสมบูรณ์ได้。

เจ้าหน้าที่ 5 คนไม่ทํางานหนักถึง 2 เท่า มันเป็นบริบทที่เริ่มเย็น 5 สมัย และยังมีกระบวนการสมองที่ต่อเนื่องหลังเวที。

คุณไม่สามารถแก้ไขข้อจํากัดของโครงสร้าง ด้วย "ความพยายามมากขึ้น" ภาษีนี้ต้องจ่ายเสมอ。

ถ้าคุณพยายามผลักดันมัน มันจะลงเอยในรูปแบบอื่น ไม่ว่าจะเป็นรหัสที่ตื้นลง หรือคุณเข้าสู่สถานะ "ยอมแพ้โดยระบบการรับรู้"。

ไม่ว่าคุณจะจ่ายภาษีด้วยตัวเอง หรือปล่อยให้มันทําลายความเข้าใจของคุณ ในความมืดอย่างช้าๆ。

ออกแบบความสนใจของคุณเหมือนระบบการออกแบบ

ดังนั้น คุณต้องปฏิบัติกับความสนใจของคุณ เป็นทรัพยากรที่หายากของการฆ่า。

คุณจะไม่มองไปที่คอขวด เมื่อคุณออกแบบระบบการกระจาย งั้น เคารพสมองของคุณแบบเดียวกัน。

นี่คือวิธีการบางอย่าง ที่ได้ผลสําหรับผม

ขยายทีมเอเจ้นท์ตามความสามารถที่เข้าถึงไม่ได้ตามความสามารถของ UI。

ระบบโคเลตที่ดี ใช้กลไกการกดทับเพื่อหลีกเลี่ยงการขยายคิวไม่มีที่สิ้นสุด ผู้ ผลิต ต้อง ช้า ลง เพื่อ จะ มี ความ สามารถ เหมาะ กับ ผู้ บริโภค。

ตัวแทนของคุณเป็นโปรดิวเซอร์ ความสามารถของคุณเป็นผู้บริโภค จํานวนตัวแทนคู่ที่ถูกต้อง ควรเป็นจํานวนตัวเลขที่คุณ สามารถอ่านโค้ดได้สมบูรณ์ สําหรับคนส่วนใหญ่แล้ว นี่มักเป็นตัวเลขที่ต่ํามาก。

เครื่องมือ AI คงยินดีที่ทําให้คุณเริ่มใช้เจ้าหน้าที่ 20 คนแน่ๆ แต่มันเป็นแค่ฟังก์ชันของ UI ไม่ได้บอกว่า คุณมีความสามารถในการจัดการ。

เพื่อแบ่งประเภทงาน。

ตอนที่ริชาร์ดถามผมว่าจะจัดการยังไง ผมพูดถึงเรื่องนั้น ฉันจะแบ่งภารกิจออกเป็นสองกอง。

งานชิ้นแรกเป็นงานที่อิสระจากกัน และผมเต็มใจมอบมันให้เจ้าหน้าที่ ซึ่งวิ่งอยู่ด้านหลังของเมฆ งาน เหล่า นี้ สามารถ ดําเนิน ไป ได้ ต่าง กัน ตาม ปกติ จะ ทํา ได้ เพียง ครั้ง เดียว ที่ ประตู สุด。

งาน ที่ สอง เป็น งาน ที่ ซับ ซ้อน และ งาน จริง ๆ ก็ คือ การ ตัดสิน. เหมือนแมลงแปลกๆ หรือการออกแบบสถาปัตยกรรม。

ข้อ ผิด พลาด ใหญ่ ที่ สุด คือ พยายาม ทํา ให้ งาน ประเภท ที่ สอง เทียบ เท่า. การจัดการกับงานที่ซับซ้อนหลายงาน ในคู่ขนานจะไม่ขยายผลลัพธ์ของคุณ แต่จะช่วยให้ล็อคเท่านั้น ที่จะต่อสู้ซ้ําแล้วซ้ําอีก และสุดท้ายทุกผลลัพธ์จะเสื่อมโทรม。

การทบทวนชุด。

การสลับบริบททุกครั้ง ค่าใช้จ่ายมาก ผลของการนั่งลงครั้งเดียว และสําหรับทั้งหมด ถูกกว่ามากที่มองหนึ่ง ทําอะไรบางอย่าง。

ให้ Agen เชือกลากยาวขึ้น ให้ งาน สะสม เล็ก ๆ น้อย ๆ แล้ว ก็ ทํา งาน เป็น ชิ้น ๆ。

ใช้กุญแจนี่ตัดสินเท่านั้น。

อย่าเสียสมองไปกับบางสิ่งที่เครื่องจักรสามารถพิสูจน์ได้เอง ให้เจ้าหน้าที่เขียนข้อสอบที่ผ่าน หรือสร้างหน้าจอ。

ให้พวกเขาพิสูจน์ตัวเองว่า 80% ของส่วนที่แห้ง แต่วัดได้ ดังนั้น ความสนใจที่หายากของคุณ จําเป็นต้องถูกใช้ในอัตราร้อยละ 20 ของสิ่งที่ต้องการจริงๆ。

ปกป้องเวลาต่อเนื่องของคุณ。

พวกคออ่อนใช้เวลาอย่างดีที่สุด ไม่ใช่เศษซากที่เหลือระหว่างการตรวจสอบ。

บางครั้ง การเคลื่อนย้ายที่มีประสิทธิภาพมากที่สุดคือการปิดมันลงอย่างสมบูรณ์ คือ การปิดคอมพิวเตอร์ที่ถูกยัดเข้ากับเจ้าหน้าที่。

องค์กรไม่ใช่งานจริงๆ มันก็แค่ค่าใช้จ่ายในที่ทํางาน。

Aja ชี้ให้เห็นว่า ความจุทางสถาปัตยกรรมนี้ เป็นทักษะที่เร่งด่วนที่สุด คุณต้องรู้ว่า อะไรถูกต้องสําหรับเจ้าหน้าที่。

ผมอยากเพิ่มว่าคุณเป็นส่วนหนึ่งของระบบ คุณกําลังให้ความสนใจที่รู้จักกัน ปริมาตรต่ําของฝูง ระบบ นี้ ไม่ นับถือ หมาย เลข นั้น หรือ จะ ข้าม ระบบ นั้น ไป โดย การ ลด มาตรฐาน ลง อย่าง เงียบ ๆ。

การยุ่ง ไม่ได้หมายความว่า จะมีประสิทธิภาพ

นี่สําคัญมาก เพราะรูปแบบของความล้มเหลวนี้ แทบจะมองไม่เห็นสําหรับคุณ。

เจ้าหน้าที่ 20 คนจะให้ความรู้สึกถึงผลผลิต หน้าปัดเต็มแล้ว ทุกอย่างกําลังเคลื่อนไหว แต่มีการสลายตัวระหว่างความรู้สึกนี้ กับการรวมกันของรหัสที่มีคุณภาพสูง。

คุณสามารถไปถึงลิมิต, แต่มันมีผลออกมาน้อยมาก ทั้งคู่เกือบจะเหมือนกันในแง่ของประสบการณ์ภายใน。

ซีร่าหมายถึง การศึกษาหนี้สินของมาร์กาเร็ต-แอนน์ สโตรี่ เราพูดถึงหนี้ทางเทคนิคและ หนี้ทางความคิด。

การ ไม่ จ่าย ภาษี ที่ มี วินัย จะ ทํา ให้ คุณ มี หนี้ สิน ทั้ง สอง ชนิด。

คุณรวมสิ่งที่คุณไม่ได้อ่านจริงๆ แบบจําลองจิตใจของคุณสําหรับห้องสมุดโค้ด มันหมดลงแล้ว คําถามเหล่านี้จะไม่อยู่ในหน้าปัดวันนี้ พวกเขาจะปรากฏตัวขึ้น เมื่อสภาพแวดล้อมการผลิตสลายตัว -- แล้วคุณก็มองไปที่ระบบ。

ดังนั้น ข้อสรุปที่แท้จริงก็คือ การเริ่มต้นของ Agen ไม่ใช่ความสามารถ ทุกคนวิ่งได้ 20。

ศักยภาพที่แท้จริงคือการออกแบบระบบ รอบทรัพยากรต่อเนื่อง ที่ไม่สามารถโคลนได้ และไม่สามารถปรับเทียบข้อมูลได้。

ทรัพยากรนี้เป็นงานของคุณ。

ออกแบบมันเหมือนองค์ประกอบที่สําคัญใดๆ ที่ขึ้นอยู่กับสภาพแวดล้อมการผลิต。

(หัวเราะ)ส่วนเชื่อมโยงดั้งเดิม]

QQlink

Không có cửa hậu mã hóa, không thỏa hiệp. Một nền tảng xã hội và tài chính phi tập trung dựa trên công nghệ blockchain, trả lại quyền riêng tư và tự do cho người dùng.

© 2024 Đội ngũ R&D QQlink. Đã đăng ký Bản quyền.