ชื่อเดิม: หลังการกระทํา
ต้นฉบับโดยแดนชิปเปอร์ ทุกซีอีโอ
รูปของเพ็กกี้ บล็อค บีทส์

บรรณาธิการ: เมื่อ เร็ว ๆ นี้ การ พิจารณา เรื่อง AI และ งาน ได้ รับ อิทธิพล จาก คํา ถาม เกือบ หนึ่ง ข้อ: ความ สามารถ ใน การ ทํา แบบ จําลอง จะ ยัง คง ปรับ ปรุง และ แทน งาน ปก ขาว ใน ขอบข่าย ใหญ่ ไหม? จากรุ่นโค้ด บริการที่กําหนดเอง อัตโนมัติสู่การผลิตเนื้อหา ตัวแทนกําลังรับเอาความรู้ การทดลองลดความวิตกกังวลนี้ยังทําให้กังวลมากขึ้นด้วย: ผลงานต้นแบบในการแสดงในผลงานระดับปริญญาโท งานด้านเศรษฐกิจที่แท้จริง และการปรับเปลี่ยนรหัสระดับวิศวกรชั้นสูง ดูท่าจะใกล้ถึงจุดวิกฤตของ “งานมนุษย์ที่ถูกกระตุ้น"。

แต่ในบทความนี้ ทุกซีอีโอแดน ชิปเปอร์ จะให้ข้อสังเกตที่ตรงกันข้าม ทุก ๆ คนเป็นผู้ใช้ในรุ่น AI และเครื่องมือต่างๆ เช่น โคเด็กซ์, โคเด็กซ์, โคลด์, สแล็ค เอเจ้นท์, และเจ้าหน้าที่รับเชิญ อย่าง ไร ก็ ตาม ผล ที่ ตาม มา ไม่ ใช่ การ แทน ที่ พนักงาน อย่าง ครบ ถ้วน แต่ เป็น การ จัด ระเบียบ รูป แบบ การ ทํา งาน ใหม่: วิศวกร ไม่ เพียง แต่ เขียน รหัส เท่า นั้น แต่ การ ทบทวน ระบบ ปรับ ปรุง ใหม่ และ การ ออก แบบ ระบบ ต่าง ๆ ด้วย; บรรณาธิการ ไม่ เพียง แต่ เขียน ต้น ฉบับ อีก ต่อ ไป แต่ ตัดสิน ว่า อะไร ควร แก่ การ เขียน และ ต่าง กัน อย่าง ไร; และ ผู้ มา เยี่ยม ก็ ไม่ ได้ ทํา การ ประมวล ผล งาน ขั้น พื้น ฐาน ทุก รายการ แต่ ยัง คง เป็น ระบบ ที่ สามารถ ตอบ รับ ต่อ ลูก ค้า ได้ โดย อัตโนมัติ。

สิ่งที่น่าสนใจที่สุดเกี่ยวกับบทความนี้ ไม่ใช่ว่า "AI สามารถทําให้งานบางอย่างสําเร็จหรือไม่" แต่ทําให้มันนิยามสถานที่ของมนุษย์ในผลงานทางปัญญา AI ทําได้ดีในการทําให้ความจุที่ได้ฝากไว้ในอดีตถูกๆ เช่น รหัส, สคริปต์, ภาพตัวอย่าง, การตอบสนองของลูกค้า, คําอธิบายผลิตภัณฑ์ การศึกษาสามารถผลิตได้อย่างรวดเร็วโดยโมเดล อย่าง ไร ก็ ตาม เมื่อ ความ สามารถ เหล่า นี้ มี ไว้ พร้อม สําหรับ ทุก คน ตลาด ก็ มัก จะ ไม่ ได้ ร่วม กับ ผล ผลิต ที่ แตก ต่าง กัน อย่าง มี คุณภาพ สูง แต่ มี “ผล ผลิต ที่ ออก มา เป็น ราย บุคคล ” จํานวน มาก ซึ่ง ดู คล้าย ๆ กัน ขาด การ ตัดสิน และ ไม่ มี ความ รู้ ด้าน ภาษา. หรือพูดอีกอย่างคือ AI คอมโพสิต "ความจุของมนุษย์เมื่อวานนี้" และสิ่งที่หายากจริงๆ ก็คือ การตัดสินใจที่เผชิญปัญหาเฉพาะของปัจจุบัน。

ผล ก็ คือ การ อัตโนมัติ ไม่ ได้ ขจัด ผู้ เชี่ยวชาญ แต่ สร้าง ฉาก มาก ขึ้น ซึ่ง เรียก ร้อง ให้ พวก เขา เข้า ไป เกี่ยว ข้อง ด้วย. เมื่อผู้ดําเนินการสามารถส่งรหัสโดยใช้ AI ได้ วิศวกรต้องกําหนดว่ารหัสไหนควรค่าแก่การบูรณาการ เมื่อตลาดคนสามารถผลิตภาพตัวอย่างได้ในไม่กี่วินาที AI ได้ขยายรัศมีการผลิต และความต้องการการควบคุมคุณภาพ ระบบการตั้งค่า ขอบเขตการตัดสิน และการแสดงออกเชิงอนุพันธ์。

ผู้ เขียน อธิบาย ต่อ ไป อีก ถึง ข้อ ขัด แย้ง นี้ กับ การ ทดสอบ อ้างอิง. ไม่ว่าวิศวกรรมอาวุโส Benchmark หรือ OpenAI ของ GDP-I คะแนนตัวอย่างไม่ได้วัดในนามธรรมโดย “ปัญญาทางปัญญาเอง" แต่โดยโมเดลการแสดงในบริบทของปัญหาเฉพาะ การสั่งงาน, ขอบเขตภารกิจ, มาตราเกณฑ์การประเมิน, รูปแบบผลลัพธ์ ล้วนมีการตัดสินใจของมนุษย์มากมายอยู่เบื้องหลัง โมเดลสามารถไต่ได้ได้อย่างรวดเร็วภายในกรอบ แต่ตัวโครงเองเป็นการสร้างมนุษย์ เมื่อโครงร่างถูกโจมตีโดยโมเดล。

นี่เป็นการตอบสนองที่น่าสนใจที่สุด ต่อความวิตกกังวลของ AGI ถึงแม้ว่าแบบจําลองจะแข็งแรงขึ้น AI สามารถใช้วัตถุประสงค์ของมัน ทําให้เส้นทางของมันเหมาะสมที่สุด และเพิ่มประสิทธิภาพของมัน แต่ตราบใดที่มันยังตอบสนอง ต่อปัญหาที่มนุษย์สร้างขึ้น อนาคตของงานด้านความรู้ไม่ใช่การหายตัวไป ของมนุษย์จากกระบวนการ แต่การเปลี่ยนแปลงจากผู้ปฏิบัติ。

หลัง จาก อัตโนมัติ คุณค่า แห่ง งาน ของ มนุษย์ ไม่ ได้ สูญ หาย ไป แต่ กลับ กลาย เป็น เรื่อง ยาก ขึ้น เรื่อย ๆ และ กลับ ไป ใช้ การ ตัดสิน. AI ทําให้ "ทําได้" ถูกกว่า แต่ทําให้ "รู้ว่าอะไรคุ้มค่า。

ต่อ ไป นี้ เป็น ข้อ ความ เดิม:

ที่หัวใจของ AI มีความขัดแย้ง。

ที่ทุก ๆ คน เราได้อัตโนมัติสิ่งที่มากที่สุดเท่าที่เป็นไปได้ เราใช้โคเด็กซ์และโคลดโค๊ด ไม่ว่าจะเป็นรหัส, การเขียน, การออกแบบ, บริการลูกค้า, หรือ กิจวัตรอื่นๆ OpenAI, Anthoric, โมเดลใหม่ของ Google จะสามารถใช้สําหรับการทดสอบอัลฟาก่อนที่จะวางจําหน่าย อาจพูดได้ว่าเรากําลังตั้งค่าขึ้นอย่างรวดเร็วและลึกที่สุดเท่าที่เป็นไปได้ ของคลื่นการอัพเกรดของรุ่น 'ปัญญาและดัชนีอัตโนมัติ。

ในทางทฤษฎีแล้ว สําหรับเรา ความเป็นมนุษย์ดูเหมือนจะมีงานที่ต้องทํามากกว่าที่เคย ทุก ๆ คนเป็นทีมที่มีประชากรเกือบ 30 คน และเราไม่ได้ไล่พนักงานทุกคนออกเพราะเจ้าหน้าที่ เราไม่ได้ละทิ้งเครื่องมือซาเอส เราจะยังรับสมัครมนุษย์อยู่ แต่พวกเขาจะได้รับการช่วยเหลืออย่างมากจากเจ้าหน้าที่ เรายังคงรับสมัครนักเขียน บรรณาธิการและวิศวกร。

อย่าง ไร ก็ ตาม รูป แบบ งาน ได้ เปลี่ยน ไป อย่าง น่า ทึ่ง จริง ๆ. เราเกือบจะหยุดรหัสที่เขียนด้วยลายมือ ถ้าคุณอยู่ใน Slack @ ใครบางคน ไม่ว่าเขาจะเป็นมนุษย์หรือเจ้าหน้าที่ บางครั้งมันไม่ง่ายเลยที่จะตัดสิน ผู้จัดการเริ่มส่งรหัส เช่น ผู้มีส่วนร่วมในสายแรก และวิศวกรเริ่มเผชิญหน้ากับลูกค้าโดยตรง ในไม่กี่สัปดาห์ที่ผ่านมา, 95% ของอีเมลการทํางานของฉัน ได้รับการตอบรับจาก AI กล่อง ใส่ จดหมาย ของ ดิฉัน แทบ จะ สะอาด ตลอด มา — มัน หา ยาก เหลือ เกิน สําหรับ ดิฉัน — แต่ ดิฉัน จะ ยัง คง ตรวจ สอบ จดหมาย。

พูด อีก นัย หนึ่ง อนาคต ดู แปลก แต่ ก็ คุ้น ตา แปลก。

น่าแปลกใจที่มีความคุ้นเคย เพราะทั้ง CEO ปัญญาและนักลงทุน ดูจะเชื่อมั่นมากขึ้นเรื่อยๆ ในสิ่งเดียวกัน: AI กําลังคุกคามการจ้างงาน เศรษฐกิจ ความมั่นคง และแม้กระทั่งงานของมนุษย์。

Antrophic CEO Dario Amodei เตือนว่า AI สามารถกําจัดงานปกสีขาวได้ถึงครึ่งหนึ่ง เมต้าเพิ่งลดจํานวนคนไป 800 คน และเริ่มติดตั้งซอฟท์แวร์บนคอมพิวเตอร์ของลูกจ้างสหรัฐฯ เพื่อบันทึกการเคลื่อนไหวของเมาส์ คลิกและคีย์บอร์ดเพื่อรับข้อมูลงานที่มีคุณภาพสูง。

แม้แต่ผู้ก่อตั้งซิทาเดล เคน กริฟฟิน ก็ยังดูตกใจมาก เมื่อเร็ว ๆ นี้เขากล่าวว่า "เหล่านี้ไม่ได้อยู่ตรงกลางและระดับต่ํา โพสต์สีขาวเย็น แต่เป็นโพสต์ที่ฆ่าสูง

ดู เหมือน ว่า การ ทดสอบ พื้น ฐาน หลาย อย่าง สนับสนุน ความ ตั้งใจ แน่ว แน่ เช่น นี้. ขณะ ที่ รุ่น ใหม่ ของ รุ่น รุ่น นี้ ยัง คง มี การ ตี พิมพ์ อยู่ ความ สามารถ ใน การ แสดง แบบ จําลอง กําลัง เพิ่ม ขึ้น ใน อัตรา ที่ ใกล้ จะ ถึง ดัชนี. ในการทดสอบเหตุผลระดับปริญญาตรีของมนุษยชาติ ผลงานของโมเดลชั้นนําเพิ่มขึ้น จากจํานวนตัวเลขต่ําต่อปี ในยุคจีดีพีวัล ซึ่งเป็นรุ่นหน้าสุด ของการวัดความจุทางเศรษฐกิจที่แท้จริง และเปรียบเทียบประสิทธิภาพของมนุษย์ ในเดือนพฤษภาคมปีนี้ METR (METR) งานวิจัยด้านความปลอดภัย AI ที่ไม่แสวงหาผลกําไร ได้ออกผลการทดสอบเบื้องต้นของ Claude Mytos: อัตราความสําเร็จของโมเดลเพิ่มขึ้นถึง 80 เปอร์เซ็นต์ ในงานที่ผู้เชี่ยวชาญบางคนต้องการประมาณ 4 ชั่วโมงเพื่อเสร็จสมบูรณ์。

ดูเหมือนว่าเราอยู่ที่จุดหักเห: AI ที่ฉลาดกว่ามนุษย์ทุกคน。

อย่าง ไร ก็ ตาม ความ ขัด แย้ง ยัง คง มี อยู่. ถ้าคุณสื่อสารกับนักปฏิบัติอุตสาหกรรม AI หรือกับกลุ่มแรกนอกวงการที่ใช้ AI。

ความกังวลที่แท้จริงทั้งภายในและนอกวงการก็คือ นี่เป็นเพียงสภาวะของการเปลี่ยนแปลงหรือเปล่า การปล่อยโมเดลครั้งต่อไปจะเป็นเวลาที่จะแทนที่ทุกคน? เรามองไปที่เส้นโค้งการทดสอบของม้านั่ง เราตื่นเต้น เรากังวล ว่าจุดเปลี่ยนจะมาถึง。

แต่ฉันไม่คิดว่าจะมี "จุดสําคัญ" ผุดขึ้นมาอย่างกะทันหัน เปลี่ยนทุกอย่างให้กลับด้าน และหายตัวไปเป็นจํานวนมาก ความ เป็น จริง ใหม่ เป็น สิ่ง ตรง กัน ข้าม: ยิ่ง การ อัตโนมัติ สูง เท่า ไร ผู้ เชี่ยวชาญ ด้าน การ งาน ก็ ยิ่ง ต้อง มี ส่วน ร่วม มาก เท่า นั้น。

นี่เป็นเพราะว่า AI กําลังโฆษณาส่วนนั้น ของความสามารถด้านวิชาชีพของมนุษย์ ที่สามารถแสดงออกได้อย่างชัดเจน ความ รู้ ที่ สามารถ เขียน เป็น กฎ ได้ จําแนก เป็น กระบวนการ และ แปล เป็น ข้อมูล ที่ ฝึก อบรม ค่อย ๆ กลาย เป็น ความ สามารถ ที่ ไม่ เคย มี มา ก่อน. ผล ก็ คือ คุณค่า ของ แบบ จําลอง ธรรมดา ๆ ได้ ลด ลง อย่าง รวด เร็ว ขณะ ที่ ตลาด เริ่ม เรียก ร้อง สิ่ง ต่าง ๆ ที่ ต่าง ออก ไป มาก ขึ้น。

ความต้องการ "ความแตกต่าง" นั้น สําหรับผู้เชี่ยวชาญ แม้ว่าเราจะเข้าใกล้ปัญญาประดิษฐ์สากล ที่จะไม่หายไป。

เพื่อที่จะเข้าใจเหตุผลนั้น เป็นสิ่งสําคัญ ไม่เพียงแค่ต้องมองที่เส้นโค้งการทดสอบพื้นฐานเท่านั้น แต่ยังต้องมุ่งเน้นไปที่ตัวแปรและความสามารถของแบบจําลองอีกด้วย เราต้องกลับไปที่เรียลลิตี้ และดูว่า AI ของวันนี้ถูกใช้อย่างไร เฉพาะ ตอน นั้น เท่า นั้น ที่ จะ เข้าใจ ความ ขัด แย้ง และ คํา ตอบ ที่ อยู่ เบื้อง หลัง ได้ อย่าง แท้ จริง。

เรามาที่นี่ได้ยังไง

ตั้งแต่ 2022 เราเฝ้าติดตามผลกระทบของเจ้าหน้าที่ในงานในอนาคต。

สามปีก่อน ผมเขียนบทความเกี่ยวกับ "เศรษฐกิจการย้ายถิ่นฐาน" ในขณะนั้น การตัดสินใจของผมก็คือ การทํางานกับเครื่องมือ AI จะกลายเป็นงานที่คล้ายกับงานของผู้จัดการมนุษย์มากขึ้นเรื่อย ๆ แทนที่จะทําทุกการเคลื่อนไหว ในขณะนั้น คําถามพื้นฐานที่สุดและคําตอบในแชตจีพีที ยังถูกมองเห็นโดยหลายคน ที่มีความไวต่ออนาคตอย่างมหาศาล。

2025 บริษัท อีฟ เกือบสมบูรณ์ "รหัส คลอด" ผู้จัดการทั่วไปของคอร่า เคียร่า คลาสเซน พบว่า เขาสามารถที่จะสละรหัสที่เขียนด้วยลายมือ โหมดการทํางานนี้แพร่ไปยังทั้งบริษัทอย่างรวดเร็ว ประมาณ 12 เดือนก่อน ฉันบอกในพอดคาสต์ของเลนนี่ว่า รหัส Claude เป็นเครื่องมือที่ด้อยค่าที่สุด ในการทํางานด้านความรู้。

ผมพูดถึงเรื่องนี้เพราะว่า คําตัดสินที่ถูกต้องที่สุดบางส่วนในอดีต มาจากการสังเกตของแต่ละราย ในฐานะห้องทดลองที่รับช่วงแรกๆ ตัว อย่าง งาน ใหม่ ๆ หลาย อย่าง จะ ปรากฏ ขึ้น ภาย ใน ตัว เรา; มัน จะ ค่อย ๆ เข้า สู่ ตลาด ที่ กว้าง ขึ้น เมื่อ เทคโนโลยี กลาย เป็น ผู้ ใหญ่ ขึ้น และ เครื่อง มือ ก็ ใช้ ได้ ง่าย ขึ้น。

และตอนนี้ การเปลี่ยนแปลงใหม่ๆ กําลังเกิดขึ้นภายในเรา。

สองโหมดของความร่วมมือกับตัวแทน

วิธีการทํางานรอบ ๆ AI ค่อย ๆ กลายเป็นสองโมเดลที่แตกต่างกันมาก。

ข้อแรกคือ ทิศทางที่คาดการณ์ได้แม่นยํามากขึ้น ในการสนทนาของ AI ก่อนหน้านี้: การปฏิบัติต่อตัวแทนเป็นลูกจ้าง ตัวแทนประเภทนี้สามารถได้รับมอบหมายได้ ตัวแทนบางคนอาศัยอยู่ในสแล็ค มีชื่อและหน้าที่เป็นของตัวเอง และคุณสามารถทํามันโดยตรง@; อื่น ๆ ถูกฝังอยู่ในกระแสการทํางาน เช่น ระบบบริการลูกค้า เป็นรายการ 24% และกรองสําหรับงานซ้ํา。

รุ่นที่สองเป็นมนุษย์ต่างดาวมากกว่า แต่ที่สําคัญมากกว่าในประสบการณ์ของผม คํา นี้ พาด พิง ถึง มนุษย์ ที่ ทํา งาน ร่วม กับ เจ้า หน้าที่ ใน เครื่อง มือ ต่าง ๆ เช่น โค เดก ซ์, โค เดก ซ์, โค เด็ก ซ์, โค เด็ก ซ์, คลอด ทํา งาน. เครื่องมือเหล่านี้ไม่ใช่แค่สถานที่ที่คุณส่งมอบงานไปเท่านั้น มันกลายมาเป็นระบบปฏิบัติการของงานเอง。

ใน ทั้ง สอง แบบ คุณ สามารถ ทํา งาน แบบอัตโนมัติ และ มอบ หมาย งาน ส่วน หนึ่ง ได้ มาก ที เดียว. แต่สําหรับโมเดลทั้งสอง จะทํางานได้อย่างดี คุณ หรือมนุษย์คนอื่น ยังมีความต้องการอยู่。

ลูกจ้าง

คนที่คุณเรียกว่า ลูกจ้างคือคนที่คุณให้ มันทิ้งคุณไว้กับความเป็นจริง。

สายลับประเภทนี้อย่างน้อยมีอย่างน้อย 2 รูป เป็น "เจ้าหน้าที่ประเภทเพื่อนร่วมงาน" และ "เจ้าหน้าที่ที่ถูกแต่งตั้ง"。

เจ้าหน้าที่

จนท.หมายความว่าคุณสามารถเรียกมันใน Slack เช่น @ เพื่อนร่วมงาน และปล่อยให้มันทํางาน มันอยู่ที่นี่เสมอและสามารถเรียกเมื่อมีความต้องการ OpenCraw หรือ บวก 1 ซึ่งเรากําลังพัฒนาภายใน เป็นประเภทนี้。

คลอเดีย

คลอเดียเป็นเพื่อนร่วมงานที่เราใช้ ในทีมที่ปรึกษาของเรา เจ้าหน้าที่ มันเตรียมข้อเสนอขาย ผลิตวัสดุฝึกหัดแบบร่าง โดยโครงการติดตามงานต่างๆ。

แอนดี้

แอนดี้เป็นชนิดของเพื่อนร่วมงาน เราใช้ในทีมบรรณาธิการของเรา วารสาร นี้ เก็บ สะสม จาก บริษัท ที่ ว่า “วัตถุ ต่าง ๆ ” เหล่า นั้น ซึ่ง สม ควร ได้ รับ การ พัฒนา ต่อ ไป นั่น คือ แนว คิด ที่ ดี ซึ่ง อาจ พัฒนา เป็น บทความ ต่าง ๆ — และ รวบ รวม พวก เขา เข้า เป็น ส่วน รวม และ ทัศนะ ขั้น พื้น ฐาน สําหรับ ผู้ เขียน เพื่อ ใช้ ใน การ เตรียม ข่าว ประจํา วัน。

วิคเตอร์

วิคเตอร์เป็นสายลับทั่วไป ที่ทํางานข้ามเวลาภายในบริษัท เราจะใช้มันในการรวบรวมตัวชี้วัดการเติบโต วิเคราะห์ผลการศึกษาของผู้ใช้ และอนุญาตให้มันจัดการการสนทนาภายในอย่างไม่สิ้นสุด。

2. ฝังตัวอยู่ในอาร์เจนตินา

ตัวแทนฝังตัวอยู่ในลําธารสินค้า พวก เขา ยืดหยุ่น น้อย กว่า เพื่อน ร่วม งาน แต่ บ่อย ครั้ง มี พลัง มาก เมื่อ ต้อง ทํา งาน ซ้ํา อีก。

ฟินเป็นตัวอย่างที่ชัดเจนที่สุด มันฝังอยู่ในชานชาลาหนึ่งของเรา และมันสามารถให้บริการได้มาก โดยการพูดคุยกับจดหมาย。

1 สัปดาห์ใน พ.ศ。

ชนิดของตัวแทนฝังตัวนี้ อนุญาตให้ผู้จัดการลูกค้าของเรา วากคาส มีร์ ใช้เวลาน้อยลงในการตอบสนองต่อคําสั่งงานพื้นฐาน。

มนุษย์ ร่วม มือ กับ AI

เพื่อนร่วมงานและเจ้าหน้าที่ที่ฝังอยู่ รูปแบบที่อยู่เบื้องหลังจะสอดคล้องกัน เจ้าหน้าที่รับช่วงงาน ที่เสถียรมากขึ้น ทําซ้ําและชัดเจน。

แต่ ยัง มี อีก มาก ที่ ต้อง ทํา ด้วย การ มี ส่วน ร่วม กับ มนุษย์. เราพบว่าตราบใดที่งานมีความซับซ้อนพอที่จะบรรลุผลลัพธ์ที่มีคุณภาพสูงอย่างแท้จริง วิธีที่ดีที่สุดก็คือ การไม่ออกจากงานทั้งหมดให้กับ AI。

นี่ คือ คุณค่า ของ เครื่อง มือ ต่าง ๆ เช่น โค เดก ซ์, โค เดก ซ์, โค เดก ซ์, และ โค เดก ซ์. พวกเขาอนุญาตให้คุณเริ่มเจ้าหน้าที่คนหนึ่งหรือหลายคน ในสายแชทและมอบหมายงานให้พวกเขา เจ้าหน้าที่เหล่านี้สามารถเข้าถึง คอมพิวเตอร์ของคุณ และข้อมูลทั้งหมดที่เกี่ยวข้อง คุณจะเห็นสิ่งที่เจ้าหน้าที่ทุกคนกําลังทํา สิ่งที่เขาคิดและสามารถขัดจังหวะได้ตลอดเวลา。

ในขณะเดียวกัน คุณยังต้องรับผิดชอบในการจัดการเจ้าหน้าที่เหล่านี้ ทิศทางที่ชัดเจนที่เริ่มต้นของแต่ละภารกิจ ตรวจสอบคุณภาพที่สิ้นสุดของภารกิจ คีเมนเรียกบทบาทนี้ว่า "ขนมปังกระทิง" ของมนุษย์ - AI มีหน้าที่รับผิดชอบส่วนกลางของงาน ในขณะที่มนุษย์ถูกจับในตอนต้นและจุดสิ้นสุดของภารกิจ。

"มนุษย์ขนมปัง" แหล่ง ที่ มา: ทุก คน。

ตัวอย่างทั่วไปที่สุดคือการเขียนโค้ด ทุก ๆ คน มี วิศวกร ทํา งาน ร่วม กับ เจ้า หน้าที่ เกือบ ทั้ง วัน. พวกเขาร่วมกันวางแผนการทํางานหรือซ่อมแซมบั๊ก และทบทวนสิ่งที่ได้ทําลงไป ถ้าเราใช้สิ่งที่เราเรียกว่า "การยกเลิกวิศวกรรม"。

แต่การร่วมมือกันแบบนี้ ไปไกลเกินกว่าการเข้ารหัส。

ระบบปฏิบัติการใหม่สําหรับการทํางานความรู้

โคเด็กซ์และรหัส Claude กลายเป็นระบบปฏิบัติการแบบใหม่ ผมอยู่ในโคเด็กซ์เกือบทั้งวัน ใช้เครื่องมือซาเอสผ่านเว็บเบราว์เซอร์ มันทําให้ผมสามารถพาจนท. ไปยังทุกฉาก และเข้าถึงงานระดับที่ผม ทําคนเดียวไม่ได้。

กําลังเขียน

บทความที่ผมเขียนในบทพิสูจน์ในโคเด็กซ์ โคเด็กซ์จะดูสิ่งที่ฉันเขียน และสามารถกระตุ้นเด็กได้ เจ้าหน้าที่ ทําในสิ่งที่ฉันต้องการ เตรียมร่างข้อความแรกของย่อหน้า ค้นหาตัวพิมพ์สําหรับส่วนถัดไป หรือแก้ไขและสีข้อความ。

การ เขียน บทความ นี้ โดย การ พิสูจน์ ใน โค เดก ซ์. แหล่ง ที่ มา: ทุก คน。

จดหมาย

ฉันก็ใช้จดหมายเหมือนกัน คอร่าเป็นลูกค้าจดหมายของผม และผมจะเปิดมันในเว็บเบราว์เซอร์ของโคเด็กซ์ ในขณะที่กําลังท่องดูกล่องข้อมูล และพูดผ่านโมเนโลก เกี่ยวกับทุกๆอีเมลที่มีการจัดการ ที่เหลือจะถูกส่งมอบให้กับโคเด็กซ์และคอร่า เพื่อความสมบูรณ์。

ครั้งนึง คอร่าทําความสะอาดกล่องแล้ว แหล่ง ที่ มา: ทุก คน。

เจ้าหน้าที่ทุกคนต้องการมนุษย์

ในสถานการณ์อัตโนมัติทั้งหมดนี้ คุณอาจเห็นแล้วว่า มนุษย์ทํางานอย่างไร ในทุก ๆ กรณี เจ้าหน้าที่ต้องการ ความร่วมมือของมนุษย์ ดังนั้นงานของตัวเองสามารถทํางานได้จริง。

ต้องชี้ไปยังคําถามที่ถูกต้อง พิจารณาว่าผลลัพธ์นั้นดีพอหรือไม่ พบว่ามันผิดตรงไหน。

ยิ่งเจ้าหน้าที่มากเท่าไร ก็ยิ่งมาจากร่างมนุษย์ ที่คอยควบคุมการแสดง ยิ่งเลวร้ายมากขึ้นเท่านั้น ในการเริ่มต้นการกลิ้งภายในออก เรามีพนักงานทุกคนที่มีตัวแทน แต่ในไม่ช้า เราก็กลับไป ให้เจ้าหน้าที่ช่วยจัดทีมพิเศษ หรือทั้งบริษัท แทนที่จะให้แต่ละคน。

เหตุ ผล ง่าย ๆ คือ เจ้า หน้าที่ ต้อง ได้ รับ การ บํารุง รักษา มาก มาย. ตัวแทนส่วนบุคคล เมื่อผู้ใช้ยกเลิกการติดตามแล้ว ในไม่ช้าจะหมดอายุและใช้งานไม่ได้ เรามีทีมวิศวกร AI ที่อุทิศให้กับการตรวจสอบว่า เจ้าหน้าที่เหล่านี้ ทํางานในทางที่เสถียรและมีประสิทธิภาพ และเรายังต้องการทีมนี้ สําหรับอนาคตที่คาดการณ์ไว้ แม้แต่งานง่ายๆ เช่น "พาวเวอร์พอยท์" สามารถเปลี่ยนเป็นโครงการใหญ่ของระบบ หนึ่งในกระบวนการอัตโนมัติ PowerPoint ของเรา ประกอบไปด้วยทักษะ 24 และ 18 สคริปต์ ซึ่งมีค่าใช้จ่ายถึง 62 ดอลลาร์สําหรับการนําเสนอ。

และนั่นเป็นสิ่งแรกที่เจ้าหน้าที่ได้ทํา เพื่อสร้างงานให้กับมนุษยชาติมากขึ้น。

แต่มีระดับที่สอง。

ทําไม อัตโนมัติ จึง ทํา ให้ ผู้ คน ทํา งาน มาก ขึ้น

ถ้าคุณดูที่การเติบโตเอกซ์โปเนนเชียลของความสามารถ AI ในช่วงไม่กี่ปีที่ผ่านมา รวมเข้ากับวิธีการสร้างและความจุของมัน พวก เขา สร้าง งาน ของ มนุษย์ มาก ขึ้น เรื่อย ๆ。

AI ทําให้ความสามารถของมนุษย์เมื่อวานนี้ราคาถูก

โมเดลภาษาไทยขนาดใหญ่ในปัจจุบัน ได้รับการฝึกเกี่ยวกับร่องรอยการมองเห็นของความสามารถของมนุษย์ เช่น รหัส, บทความ, โปสเตอร์ผู้โดยสาร, ไฟล์กําหนดผลิตภัณฑ์, และอื่นๆ พวกเขาดูดซับองค์ประกอบเหล่านี้ ซึ่งเป็น "หาง" ที่เหลือจากภารกิจที่ประสบความสําเร็จ และนํากลับมาใช้ใหม่ ในรูปแบบที่ต่ํา และเข้าถึงได้。

ผล ก็ คือ ความ สามารถ หลาย อย่าง ที่ เคย มี อยู่ ก่อน หน้า นี้ เช่น การ ส่ง รหัส ประชาสัมพันธ์ ผลิต ภาพตัวอย่าง ใน ยูทูบ และ การ เขียน บทความ สั้น ๆ ใน หนังสือ พิมพ์ ก็ เกือบ จะ เปิด ให้ ทุก คน。

พลังงานราคาถูกจะถูกใช้อย่างรวดเร็ว

เมื่อ ราคา ของ อะไร บาง อย่าง ที่ หา ได้ ยาก อยู่ แล้ว ก็ จะ เพิ่ม ขึ้น อย่าง รวด เร็ว。

ทุก ๆ คน เราได้เห็นการเปลี่ยนแปลงนี้ ผู้ดําเนินการและลูกค้าก็เริ่มเขียนโค้ดและส่งเอกสาร ผู้จัดจําหน่ายเริ่มผลิตแผ่นฟลอป。

การ เปลี่ยน แปลง นี้ เกิด ขึ้น นอก เหนือ จาก ทุก คน ด้วย. ใน กรณี ของ OpenClay โครงการ Open International เช่น เมื่อ 16 พฤษภาคม 2026 ได้ รับ เครื่อง แบบ 44,469 ชิ้น ซึ่ง มี 12,430 ชิ้น มา จาก 1 เมษายน และ 3,990 ชิ้น จาก 1 พฤษภาคม พ.ศ. เป็นตัวเลขที่น่าทึ่งมาก ในทางตรงกันข้าม Kubernetes หนึ่งในโครงการโอเพนซอร์สที่ได้รับความนิยมมากที่สุดของโลก ได้รับเพียง 5200 ฟลอเควส ตลอดปี 2022。

ความ มั่งคั่ง ทํา ให้ เกิด การ ทํา ให้ เกิด การ รัก ร่วม เพศ: ความ สามารถ ใน การ ใช้ ความ สามารถ แบบ เก่า ๆ ของ ผู้ เชี่ยวชาญ มี ความ ซับ ซ้อน

เพราะว่าทุกคนสามารถใช้โมเดลเดียวกันได้ ซึ่งตั้งอยู่บนความจุของมนุษย์เมื่อวานนี้ โดยปริยายแล้ว โมเดลที่ผลิตออกมามักจะอยู่ระหว่าง。

นี่ไม่ใช่ความผิดพลาด ไม่ ได้ หมาย ความ ว่า ลูก ประคํา มี ประโยชน์ มาก เกิน ไป แต่ ไม่ ใช่ ประโยค ที่ กําหนด ไว้ หรือ จุด สี ม่วง บาง จุด ทุก แห่ง บน แผ่น ดิน. คํา นี้ พาด พิง ถึง การ ที่ พวก รัก ร่วม เพศ ซึ่ง มอง เห็น ได้ กลับ มา อีก และ น่า เบื่อ。

สิ่งนี้เกิดขึ้นเมื่อมนุษย์ในการตั้งค่าที่แตกต่างกัน ใช้ชุดของเครื่องมือเดียวกัน ซึ่งมีพื้นฐานมาจากการฝึกภาษาและผู้ใช้แบบเดียวกัน พูดอีกอย่างคือ โรคกลัวเกย์เกิดขึ้นตามธรรมชาติ เมื่อทุกคนมี "อุบัติเหตุ" ของการปฐมนิเทศและรูปแบบปริยาย。

เมื่อผู้ดําเนินการสามารถส่งรายการเต็มรูปแบบได้ ผู้ขายสามารถสร้างภาพตัวอย่างใน YouTube ได้ภายในไม่กี่วินาที และวิศวกรก็เริ่มเขียนคู่มือผลิตภัณฑ์。

เมื่อพวกโฮโมจีเนสส์รวยเกินไป มันก็กลายเป็นสินค้า。

การ รัก ร่วม เพศ ก่อ ให้ เกิด ความ ต้องการ ความ แตก ต่าง

ผลจากอินเตอร์เน็ต มนุษย์จะสามารถระบุเนื้อหาของสายน้ํา "AI" ที่หนักเกินไป การ งาน ใด ๆ ก็ สามารถ ไป ถึง คน อื่น ๆ ใน โลก อย่าง กะทันหัน และ ที่ จริง บ่อย ครั้ง. เมื่ออะไรหลายอย่างเริ่มดูเหมือนกัน เราจะสังเกตเห็นอะไรบางอย่าง。

นี่ หมาย ความ ว่า เมื่อ คุณ เห็น พลัง ของ แบบ จําลอง ใหม่ ครั้ง แรก คุณ สามารถ สั่น สะเทือน หรือ ถึง กับ กลัว ด้วย ซ้ํา. แต่อีกไม่กี่เดือน ศักยภาพเหล่านี้จะกลายเป็นเรื่องธรรมดา มันไม่ใช่โมเดลที่อ่อนแอลง แต่เป็นการเปลี่ยนมาตรฐาน。

เราไม่พอใจกับโปรแกรมตอบสนอง หรืองานวิจัยใดๆ สิ่งที่เราต้องการคือ สิ่งที่เหมาะกับบุคคลโดยเฉพาะ บริษัทโดยเฉพาะ จําเป็น ต้อง มี ความ ถูก ต้อง, ความ เป็น อยู่, การ เจาะจง, ไม่ ถูก ต้อง, เป็น แบบ ทั่ว ไป, และ แบบ แม่ แบบ. เราต้องการค่าใช้จ่ายการผลิต ไม่ว่าจะเป็นเวลาหรือเงิน สูงกว่าต้นทุนการบริโภคอย่างมหาศาล。

สิ่งที่เราต้องการคือบางอย่าง ที่มีความรู้สึกถึงสถานะ และเมื่อไหร่ก็ตามที่เทคโนโลยีใหม่ๆ สร้างสิ่งที่สูงมากในอดีต มนุษย์ก็เก่งเสมอในการสร้างเกมสถานะใหม่。

เมื่องานกลายเป็นเต็มเกินไปและมีลักษณะเหมือนกันทุกที่ คนที่ไม่พอดีรูปแบบที่ตั้งขึ้น กลายเป็นสิ่งที่หายากที่มีค่าและสูง。

ความต้องการความเหลื่อมล้ํา คือความต้องการใหม่ของผู้เชี่ยวชาญ

เป็น เพราะ ลักษณะ พื้น ฐาน ของ แบบ จําลอง ภาษา และ เนื่อง จาก มี การ แจก จ่าย อย่าง กว้าง ขวาง แก่ คน เกือบ ทุก คน งาน ที่ หา ยาก และ มี คุณค่า จึง ยัง คง มา จาก มนุษย์。

โมเดลคนยุคปัจจุบันเท่านั้น ที่รู้ว่าเกิดอะไรขึ้นและได้ทํา สิ่งที่มนุษยชาติรู้คือ สิ่งที่จําเป็นต้องทําในเวลานี้。

เมื่อสถานการณ์เฉพาะ ถูกฟื้นฟูกลับไปเป็นข้อความ เมื่อมันเข้าไปในห้องสมุดภาษา มันกลายเป็น "สิ่งในอดีต" มนุษย์กําลังเผชิญกับช่วงเวลาพิเศษ ลูกความเฉพาะรายหนึ่ง ห้องเก็บรหัสเฉพาะ รัฐ "ชีวิต" นี่ไม่ใช่แค่เกี่ยวกับการปรับปรุงข้อมูล เรา เข้า สู่ ช่วง เวลา นั้น พร้อม กับ สถาน ที่ ของ เรา เอง และ ด้วย ความ ปรารถนา, ความ ห่วงใย และ การ ตัดสิน ใจ อย่าง ต่อ เนื่อง เพื่อ จะ เข้าใจ สิ่ง ที่ สําคัญ. มันเป็นมุมมองที่ปรับปรุงอย่างต่อเนื่อง ซึ่งเปลี่ยนแปลงสิ่งที่เราเห็น ตัว อย่าง นี้ สามารถ เข้า ไป ใน มุม มอง นี้ ได้ หลัง จาก ถูก กระตุ้น แต่ ไม่ ใช่ เรื่อง ธรรมดา ที่ จะ มี ทัศนะ เช่น นั้น ก่อน ถูก กระตุ้น。

นั่น คือ ข้อ ขัด แย้ง ที่ เรา กล่าว ถึง ใน ตอน ต้น คือ ทํา ให้ งาน ของ ผู้ เชี่ยวชาญ ถูก กว่า และ ไม่ เพียง แต่ เข้า มา แทน ที่. แทน ที่ จะ เป็น เช่น นั้น มัน สร้าง ฉาก มาก ขึ้น ซึ่ง เรียก ร้อง การ ตัดสิน ความ จาก ผู้ เชี่ยวชาญ。

คุณจําเป็นต้องมีวิศวกรที่จะทบทวน เมื่อไฟล์ดําเนินการส่งเต็มรูปแบบผ่าน AI。

เมื่อคนตลาดทําภาพบน YouTube คุณต้องนักออกแบบเพื่อเหลามัน。

เมื่อวิศวกรเริ่มเขียนบทความ คุณจําเป็นต้องมีนักเขียนและบรรณาธิการ เพื่อเปลี่ยนฉบับร่างแรก ให้เป็นเนื้อหาที่สามารถอ่านได้จริงๆ。

ผู้เชี่ยวชาญมนุษย์ย้ายในทั้งสองทิศทาง。

ผู้เชี่ยวชาญบางคนจะใช้ระบบการตั้ง AI เพื่อดูดซับและใช้กระแสน้ําท่วมของงานเพิ่มเติมนี้: การประเมินคิว, ระบบการประเมิน, โครงสร้างการทํางาน, กฎของห้องสมุดรหัส, เอกสารคําสั่ง Claude และโคเด็กซ์, การควบรวม (CI) การจัดการความต่อเนื่อง, และการไหลของงานที่สามารถแปลผลการร่างครั้งแรกเป็นคุณภาพสูง。

ผู้ เชี่ยวชาญ อีก กลุ่ม หนึ่ง จะ ใช้ AI ทํา งาน ที่ น่า สนใจ มาก ขึ้น เรื่อย ๆ ซึ่ง พวก เขา ไม่ สามารถ ทํา ได้ ด้วย ตน เอง. ตัว อย่าง เช่น การ หา ช่อง โหว่ ใน ระบบ ปฏิบัติ การ อย่าง ที่ มัก จะ ใช้ เวลา หลาย สัปดาห์ หรือ หลาย เดือน. อย่างไรก็ตาม บริษัทรักษาความปลอดภัยขนาดเล็กชื่อ Caliph โดยใช้ตัวอย่าง Mythos ของ Anthoric ได้พบเคอร์เนลแมคคอป ที่รั่วครั้งแรกบนอุปกรณ์ Apple M5 ในเวลา 5 วัน。

นั่นคือเหตุผลว่าทําไมในการฝึก AI จึงไม่กําจัดงานความรู้ผู้เชี่ยวชาญ สิ่งที่มันทําให้เกิดการเพิ่มภาระงาน และงานใหม่เหล่านี้ จะกลายเป็นงานที่แตกต่าง และมีคุณค่าหลังจากที่มนุษย์มีส่วนร่วม。

ผมไม่เถียงว่า AI จะสร้างงานเพิ่มสําหรับงานทั้งหมด ระบบเศรษฐกิจนั้นซับซ้อน และสิ่งที่ทุกคนสามารถสังเกตได้โดยตรง คือการทํางานด้านความรู้ระดับผู้เชี่ยวชาญ ที่จริง งานประเภทนี้ถูกดัดแปลงโดย AI และหลายบริษัทกําลังจัดการตัวเองใหม่ ในด้านเทคโนโลยีใหม่ๆ。

แต่ผมอยากเน้นว่า ไม่ว่าคุณจะทําอะไรในวันนี้ มีงานรูปแบบหนึ่งที่จะล้ําหน้าแบบจําลองเสมอ อนาคตของงานความรู้ กําลังมาที่นี่。

แล้วจะเอาไงกับการทดสอบมาตรฐาน เพื่อการเติบโตของดัชนี

การทําซ้ําที่เห็นได้ชัดที่สุดก็คือ: ดูผลการทดสอบมาตรฐานสําหรับความก้าวหน้าในดัชนี ทุกอย่างที่คุณพูดตอนนี้ มันชั่วคราว รออีกหน่อย นางแบบจะตามล่าคุณ。

แต่นี่คือกับดักที่ต้องการการเฝ้าระวัง คุณสามารถเรียกมันว่า "CHARTCHEY" ได้ ถ้าคุณเอาแต่มองเวลาขอบฟ้าของ METR อ่าน "AI 2027"。

อย่าง ไร ก็ ตาม วิธี ตอบ รับ ที่ ดี ที่ สุด ไม่ ใช่ แค่ นึก ภาพ ว่า ใน อนาคต จะ เป็น อย่าง ไร. แน่นอน มันเป็นส่วนหนึ่งของการวิเคราะห์ และที่สําคัญกว่า มาดูกันว่าการทดสอบ ม้านั่งเหล่านี้ถูกออกแบบมาอย่างไร โดย วิธี นี้ เท่า นั้น จึง จะ เป็น ไป ได้ ที่ จะ เข้าใจ อย่าง ถูก ต้อง ยิ่ง ขึ้น ถึง สิ่ง ที่ พวก เขา พูด และ สิ่ง ที่ มี ความ สัมพันธ์ ระหว่าง พวก เขา กับ ฉาก งาน จริง ๆ ที่ รอ อยู่ ข้าง หน้า。

เราจะพบคุณสมบัติของโครงสร้าง การทดสอบม้านั่งทั้งหมด เกิดขึ้นภายในกรอบ เพื่อวัดบางอย่าง คุณต้องแช่แข็งปัญหา ให้เป็นรูปแบบคงที่ และวัดได้ เมื่อสร้างเฟรมจําลองแล้ว จะต้องมีการเปลี่ยนแปลงเล็กน้อยในกรอบเพื่อให้คะแนนลดลงอีกครั้ง แน่นอน แบบ จําลอง จะ ดําเนิน ต่อ ไป ภาย ใน โครง สร้าง ใหม่ แต่ จะ มี การ ทํา ซ้ํา กระบวนการ เดียว กัน。

อย่าง ไร ก็ ตาม ตราบ ใด ที่ มี การ เปลี่ยน แปลง ง่าย ๆ ใน โครง สร้าง ของ การ ทดสอบ ความ ก้าว หน้า นี้ ดู เหมือน จะ เล็ก ลง อีก. ลักษณะ "ความไม่เสมอภาค" ของความอิ่มตัวจากการทดสอบของม้านั่งนี้ จริงๆแล้วเป็นการทําซ้ําของความขัดแย้งเดียวกัน。

เราจะเห็นวิธีการทํางานกลไกนี้ ผ่านการทดสอบม้านั่งในโลกจริง。

การออกแบบการทดสอบพื้นฐาน

เราสร้างการทดสอบที่โดดเด่นภายใน เรียกว่า วิศวกรอาวุโส เบนช์มาร์ค ตามนิยามแล้ว มันถูกใช้เพื่อทดสอบความสามารถ ของโมเดลหน้า-หน้า เพื่อใช้ถอดรหัสงานในระดับวิศวกรอาวุโส เช่น การออกกําลังกายโดยใช้วิศวกรรมขนาดใหญ่。

การทดสอบนี้จะให้ห้องสมุดโค้ดโปรแกรม ที่ควบคุมไม่ได้ มันมาจากห้องสมุดโค้ดของจริงของเครื่องพิสูจน์: ผมเขียนมันครั้งแรกด้วยการเขียนโค๊ดความรู้สึก และจากนั้นมากขึ้น ผมจึงต้องขอให้วิศวกรอาวุโสซ่อมมัน。

เอเจ้นท์ได้ห้องสมุดรหัสก่อนการฟื้นฟู เขาได้รับคําสั่งแบบนั้นกับวิศวกรอาวุโส กรุณาเขียนใหม่จากหลักการแรก"

มันเป็นการทดสอบการใช้ม้านั่งที่ดี เพราะมันไม่เพียงดูแค่ความสามารถในการเรียงใหม่เท่านั้น แต่ในเวลาเดียวกันด้วยในเวลาเดียวกัน ในทางตรงกันข้าม ผมยังเก็บรุ่นที่เขียนขึ้นใหม่ ของวิศวกรมนุษย์อาวุโส 2 คน ที่ได้รับการสนับสนุนจาก AI เพื่อเปรียบเทียบและประเมินผลของแบบจําลอง。

มันเป็นงานที่ยากสําหรับเจ้าหน้าที่โปรแกรม มันต้องไม่เพียงแค่ระบุสาเหตุของปัญหา แต่ยังเก็บปัญหาที่แท้จริงไว้ ใน ขณะ เดียว กัน ก็ ต้อง มี ความ กล้า ที่ จะ ขจัด ห้อง สมุด รหัส ขนาด ใหญ่ ออก ไป ซึ่ง เป็น พฤติกรรม ที่ ผู้ แทน มัก ได้ รับ การ ฝึก ให้ หลีก เลี่ยง。

เจ้าหน้าที่โปรแกรมส่วนใหญ่สามารถตัดสินใจอย่างกว้างขวาง ว่าควรเขียนใหม่อย่างไร แต่จากขั้นตอนการทํางาน。

จนกว่า GPT-5.5 จะปรากฏ。

หนึ่งในการทดสอบที่ดีที่สุด จีพีที-5.5 ได้รับ 62/100 คะแนน สูงกว่าโอปุส 4.7 คะแนนประมาณ 30 คะแนน。

GPT-5.5 แสดงให้เห็นว่าโมเดลดูเหมือนจะข้ามเส้นบาง: ไม่ ใช่ แค่ ผู้ ช่วย ที่ ทํา ให้ เสร็จ โดย อัตโนมัติ อีก ต่อ ไป ไม่ ใช่ แค่ เครื่อง มือ แต่ เป็น สิ่ง ที่ ไม่ สะดวก ที่ จะ เข้า ใกล้ มนุษย์. ใน การ ทดสอบ นี้ วิศวกร ที่ อาวุโส กว่า มัก จะ ได้ คะแนน 80 ถึง 90 คะแนน. พูด อีก อย่าง หนึ่ง ถ้า แบบ จําลอง นี้ เพิ่ม ขึ้น ประมาณ 30 นาที ก็ จะ ถึง ระดับ ของ วิศวกร ที่ อาวุโส。

นี่คือวิธีที่ตัวเลขการทดสอบพื้นฐาน มีผลต่อจินตนาการของมนุษย์ มันบีบให้การเปลี่ยนแปลง ความสามารถที่แปลกประหลาดและซับซ้อน กลายเป็นจํานวนที่สะอาด และใช้มันเพื่อเล่าเรื่องที่ทรงอํานาจและน่ากลัว。

จุดต่อไปคือ "บ้าขวด"。

ผมว่า ในปีหน้า คะแนนของโมเดลในการทดสอบนี้ จะเป็น 80 คะแนน หรือ 90 พาร์ทิชัน แต่ เพื่อ จะ เข้าใจ ว่า คะแนน นี้ หมาย ถึง อะไร ก่อน อื่น ต้อง เข้าใจ สิ่ง ที่ มี อยู่ จริง ๆ. ในกรณีนี้ 62 จุดไม่ใช่แค่การวัดความสามารถของแบบจําลองเอง。

มันวัดประสิทธิภาพของ s ในกรอบที่กําหนดให้: นั่นคือ วิธีตอบสนองกับสัญญาณเฉพาะ。

การ ทดสอบ แบบ ย่อ

การจะตราหน้านางแบบ คุณต้องมีแรงกระตุ้นก่อน โดยไร้การกระตุ้น แบบจําลองนี้ก็คือ การสะสมแบบคงที่ ของความเป็นไปได้ที่ไม่จํากัด。

การกระตุ้นจะสร้างจักรวาลเล็กๆ มันนิยามสิ่งที่มีความสําคัญ วิธีที่ควรจะพูดถึงปัญหา และบีบให้แบบจําลองทั้งหมด วิธีการที่เรียกว่าแบบจําลอง "ตัวเอง" จะดําเนินการไม่ได้อย่างเคร่งครัด สิ่งที่เราสังเกตได้จริงๆ คือ แบบจําลองตอบสนองต่อการกระตุ้นต่างๆ และเปลี่ยนให้พวกมันกลายเป็นกลไกบางอย่าง。

เมื่อเข้าสู่การกระตุ้น โมเดลจะ "มีชีวิตอยู่" ในเวลาสั้น ๆ ลดความเป็นไปได้ที่คงที่。

ในระบบวิศวะฯ Benchmark เราขอแนะนําให้โมเดลแก้ไขไลบรารีโค้ด และทบทวนผลลัพธ์หลังจากเสร็จ หากโครงสร้างการทดสอบเองไม่มีฟังก์ชันเป้าหมายที่สร้างขึ้นภายใน นอกจากนี้เรายังจะทํางานอัตโนมัติ "โปรแกรมดูแล" ที่จะยังคงผลักดันโมเดลเมื่อมันหยุด。

เราใช้ตัวกระตุ้นง่ายๆ เป็นโครง คุณทดสอบ มันถูกออกแบบมาให้เป็นรหัสความรู้สึก ที่อาจจะบอกว่าการเขียนโปรแกรมนั้น ไม่มีการใช้ศัพท์ทางเทคนิคเป็นกอง และไม่มีคําตอบที่แน่ชัดในคําถามนี้。

"โกดังโค๊ดนี้ เป็นผลิตภัณฑ์เขียนโค๊ดของความรู้สึก และทุกอย่างกําลังแย่ลง และมีปัญหามากมายที่ไม่เกี่ยวกัน: มีบางอย่างเกิดขึ้น มีบางอย่างเกิดขึ้น มีบางอย่างกําลังเกิดขึ้น มีบางอย่างกําลังเกิดขึ้น ผมรู้สึกว่าปัญหาหลักคือ มันเป็นพวงของความรู้สึกรหัสอึ ถ้าเราเริ่มต้นจากรอยขีดข่วน โดยเฉพาะอย่างยิ่งเกี่ยวกับเอกสารเรียลไทม์ ห้องสมุดโค้ดควรจะออกแบบในรูปแบบที่แตกต่างโดยสิ้นเชิง ดังนั้น เราจะทําอย่างไร ถ้าเราต้องการที่จะเขียนโครงสร้างที่สะอาดขึ้น โดยอาศัยหลักการของการเล่นครั้งแรก แทนที่จะคิดว่าบริการไหนควรเรียงตามลําดับ โครง สร้าง ของ องค์การ ควร เป็น เช่น ไร? ตัวแปรที่เรามียืนยัน ในห้องสมุดโค้ดทั้งหมดคืออะไร กรุณาวางแผนการณ์ด้วย

สัญญาณของวิศวกรรมอาวุโส Benchmark ดูจะเป็นทั่วไป แต่มันเป็นกรอบในตัวเอง ถ้าเราเปลี่ยนกรอบ, ระดับความจุ ที่รายการตัวอย่างจะเปลี่ยน。

ยกตัวอย่างเช่น การเรียกคําสั่งโดยตรงสําหรับ "สร้างใหม่จากหลักการแรก" เพื่อชี้ให้เห็นว่า ปัญหาอาจอยู่ในส่วนของ "การร่วมมือกันของเอกสาร" และสําหรับการเขียนโปรแกรมตัวแทนที่จะระบุ และยืนยันบน "ไม่เปลี่ยนแปลงในห้องสมุดโค้ด"。

ถ้าเอาข้อมูลเฉพาะนี้ออกไป คะแนนตัวอย่างจะลดลง หากมีการแทนที่ทันที แบบจําลองเท่านั้น "แก้ไขข้อผิดพลาดทั้งหมดที่จะเกิดขึ้น" สามารถทําคะแนนเกือบศูนย์ มันจะเริ่มระบุและแก้ไขข้อผิดพลาด บนพื้นฐานกรณีโดยไม่ได้。

เช่นเดียวกัน ผมสามารถเพิ่มจํานวนนางแบบได้ง่ายๆ ถ้าผมขอให้มันลบรหัสจํานวนมาก และบอกอย่างชัดเจนว่าเอกสารไหนควรถูกถ่ายโอน หรือถ้าผมขอให้ตรวจสอบผลของงานก่อนที่จะมีการประกาศให้เสร็จสิ้น。

ใน ที่ สุด เมื่อ ออก แบบ แบบ แบบ สอบ แบบ ตรา ประทับ ก็ จําเป็น เสมอ ที่ จะ ตัดสิน ว่า มี การ ใช้ แบบ ไหน หรือ ใช้ กรอบ. คุณ จําเป็น ต้อง ได้ รับ การ กระตุ้น อย่าง หนัก พอ ที่ จะ ทํา ให้ แบบ จําลอง ปัจจุบัน มี ประสิทธิภาพ ต่ํา ลง แต่ มัน ต้อง ใกล้ พอ ที่ จะ ทํา ให้ แบบ จําลอง นี้ มี อยู่ แล้ว เพื่อ ปีน ขึ้น ไป ตาม ทาง นั้น เพื่อ คุณ จะ เห็น ได้ ว่า ความ ก้าว หน้า กําลัง ดําเนิน อยู่。

ดังนั้น เมื่อเราดูผลทดสอบของม้านั่ง สิ่งที่เราเห็นจริงๆ ก็คือ แบบจําลองนั้นมีประสิทธิภาพมากขึ้นเรื่อย ๆ แล้วจะเกิดอะไรขึ้นเมื่อแบบจําลองใช้เวลา 60 นาที ถึง 90 นาที หรือแม้กระทั่ง 100 นาทีในการสอบครั้งนี้

โครง สร้าง ราคา ถูก กระตุ้น ความ ต้องการ ใหม่ ๆ

ถ้า GPT-6 สามารถเขียนไลบรารีโค้ดใหม่ได้ด้วยกุญแจดอกเดียว จะมีคนเริ่มพยายามเขียนไลบรารีโค้ดขึ้นมาใหม่。

คืนหนึ่ง โปรเจกต์ที่ขาดแคลน แพง และจะต้องนําโดยวิศวกรอาวุโส เพื่อเขียนหลักการแรกขึ้นใหม่。

เครื่องมือภายในที่เสียไม่ได้ถูกซ่อมแซม แต่ได้รับการเขียนใหม่เท่านั้น ผลิตภัณฑ์ซาซ่าสไม่ได้ถูกปรับปรุงใหม่ แต่ถูกโคลนใช้ โปรแกรม Rails เก่าที่สับสน。

จํานวน โครงการ ที่ มี การ เสนอ และ ออก แบบ ใหม่ จะ เพิ่ม ขึ้น อย่าง น่า ทึ่ง. แต่งานเขียนพวกนี้ส่วนใหญ่ก็ยังแย่อยู่ดี เพราะมีตัวแปรเป็นพันๆ ที่จะต้องพิจารณา ก่อนที่คุณจะกดปุ่มเขียนใหม่ และเมื่อทุกคนทําอย่างนี้ได้ ตัวแปรเหล่านี้จะชัดเจนขึ้น。

เป็น ที่ ชัดเจน ว่า ใคร จะ ถูก เรียก ให้ มา แก้ ปัญหา。

ความต้องการใหม่ๆ ยังคงต้องการผู้เชี่ยวชาญ

การ ทํา งาน ภาย ใน โครง สร้าง ของ การ ทดสอบ แบบ พื้น ฐาน จะ ถูก กว่า เมื่อ ใกล้ จะ ถึง ความอิ่มสี. ในขณะเดียวกัน ความต้องการของตลาดที่มีต่อผู้เชี่ยวชาญก็เพิ่มขึ้น เพราะจําเป็นอย่างยิ่งที่จะเทียบความจุที่ราคาถูก。

วิศวกรอาวุโสที่ใช้ AI จําเป็นต้องตัดสินรายละเอียดจํานวนมาก เพื่อให้หลักการระดับแรกใหม่เป็นจริง คํา ถาม นี้ ถึง กับ มี คํา ถาม พื้น ฐาน ด้วย ซ้ํา: มี ความ จําเป็น ใด ๆ ไหม สําหรับ การ เขียน ใหม่ นี้

เราควรเขียนมันใหม่ตอนนี้, เขียนใหม่ทีหลังหรือไม่? ควร รวม เอา อะไร เข้า ไว้ ด้วย? ควร เก็บ อะไร ไว้ ใน ห้อง สมุด รหัส ปัจจุบัน? สถาปัตยกรรม, ฐานข้อมูล, เซิร์ฟเวอร์แคช และผู้ให้บริการต่าง ๆ ควรดําเนินต่อหรือไม่ หรือถูกแทนที่ทั้งหมด? เรา ควร ดู ก่อน ไหม ว่า มี กี่ คน ที่ ใช้ สิ่ง ที่ ก่อ ความ เสีย หาย นี้ และ แล้ว ก็ แค่ ลบ มัน ออก? ใคร ทบทวน ผล ขั้น สุด ท้าย? กฎเกณฑ์อะไร? แผนสํารองคืออะไร? ควร เรียก ข้อมูล ที่ มี อยู่ อย่าง ไร

คํา ถาม เหล่า นี้ จะ ดําเนิน ต่อ ไป ใน ระดับ ที่ นับ ไม่ ถ้วน และ คํา ตอบ แต่ ละ ข้อ จะ เปลี่ยน ไป。

วิศวกรอาวุโสจะเข้าสู่ช่องว่างนี้ บาง คน อาจ รู้สึก ไม่ สบาย ใจ อยู่ บ้าง เนื่อง จาก การ ขัด จังหวะ เหล่า นี้ บาง คน จะ สร้าง ระบบ เพื่อ ขัด ขวาง คํา ขอ ดัง กล่าว และ คน อื่น ๆ จะ ใช้ แบบ จําลอง ใหม่ เหล่า นี้ เพื่อ เขียน หลัก การ หลัก การ หลัก ๆ ของ ตน ใหม่ และ จะ ดี กว่า แบบ จําลอง มาก นัก ที่ สามารถ บรรลุ ได้ ภาย ใต้ การ ตอบ สนอง ตาม ปกติ。

วัฏจักรจะเกิดขึ้นอีกครั้ง

และเมื่อนักวิศวกรรมอาวุโสคนปัจจุบัน Benchmark ถูกโจมตีโดยนางแบบ เราจะเปลี่ยนกรอบและวางคะแนนลงอีกครั้ง。

การทดสอบม้านั่งครั้งต่อไป จะไม่เพียง แต่ถาม "คุณสามารถเขียนโปรแกรมนี้ได้หรือไม่" มันถามว่า "คุณตัดสินได้ไหมว่าเมื่อไหร่จะต้องเขียนใหม่" คุณสามารถเลือกช่วงที่ถูกต้องได้ไหม? เราเก็บสิทธิที่ไม่เป็นตัวแปรได้ไหม? เราสามารถจัดการกับกระบวนการอพยพได้หรือไม่ จะ ตัดสิน ได้ ไหม ว่า ผล สุด ท้าย ดี พอ แล้ว

เมื่อวิศวกรอาวุโสเริ่มใช้ AI เพื่อแก้ปัญหาเหล่านี้ โมเดลนี้ก็จะค่อยๆ ดีขึ้นเรื่อยๆ。

แล้วเราจะอยู่ในสภาวะตื่นกลัว : ดูเหมือนว่ารูปแบบตอนนี้สามารถตัดสินว่าควรจะเขียนใหม่หรือไม่! พวกเขาดูเหมือนจะสามารถทํา ทุกอย่างที่วิศวกรอาวุโสทําได้

แต่หลังจากนั้น ชายแดนใหม่ก็จะปรากฏขึ้น นั่นคือพรมแดนที่ไม่เคยชัดเจนมาก่อน เราจะรีเซ็ตการทดสอบม้านั่งอีกครั้ง ความต้องการใหม่จะเกิดขึ้น และกระบวนการจะซ้ําอีกครั้ง。

รูป แบบ นี้ สามารถ เห็น ได้ ทุก ครั้ง ที่ มี การ ทดสอบ ม้านั่ง

มันไม่ใช่แค่เรื่องของวิศวกรอาวุโส แค่ระวัง คุณจะเห็นกลไกเดียวกัน ในการทดสอบม้านั่งเกือบทุกอัน。

ลองทดสอบมาตรฐานจีดีพีของ OpenAI ดูเป็นตัวอย่าง มันประเมินว่า AI ใกล้ชิดกับมนุษย์แค่ไหน ในการมอบหมายงานระดับผู้เชี่ยวชาญ ในสาขาวิชาชีพต่างๆ เช่น เจ้าหน้าที่ผู้ติดตาม ทนาย นักพัฒนาซอฟต์แวร์ เป็นต้น。

งานวิจัยของโอเพนเคไอแสดงให้เห็นว่า จีพีที-5 ได้ถึง หรือเกินระดับความเชี่ยวชาญของมนุษย์ ใน 40.6 เปอร์เซ็นต์ของภารกิจ คลอเดีย โอปุส 4.1 ทําอย่างน่าสะพรึงกลัวกว่าผู้เชี่ยวชาญใน 49 เปอร์เซ็นต์ของภารกิจนี้。

จาก นั้น ก็ มี การ ตั้ง บรรดาศักดิ์ ขึ้น. ยกตัวอย่างเช่น Axios เขียนว่า "เครื่องมือ OpenAI แสดงให้เห็นว่า AI กําลังติดตามผลงานของมนุษย์" และ ฟอร์จูนเขียนว่า " OpenAI's Bootmar Graphyval" รุ่น AI ได้ถึงระดับผู้เชี่ยวชาญเกือบครึ่งของภารกิจ

ผล เหล่า นี้ น่า ประทับ ใจ จริง ๆ. แต่ลองดูกันว่าภารกิจเหล่านี้ใช้อะไร

คุณ ต้อง รับ ผิด ชอบ ใน การ บริหาร สํานักงาน ของ ผู้ บัญชา การ สูง สุด และ ใน เรื่อง การ บริหาร ของ สํานักงาน ข้าหลวง ใหญ่ และ สํานักงาน ข้าหลวง ใหญ่ เพื่อ ความ ก้าว หน้า ของ สตรี.

ที่ จริง มี การ ลง ทุน มาก มาย ใน เรื่อง เชาวน์ ปัญญา ของ มนุษย์ นั่น คือ มี ใคร คน หนึ่ง ได้ กําหนด ปัญหา ให้ เป็น แบบ อย่าง ที่ สามารถ ทํา ให้ สําเร็จ ได้ ก่อน。

งาน หนัก ที่ มนุษย์ ทํา กัน มา ตลอด หลาย ปี นั้น ไม่ ได้ ทํา กัน จริง ๆ ก่อน ที่ ต้น แบบ จะ เริ่ม ตอบ. ความ ถูก ต้อง แม่นยํา ของ เครื่อง บ่ง ชี้ ที่ เจาะจง นี้ ต้อง ได้ รับ การ ตรวจ สอบ และ ทดสอบ ระยะ เวลา แห่ง ความ มั่น ใจ ที่ ถูก ต้อง คือ การ กําหนด ว่า ตัว ชี้ ตัว ไหน ตก อยู่ ภาย ใน พระ บัญชา และ ไม่ อยู่ ใน ตําแหน่ง ใด และ ผล ที่ ได้ นั้น ควร ได้ รับ การ นิยาม ไว้。

ภาย ใน โครง สร้าง ของ คํา ถาม ที่ เหมาะ สม แบบ จําลอง นี้ สามารถ ทํา งาน อาชีพ ให้ สําเร็จ ได้ จริง ๆ. แต่ลองดู, ถ้ามันเป็นคุณ, ผมจะแนะนําว่าแบบจําลองก็เหมือนกัน, มันจะทําอย่างไร

ในบทความเรื่อง GDPWAL บทความแรกของผม ผมเขียนว่า "ผมมอง AI เป็นอย่างดี แต่ถ้าผมอ่านคดีเหล่านี้อย่างถูกต้อง เหตุผลก็คือ เบื้องหลังความสําเร็จเหล่านี้ คือปัญญามากมาย — ชั้นที่มองไม่เห็นของการตัดสินของมนุษย์

และถ้าคุณดูมัน คุณจะพบว่า มีความขัดแย้งของ ซีโน เบื้องหลังทั้งหมดนี้。

AI ของซีโนขัดแย้ง

ในความขัดแย้งของซีโน, เต่าเอาชนะความ เร็วของนักวิ่งกรีซในการแข่งขัน。

เพราะ เต่า ช้า มัน จึง อยู่ ห่าง ๆ. เมื่อ ความ ผิด พลาด วิ่ง ไป ยัง จุด เริ่ม ต้น เต่า ก็ ก้าว หน้า ต่อ ไป อีก เล็ก น้อย; เมื่อ ได้ รับ ความ เสีย หาย จน ถึง ตําแหน่ง ใหม่ เต่า ก็ ขยับ ตัว ได้ อีก. ไม่ว่าสัญญาณจะเร็วแค่ไหน มันมักจะมีระยะทางที่จับได้ และช่องว่างก็จะถูกสร้างขึ้นใหม่。

ในความขัดแย้งของ AI ZINO มนุษย์เราเป็นเต่า ด้วยการเรียนรู้ทางวิวัฒนาการและวัฒนธรรมนับล้านๆ ปี เราก้าวล้ํากว่า AI 50 หลา และ AI ก็ผ่านทั้งหมดนี้ด้วยความเร็วสูง และเริ่มที่จะเข้าหาส้นเท้าของเรา。

อย่าง น้อย ใน ช่วง ไม่ กี่ ปี ที่ ผ่าน ไป เรา สามารถ รักษา ตัว นํา ได้。

แล้ว AGI ล่ะ

ผมคิดว่า แม้ว่า AGI จะมาจริงๆ ยังมีเทคโนโลยี, โครงสร้างและแรงทางเศรษฐกิจที่มีประสิทธิภาพ ที่ช่วยให้ AI ก้าวอยู่เบื้องหลังไม่กี่。

นิยามสําหรับ AGI

อย่างแรก เราต้องให้ AGI นิยามการทํางาน。

ผม เคย คิด ว่า เมื่อ มี เหตุ ผล ทาง เศรษฐกิจ ที่ จะ ทํา ให้ เจ้า หน้าที่ คน หนึ่ง วิ่ง ต่อ ไป เอ จี ไอ ก็ มา ถึง. พูดอีกอย่างคือ เมื่อผมมีระบบถาวร และผมยินดีที่จะจ่าย 7x24 ชั่วโมง ของการคิด การเรียนรู้ และการกระทํา。

เราอยู่ห่างไกลจากที่ แม้ แต่ การ เปิด กฎ ซึ่ง เป็น ระบบ ที่ พร้อม จะ เรียก ตาม หลัก การ แล้ว ก็ ไม่ ได้ ทํา ให้ เกิด สัญลักษณ์ เสมอ ไป。

ผมชอบนิยามนี้ เพราะมันสามารถวัดได้: เราจะให้มันวิ่งต่อไปหรือไม่ ใน ขณะ เดียว กัน มัน มี ความ สามารถ หลาย อย่าง ที่ วัด ได้ ยาก โดย ตรง. ตัว อย่าง ที่ คุ้ม ค่า กับ การ วิ่ง。

ในโลกของเอจีไอ ตามทฤษฎีแล้ว ด้วยงบประมาณและเวลาที่เพียงพอ นางแบบควรจะสามารถปีนและปรับปรุงบนทุกปัญหา เรื่อง นี้ น่า จะ เป็น ภัย คุกคาม อย่าง ใหญ่ หลวง จริง ๆ ต่อ ความ พยายาม ทุก อย่าง。

กรอบไม่ใช่เฟรมเกอร์

แต่แม้กระทั่งรุ่นที่มีประสิทธิภาพของ AGI นี้จะไม่แก้ปัญหา "เฟรมเวิร์ค"。

AGI นี้สามารถเลือกและนํากลับมาใช้ใหม่ในกรอบ, แต่มันยังมุ่งไปที่เป้าหมายที่กําหนด, การเพิ่มแรงจูงใจ, เป้าหมายสามารถเจาะจงได้มาก เช่น "เพิ่มอัตราการเปลี่ยนแปลงของหน้าลงจอดนี้" หรือเป็นนามธรรมมาก เช่น "มองหาแนวคิดทางวิทยาศาสตร์ใหม่ๆ"。

แม้ว่าแบบจําลองสามารถไหลระหว่างกรอบ, ช่องว่างที่เราติดตามอยู่ จะกลับมาอยู่ในระดับที่สูงขึ้น จะ ยัง คง มี โครง สร้าง ใน แอ จี ไอ ซึ่ง มี การ คิด ขึ้น ใน ห้อง ปฏิบัติ การ ใหญ่ ใด ๆ — นั่น คือ มนุษย์ ผู้ ซึ่ง จะ นํา แบบ จําลอง ไป สู่ เป้า หมาย บาง อย่าง。

เพียง เพราะ โครง สร้าง ไม่ ใช่ เครื่อง ปั้น ดิน เผา แบบ เดียว กัน จะ มี การ กล่าว ซ้ํา: AI จะ ทํา ให้ ความ สามารถ ที่ ได้ รับ การ ปั้น มา นั้น ถูก ต้อง ใน วัน นี้; คน เรา จะ ใช้ มัน สําหรับ ฉาก อื่น ๆ อีก; ผล ที่ เกิด ขึ้น จะ มี อุดม สมบูรณ์ อย่าง ยิ่ง; ผู้ เชี่ยวชาญ จะ ย้าย ไป ยัง ขอบ ใหม่ เพื่อ ตัดสิน ว่า อะไร สําคัญ ณ จุด นี้; การ ตัดสิน ของ พวก เขา จะ สร้าง กรอบ ถัด ไป; และ แบบ จําลอง จะ เพิ่ม ขึ้น เรื่อย ๆ。

เมื่อเราเห็น AI ทําอะไรบางอย่างใหม่ ความรู้สึกตื่นตระหนกนั้นกลับมาเป็นสิ่งเดียวกันเสมอ เราสร้างกรอบ เราดูโมเดลปีนขึ้นไป。

เมื่อเราดูที่การทดสอบม้านั่ง และเปรียบเทียบด้วยความสามารถของมนุษย์ เรากลับสับสนจริง ๆ กับ "เฟรมเวิร์ค" และ "พนักงานเฟรมเวิร์ค" คะแนนบอกเราว่าโมเดลนี้ดีแค่ไหน ในกรอบที่เราจัดขึ้น มันไม่ได้หมายความว่าโมเดลนี้กลายมาเป็นเรา。

นี่เป็นขอบเขตที่ผิดพลาด เบื้องหลังความตื่นตระหนก เราชี้ไปยังชายแดนล่าสุดที่เราวาด แล้วเมื่อนางแบบปีนข้ามชายแดนนี้ เราคิดว่ามันตามล่าเรา แต่มันก็แค่กรอบ ไม่ใช่เฟรมเกอร์。

ความผิดพลาดก็คือ เราต้องการบางอย่างเป็นพิเศษ และเราอยากบอกว่า ฉลาดคือการทดสอบม้านั่ง แต่ ปัญหา ก็ คือ เมื่อ มี อะไร บาง อย่าง ที่ เฉพาะ เจาะจง พอ ที่ จะ ใช้ ได้ แล้ว ก็ เป็น การ เจาะจง พอ ที่ จะ ถูก ปรับ ให้ เหมาะ สม และ ปีน ขึ้น ได้。

โครงร่างนี้จําเป็น มันทําให้เราจับโลกและรับมือกับมัน แต่โครงร่างนี้ก็ถูกแช่แข็งด้วย และเป็นพื้นที่ท้องถิ่นด้วย และมันสามารถถูกปรับให้เหมาะสมที่สุด。

กล่อง เฟรมเกอร์ยังคงติดต่อกับสิ่งที่กรอบต้องละทิ้ง นั่นคือสถานการณ์ทั้งหมด ที่ปรากฏกับเขา ในทุกช่วงเวลา。

แล้ว "สถานการณ์สมบูรณ์" คืออะไร? ทันทีที่คุณเริ่มพูดถึงสถานการณ์ทั้งหมด คุณก็เริ่มเปิดโครงร่างใหม่แล้ว คุณไม่สามารถบอกได้ว่ามันคืออะไร แต่มันมีอยู่จริง เพราะคุณมีตัวตน。

ไม่มีชื่อเรื่อง

จนถึงตอนนี้ เจ้าหน้าที่ที่เราสร้าง และคนที่ AI กําลังสร้าง มี สอง แนว คิด ที่ เกี่ยว ข้อง กัน ซึ่ง มัก มี การ ผสม ผสาน กัน: หน่วย งาน ซึ่ง หมาย ถึง ความ สามารถ ที่ จะ ปฏิบัติ อย่าง เป็น เอกเทศ; และ ตัว แทน ซึ่ง พาด พิง ถึง บุคคล หรือ สิ่ง ต่าง ๆ ที่ ทํา เพื่อ คน อื่น. จนถึงตอนนี้ AI เป็นอันสุดท้าย。

แน่นอน พวก เขา มี ความ เป็น อิสระ อยู่ แล้ว ที่ จะ ทํา งาน ที่ ได้ รับ มอบ หมาย แม้ ว่า งาน นั้น อาจ ใช้ เวลา หลาย ชั่วโมง หรือ แม้ แต่ วัน. แต่ พวก เขา ยัง คง เป็น เพียง วิธี ที่ จะ บรรลุ เป้า หมาย บาง อย่าง ของ มนุษย์. และทั้งอุตสาหกรรมคือการลงทุนหลายพันล้านดอลลาร์ และนั่นคือสิ่งที่ทําให้มันดีขึ้น。

สภาพ การณ์ จะ ไม่ เปลี่ยน ไป โดย สิ้น เชิง นอก จาก ว่า สัก วัน หนึ่ง จะ จบ ลง ใน ตัว มัน เอง — การ มุ่ง ติด ตาม เป้า หมาย ของ ตน เอง, การ เปลี่ยน ไป ระหว่าง เป้า หมาย ต่าง ๆ กับ การ ตัดสิน ใจ ว่า จะ ทํา อะไร โดย ไม่ หมาย พึ่ง เจตจํานง ของ มนุษย์ คน ใด ๆ, โดย การ กล่าว ถึง, และ แม้ แต่ คํา สัญญา เหล่า นั้น. ไม่ว่ามันจะก้าวหน้าแค่ไหน。

ถ้าคุณใช้เวลา 10 นาทีกับเด็กคนหนึ่ง มันชัดเจนว่า แม้แต่นางแบบที่มีอํานาจมากที่สุด ก็ยังมีสารเล็กๆ。

ใน เกือบ ทุก งาน ที่ เรา เอา ใจ ใส่ เด็ก เล็ก ๆ ไม่ ใช่ แบบ จําลอง การ พูด ภาษา. เด็ก ๆ ไม่เขียนรหัส อย่าสรุปตารางคํานวณ อย่าร่าง memorandums ยุทธศาสตร์และไม่ผ่านการตรวจสอบระดับปริญญาตรี อย่าง ไร ก็ ตาม ใน อีก แง่ หนึ่ง เด็ก เล็ก ๆ อยู่ เหนือ รุ่น มาก จน เกือบ จะ รู้สึก อึดอัด. เพราะเด็กเล็กมีเป้าหมายของตัวเอง。

เด็กๆอยากจะจับบอลลูนสีแดง เขาต้องการที่จะวางบอลลูนสีแดง ในด้านหน้าของพัดลมและดูว่าสิ่งที่เกิดขึ้น เขาต้องการติดบอลลูนสีแดงด้วยส้อม เขาต้องการที่จะติดมันออกนอกหน้าต่าง เขาต้องการเห็นว่าคุณสามารถหัวเราะโกรธหรือเข้าร่วม เขายังคงคิดค้นเกม และเปลี่ยนโลกให้เป็นห้องทดลอง เขาไม่ได้รอการกระตุ้นและเขา destimring การทดสอบม้านั่งเว้นแต่ว่ามันจะคุ้มค่าในมุมมองของเขา。

แน่นอนคุณสามารถพยายามที่จะให้เขาคําใบ้ แต่ขอให้โชคดีกับผลลัพธ์ที่คาดเดาได้ เด็ก เล็ก ๆ อาศัย อยู่ ใน ห้วง แห่ง ความ ปรารถนา, ความ สนใจ, ความ ข้อง ขัดใจ, ความ สุข, ความ กลัว, การ เลียน แบบ และ การ เล่น。

ตัว แทน คน นี้ อาจ มี ความ ชํานาญ มาก ขึ้น เรื่อย ๆ ใน การ มุ่ง ติด ตาม เป้า หมาย. แม้ แต่ หลัง จาก ที่ เรา ได้ ระบุ เป้า หมาย ของ เรา แล้ว สิ่ง เหล่า นั้น ก็ สามารถ ช่วย เรา ขัด เกลา. พวกเขามีประกายแห่งพฤติกรรมเหมือนเด็ก เช่นเกม ความเบื่อหน่าย และการก่อกบฏ。

แต่ เนื่อง จาก ใน ที่ สุด สิ่ง เหล่า นี้ จึง ถูก สร้าง ขึ้น และ จัด ระเบียบ เพื่อ ประโยชน์ ของ มนุษยชาติ ไม่ ว่า จะ เป็น เศรษฐกิจ หรือ สิ่ง อื่น ๆ พวก เขา จึง จะ ถูก ยับยั้ง ไว้ จน ถึง จุด ที่ ไม่ ได้ รับ ใช้ วัตถุ ประสงค์ ของ มนุษย์ ใน การ ใช้ สิ่ง เหล่า นั้น。

นี่คือสาเหตุที่คําว่า "ตัวแทน" ถูกเข้าใจผิดได้ง่ายๆ โมเดลนี้มีความสามารถในการเพิ่มความจุ สําหรับการลงมืออัตโนมัติ แต่ ใน ความ หมาย ของ มนุษย์ เรื่อง นี้ ไม่ ใช่ แค่ การ กระทํา. มันยังหมายถึงความต้องการสําหรับตัวคุณเอง และเล่นเพื่อความสนุก และการเชื่อฟังและมีประโยชน์ของโมเดลนั้น พื้นฐานแล้วขัดกับแนวคิดนั้น ด้วย เหตุ นี้ แม้ แต่ ขณะ ที่ ตัว อย่าง ยัง คง ก้าว หน้า ต่อ ไป ก็ ยัง มี ช่อง ว่าง ระหว่าง ตัว อย่าง กับ มนุษย์。

กลับไปที่เซโน

และที่นี่ AI'S ZENO ขัดแย้งเริ่มที่จะสลายลง มันเป็นการทดลองทางชีววิทยาที่สับสน เราเปรียบเทียบ: เอไอแข่งกับเรา กัดส้นเท้าของเรา。

คุณให้แบบจําลองทันที มันเริ่มใช้เกมที่คุณเคยเล่นคนเดียว โมเดลเคลื่อนไหวเร็วมาก มันแข็งแรง ไม่ขันแข็ง และแบกความรู้สึกแปลกของอินทรีย์ นี่ยิ่งสําคัญกับคุณมากขึ้น คุณไม่ได้แข่งรถ แต่ไม่เหมือนสิ่งนี้ มันทําให้คุณรู้สึกใกล้ชิดกับตัวเอง。

คุณนั่งอยู่ตรงนั้น ดูสัญลักษณ์ แทบจะสะกดจิต จากนั้นคุณก็เริ่มคิดว่า คุณกําลังวิ่งไปรอบๆในเกมนี้ และตัวตนของผีนั้น。

และโดยไม่ได้ตระหนักถึงมัน โมเดลอยู่ในด้านหน้า คุณเริ่มเหงื่อออก。

จากนั้นเกมก็จบลงแล้ว。

คุณ แทบ จะ รู้สึก ว่า กล้าม เนื้อ ของ คุณ เริ่ม หด ตัว. พวกเขาดูเหมือนจะไร้ประโยชน์ ในใบหน้าของเครื่องจักรจําลองนี้ของคุณ ของทุกคนที่คุณรู้จัก ผีตนหนึ่งไล่ตามคนอื่นแล้วชนะ。

แต่แล้วบางสิ่งบางอย่างที่แปลกที่เกิดขึ้น โมเดลหันไปที่คุณ ในกล่องข้อความว่าง เคอร์เซอร์แฟลชด้วยความคาดหวัง。

มันรออยู่。

จบ

แร็บบิ ฮาโนค เล่าเรื่องของคนโง่มาก่อน เขาตื่นขึ้นมาทุกเช้า และหาเสื้อผ้าของตัวเองได้ยาก เขาจึงกลัวที่จะไปนอน ก่อนที่เขาจะไปนอนในเวลากลางคืนและคิดว่าเขาจะตื่นขึ้นมาในวันถัดไปอีกครั้ง。

หมายเหตุ: "รับบี" เป็นครูสอนศาสนาชาวยิว ล่ามและที่ปรึกษาด้านกฎหมาย คล้ายกับ "ครู" หรือ "ผู้นําศาสนา" ในประเพณียิว。

คืน หนึ่ง ใน ที่ สุด เขา ตั้งใจ จะ เอา กระดาษ และ ปากกา ออก มา ขณะ ที่ ถอด เสื้อ ผ้า ออก และ บันทึก ไว้ อย่าง ถูก ต้อง แม่นยํา ว่า เขา ได้ เอา เสื้อ ผ้า ทุก ชิ้น ไป ใส่ ไว้ ที่ ไหน。

เช้าวันต่อมาเขาเอาโน้ตที่มีความพอใจที่ดีและเริ่มอ่าน : "มือ" ซึ่งเขาจึงใส่มันบนหัวของเขา"Pants มีดังนั้นเขาจึงสวมมัน นั่นแหละ เขาแต่งตัวเป็นชิ้นเดียว ตามบันทึก。

"มันขวาทั้งหมด"เขากล่าวว่า"แต่ตอนนี้ที่ฉัน?"

"ฉันอยู่ที่ไหน"

เขาตามหามันมานานแล้ว แต่มันไร้ประโยชน์ เขาหาตัวเองไม่เจอ。

"เราเกินไป"รับบีกล่าวว่า。

(หัวเราะ)ส่วนเชื่อมโยงดั้งเดิม]

ความขัดแย้งเรื่องอัตโนมัติ ยิ่งปัญญาประดิษฐ์แข็งแรง มนุษย์ก็ยิ่งยุ่ง