OPENAI |
นักวิจัยจาก University of California, Berkeley (UC Berkeley) และ Google ได้สร้างปัญญาประดิษฐ์ (AI) ที่สามารถตรวจสอบได้ว่าจะให้ความรู้แก่ตนเองได้ดีที่สุดอย่างไร ในการทดลองหนึ่งนักวิทยาศาสตร์ได้ทดสอบเอเจนต์ AI ที่สสมารถหาเส้นทางในตารางสองมิติที่เต็มไปด้วยบล็อกเพื่อไปถึงปลายทางได้อย่างรวดเร็ว เอเจนต์ปรับปรุงความสามารถของตัวเองผ่านการเรียนรู้แบบเสริมกำลัง (reinforcement learning) โดยใช้วิธี PAIRED นักวิจัยได้จับคู่ AI ที่จัดเป็นตัวเอก (protagonist) กับ AI ที่เกือบเท่าเทียมกับตัวเอก แต่มีจุดแข็งที่ต่างกัน ที่อาจเรียกว่าเป็นคู่ปรับ (antagonist) จากนั้น AI ตัวที่สามจะออกแบบสภาพแวดล้อมที่เอื้อให้คู่ปรับแก้ได้ง่าย แต่ไม่ได้เอื้อกับตัวเอก ด้วยการฝึกฝนจากการทดลองในหลาย ๆ ครั้ง พบว่าตัวเอกที่ได้รับการฝึกแบบนี้ สามารถแก้ปัญหาเขาวงกตที่มีความซับซ้อนได้ 1 ใน 5 แต่ถ้าฝึกด้วยวิธีเดิม (ไม่มี AI ตัวที่สามมาออกแบบสภาพแวดล้อม) จะแก้ปัญหาไม่ได้เลย
อ่านข่าวเต็มได้ที่: Science
ไม่มีความคิดเห็น:
แสดงความคิดเห็น