วันจันทร์ที่ 5 ธันวาคม พ.ศ. 2565

นักวิจัยสอน AI ให้เล่น Minecraft ทำไม

city-simulation
Photo by Steve Johnson on Unsplash

OpenAI ได้พัฒนาบอทสำหรับเล่น Minecraft ที่สามารถสร้างเครื่องมือและสิ่งปลูกสร้างในเกมที่ต้องใช้การทำงานต่อเนื่องกันมากกว่า 20,000 ครั้งผ่านการผสมผสานระหว่างการเลียนแบบและการเรียนรู้แบบเสริมแรง (reinforcement learning) 

บอทที่ได้รับการฝึกฝนจากการเล่นเกมของมนุษย์กว่า 70,000 ชั่วโมง สร้าง "diamond tools" เสร็จเป็นคนแรก ซึ่งเครื่องมือนี้โดยเฉลี่ยผู้เล่นที่เป็นคนจะใช้เวลา 20 นาทีและทำงานต่อเนื่องกัน 24,000  ขั้นตอนในการสร้าง

การเรียนรู้ด้วยการเลียนแบบในให้แต่ละขั้นตอนจริง ๆ แล้วต้องมีคนเป็นเขียนป้ายกำกับ (label) เพื่ออธิบาย แต่นักวิจัยใช้โครงข่ายประสาทเทียมต่างหากอีกตัวหนึ่งในการทำงานดังกล่าว โดยโครงข่ายประสาทเทียมนี้ได้รับการฝึกฝนไว้ก่อนหน้าจากการดูวีดีโอ

นักวิจัยกล่าวว่าการใช้การเลียนแบบและการเรียนรู้แบบเสริมแรงร่วมกัน สามารถปูทางสำหรับความก้าวหน้าในยานยนต์ที่ขับเคลื่อนด้วยตัวเองและการวิจัยนิวเคลียร์ฟิวชัน

อ่านข่าวเต็มได้ที่: Popular Science

ไม่มีความคิดเห็น:

แสดงความคิดเห็น