Photo by Steve Johnson on Unsplash |
OpenAI ได้พัฒนาบอทสำหรับเล่น Minecraft ที่สามารถสร้างเครื่องมือและสิ่งปลูกสร้างในเกมที่ต้องใช้การทำงานต่อเนื่องกันมากกว่า 20,000 ครั้งผ่านการผสมผสานระหว่างการเลียนแบบและการเรียนรู้แบบเสริมแรง (reinforcement learning)
บอทที่ได้รับการฝึกฝนจากการเล่นเกมของมนุษย์กว่า 70,000 ชั่วโมง สร้าง "diamond tools" เสร็จเป็นคนแรก ซึ่งเครื่องมือนี้โดยเฉลี่ยผู้เล่นที่เป็นคนจะใช้เวลา 20 นาทีและทำงานต่อเนื่องกัน 24,000 ขั้นตอนในการสร้าง
การเรียนรู้ด้วยการเลียนแบบในให้แต่ละขั้นตอนจริง ๆ แล้วต้องมีคนเป็นเขียนป้ายกำกับ (label) เพื่ออธิบาย แต่นักวิจัยใช้โครงข่ายประสาทเทียมต่างหากอีกตัวหนึ่งในการทำงานดังกล่าว โดยโครงข่ายประสาทเทียมนี้ได้รับการฝึกฝนไว้ก่อนหน้าจากการดูวีดีโอ
นักวิจัยกล่าวว่าการใช้การเลียนแบบและการเรียนรู้แบบเสริมแรงร่วมกัน สามารถปูทางสำหรับความก้าวหน้าในยานยนต์ที่ขับเคลื่อนด้วยตัวเองและการวิจัยนิวเคลียร์ฟิวชัน
อ่านข่าวเต็มได้ที่: Popular Science
ไม่มีความคิดเห็น:
แสดงความคิดเห็น