วันอังคารที่ 1 สิงหาคม พ.ศ. 2566

Llama และ chatGPT ไม่ได้เปิดเผยโค้ดต้นฉบับ

llama-in-a-cage
ภาพจาก  IEEE Spectrum

นักวิจัยที่ Radboud University ของเนเธอร์แลนด์ได้ประเมินตัวแบบภาษาขนาดใหญ่ (large language model) หรือ LLM ทั้งหมด  21 ตัวซึ่งระบุว่าเปิดเผยโค้ดต้นฉบับ (open source)  และได้เรียนรู้ว่าแบบจำลองส่วนใหญ่มีความเปิดจำกัดกว่าที่ระบุไว้อย่างมาก

นักวิจัยพบว่า ChatGPT ของ OpenAI ทำคะแนนได้แย่ที่สุดสำหรับความเปิดกว้าง โดยติดป้ายว่า "ปิด" ในการประเมินทั้งหมด ยกเว้น model card และ preprint ซึ่งได้รับสถานะ "บางส่วน"

Llama 2 ของ Meta เป็น LLM ที่ทำคะแนนได้แย่ที่สุดเป็นอันดับสอง แม้ว่าบริษัทสื่อสังคมออนไลน์จะอ้างว่าการเปิดตัวนี้มีจุดมุ่งหมายเพื่อทำให้ตัวแบบ "เข้าถึงได้สำหรับบุคคลทั่วไป ผู้สร้าง นักวิจัย และธุรกิจ เพื่อให้พวกเขาสามารถทดลอง สร้างสรรค์ และปรับขนาดความคิดของตนอย่างมีความรับผิดชอบ"

แม้ว่าตัวแบบที่มีขนาดเล็กกว่าและมุ่งเน้นการวิจัยจะเปิดกว้างกว่า ChatGPT หรือ Llama 2 แต่นักวิจัยกล่าวว่ามีเพียงไม่กี่รุ่นที่เปิดเผยการเรียนรู้เสริมกำลังด้วยฟังก์ชันป้อนกลับของมนุษย์ในรายละเอียดที่เพียงพอ และตัวแบบส่วนใหญ่ไม่ได้รับการตรวจสอบแบบ peer review

อ่านข่าวเต็มได้ที่: IEEE Spectrum

ไม่มีความคิดเห็น:

แสดงความคิดเห็น