วันอังคารที่ 19 กันยายน พ.ศ. 2566

ทำไมญี่ปุ่นถึงพัฒนา ChatGPT ของตัวเอง

Fugaku-Supercomputer
ภาพจาก Nature

รัฐบาลญี่ปุ่น บริษัทเทคโนโลยีขนาดใหญ่ของญี่ปุ่น และนักวิจัยในญี่ปุ่นกำลังทำงานเพื่อสร้าง ChatGPT เวอร์ชันที่มีตัวแบบภาษาขนาดใหญ่ (large language model) หรือ LLM ที่ใช้ภาษาญี่ปุ่น

LLM ที่ได้รับการฝึกอบรมโดยใช้ชุดข้อมูลในภาษาอื่นไม่ได้คำนึงถึงความแตกต่างในระบบตัวอักษร โครงสร้างประโยค และวัฒนธรรม

Tokyo Institute of Technology, Tohoku University, Fujitsu และ RIKEN กลุ่มศูนย์วิจัยที่ได้รับทุนสนับสนุนจากรัฐบาล กำลังร่วมมือกันในการสร้าง LLM ของญี่ปุ่นโดยใช้ซูเปอร์คอมพิวเตอร์ Fugaku LLM ซึ่งมีกำหนดเปิดตัวในปีหน้า อาจมีพารามิเตอร์อย่างน้อย 3 หมื่นล้านตัว

ในขณะเดียวกัน LLM ที่ได้รับทุนสนับสนุนจากกระทรวงศึกษาธิการ วัฒนธรรม กีฬา วิทยาศาสตร์ และเทคโนโลยีของญี่ปุ่นสามารถเริ่มต้นด้วยพารามิเตอร์แสนล้านตัว และเพิ่มขึ้นได้เมื่อเวลาผ่านไป

Shotaro Kinoshita จาก  Keio University School of Medicine กล่าวว่าการพัฒนา ChatGPT เวอร์ชันภาษาญี่ปุ่นที่แม่นยำอาจมี "ผลกระทบเชิงบวกต่อการวิจัยร่วมระหว่างประเทศ"

อ่านข่าวเต็มได้ที่: Nature

วันจันทร์ที่ 18 กันยายน พ.ศ. 2566

การเรียนรูัของเครื่องจัดการชุดข้อมูลขนาดมหาศาล

out-of-memory-algorithm
ภาพจาก Los Alamos National Laboratory

อัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) ที่พัฒนาขึ้นที่ Los Alamos National Laboratory (LANL) ของกระทรวงพลังงานสหรัฐฯ (DOE) สามารถระบุและแบ่งคุณลักษณะสำคัญของชุดข้อมูลขนาดใหญ่ออกเป็นชุดที่สามารถจัดการได้

นักวิจัยได้ทดสอบอัลกอริทึมบนซูเปอร์คอมพิวเตอร์ Summit ที่ห้องปฏิบัติการแห่งชาติ Oak Ridge ของ DOE โดย Ismael Boureima จาก LANL กล่าวว่า "เราได้พัฒนาวิธี 'หน่วยความจำไม่เพียงพอ' สำหรับวิธีการแยกตัวประกอบเมทริกซ์ที่ไม่เป็นลบ ซึ่งช่วยให้คุณสามารถแยกตัวประกอบชุดข้อมูลขนาดใหญ่กว่าที่เคยทำได้บนฮาร์ดแวร์ที่กำหนด"

อัลกอริทึมถ่ายโอนข้อมูลระหว่างคอมพิวเตอร์ได้อย่างมีประสิทธิภาพโดยเร่งความเร็วในการคำนวณและเชื่อมต่ออย่างรวดเร็วโดยใช้ฮาร์ดแวร์ เช่น หน่วยประมวลผลกราฟิก (GPU) ในขณะที่ทำงานหลายอย่างพร้อมกัน

นักวิจัยของ LANL ใช้อัลกอริทึมในการประมวลผลเมทริกซ์หนาแน่น (desnse matrix) 340 เทราไบต์ และเมทริกซ์กระจัดกระจาย (sparse matrix) 11 เอ็กซาไบต์ ด้วย GPU 25,000 ตัว

อ่านข่าวเต็มได้ที่: Los Alamos National Laboratory

วันอาทิตย์ที่ 17 กันยายน พ.ศ. 2566

Kotlin ขึ้นสู่ 20 อันดับแรกของ Tiobe

balloons
ภาพจาก  InfoWorld

Kotlin ซึ่งเป็นภาษาทางเลือกแทน Java ของ JetBrains ได้เข้าสู่ดัชนีความนิยมภาษาโปรแกรมรายเดือนของ Tiobe โดยอยู่ในอันดับที่ 20 ด้วยคะแนน 0.90% ในเดือนกันยายน

การจัดอันดับคำนวณโดยใช้สูตรที่คำนึงถึงจำนวนวิศวกร หลักสูตร และหน่วยงานที่ใช้แต่ละภาษาโดยอิงจากข้อมูลเครื่องมือค้นหายอดนิยม 10 อันดับแรกของ Tiobe ในเดือนกันยายน ได้แก่ Python, C, C++, Java, C#, JavaScript, Visual Basic, PHP, ภาษา Assembly และ SQL

ในขณะเดียวกัน 10 อันดับแรกในดัชนี Pypl Popularity of Programming Language ฉบับเดือนกันยายน ซึ่งวัดการค้นหาบทช่วยสอนภาษาของ Google ได้แก่ Python, Java, JavaScript, C#, C/C++, PHP, R, TypeScript, Swift และ Objective-C

อ่านข่าวเต็มได้ที่: InfoWorld

วันเสาร์ที่ 16 กันยายน พ.ศ. 2566

คอมพิวเตอร์ที่ใช้ DNA สามารถทำงานกับโปรแกรมได้เป็นแสนล้านโปรแกรม

DNA-strand
ภาพจาก New Scientist

นักวิจัยจากมหาวิทยาลัย Shanghai Jiao Tong (SJTU) ของจีน และ Chinese Academy of Sciences ได้พัฒนาคอมพิวเตอร์เหลวที่สามารถรันโปรแกรมต่างๆ มากกว่าแสนล้านโปรแกรมโดยใช้สาย DNA

นักวิจัยได้รวมโมเลกุล DNA สั้น ๆ เข้ากับวงจรที่ทำหน้าที่เป็นเหมือนสายสัญญาณ และสั่งให้พวกมันสร้างโครงสร้างที่แตกต่างกัน

การเพิ่มโมเลกุลขนาดสั้นต่างๆ ลงในหลอดที่เต็มไปด้วยสาย DNA ช่วยให้อาร์เรย์เกท DNA ที่โปรแกรมได้ (DNA-based programmable gate array ) หรือ DPGA แต่ละตัวสามารถติดตั้งวงจรที่แตกต่างกันได้ 

มีการทดลองครั้งหนึ่งที่ใช้การออกแบบ DPGA สำหรับการจำแนกและเลือกโมเลกุล RNA ขนาดเล็กที่เกี่ยวข้องกับมะเร็งไตประเภทหนึ่ง ซึ่งการทดลองนี้จัดว่าเป็นการบุกเบิกวิธีการทางธรรมชาติสำหรับ "การวินิจฉัยโรคอย่างชาญฉลาดสำหรับโรคประเภทต่างๆ" Fei Wang จาก SJTU กล่าว

อ่านข่าวเต็มได้ที่: New Scientist


วันศุกร์ที่ 15 กันยายน พ.ศ. 2566

ตัวแบบ AI เพิ่มความเร็วของคอมพิวเตอรฺวิทัศน์แบบความละเอียดสูง

MIT-AI-Computer-Vision
ภาพจาก MIT News

ทีมงานนานาชาติที่นำโดยนักวิจัยจาก Massachusetts Institute of Technology (MIT) ได้พัฒนาชุดตัวแบบคอมพิวเตอร์วิทัศน์ (computer vision) ที่สามารถดำเนินการแบ่งส่วนความหมาย (จัดหมวดหมู่แต่ละพิกเซลในภาพความละเอียดสูง) ในแบบเรียลไทม์ด้วยทรัพยากรฮาร์ดแวร์ที่จำกัด

ซีรีส์ใหม่ของตัวแบบที่มีชื่อว่า EfficientViT สามารถบรรลุความแม่นยำเท่าเดิมหรือดีกว่า และเร็วกว่าตัวแบบการแบ่งส่วนความหมายที่ล้ำสมัยที่มีอยู่ถึงเก้าเท่า เนื่องจากฟังก์ชันความคล้ายคลึงกันเชิงเส้นและสถาปัตยกรรมที่เป็นมิตรต่อฮาร์ดแวร์

ด้วยการจัดเรียงลำดับการดำเนินการใหม่ EfficientViT สามารถลดการคำนวณทั้งหมดได้ โดยไม่สูญเสียฟังก์ชันการทำงานหรือสูญเสียฟิลด์รับสัญญาณส่วนกลาง

Song Han จาก MIT กล่าวว่า "เราสามารถได้รับสิ่งที่ดีที่สุดจากทั้งสองโลก และลดการประมวลผลลงเพื่อให้เร็วพอที่จะรันบนอุปกรณ์พกพาและอุปกรณ์คลาวด์" ตัวแบบดังกล่าวสามารถช่วยเพิ่มประสิทธิภาพการตัดสินใจแบบเรียลไทม์ของรถยนต์ขับเคลื่อนอัตโนมัติ

อ่านข่าวเต็มได้ที่: MIT News