วันศุกร์ที่ 22 กันยายน พ.ศ. 2566

นวัตกรรมการเรียนรู้ของเครื่องลดการใช้พลังงานคอมพิวเตอร์

mainframe
ภาพจาก WSU Insider

กรอบ (framework) การเรียนรู้ของเครื่อง (machine learning) ที่พัฒนาโดยนักวิจัยจาก Washington State University (WSU) และ Intel สามารถจัดการการใช้พลังงานเพื่อลดการใช้พลังงานในโปรเซสเซอร์คอมพิวเตอร์แบบมัลติคอร์

นักวิจัยได้ออกแบบอัลกอริธึมเพื่อเลือกระดับแรงดันไฟฟ้าและความถี่สำหรับคลัสเตอร์ต่างๆ ของโปรเซสเซอร์ 64 คอร์ เฟรมเวิร์กที่ปรับขนาดได้ได้เรียนรู้เพื่อเพิ่มประสิทธิภาพการจัดการพลังงานโดยไม่ลดประสิทธิภาพการทำงานของโปรเซสเซอร์หลายตัว ทำให้ประหยัดพลังงานได้สูงสุดถึง 60%

Jana Doppa จาก WSU กล่าวว่านวัตกรรมนี้ได้รับการออกแบบมาสำหรับระบบคอมพิวเตอร์ในอนาคตที่โปรเซสเซอร์อาจมีมากถึง 1,000 คอร์ อย่างไรก็ตามมันสามารถนำไปใช้กับระบบฝังตัวที่มีขนาดเล็กมากด้วย

อ่านข่าวเต็มได้ที่: WSU Insider

วันพฤหัสบดีที่ 21 กันยายน พ.ศ. 2566

การสร้างตัวแบบพฤติกรรมโซเชียลมีเดียเพื่อสู้กับข้อมูลที่ผิดพลาด

social-medai-icons
Photo by Alexander Shatov on Unsplash


นักวิจัยที่นำโดย Alexander Nwala ของ  College of William and Mary ได้เปิดตัว Behavioral Languages for Online Characterization (BLOC) ซึ่งเป็นกรอบภาษาสากลสำหรับการสร้างแบบจำลองพฤติกรรมโซเชียลมีเดีย

Nwala และเพื่อนร่วมงานที่ Indiana University Observatory on Social Media ออกแบบ BLOC เพื่อต่อสู้กับข้อมูลที่ผิดในเชิงรุกโดยจัดให้มีภาษาท้องถิ่นสำหรับการอธิบายพฤติกรรมของโซเชียลมีเดีย โดยทำให้การกระทำที่อาจเป็นอันตรายสามารถจดจำได้ง่ายขึ้น

Nwala กล่าวว่านักวิจัยสุ่มตัวอย่างโพสต์จากบัญชีโซเชียลมีเดียที่ระบุภายในระยะเวลาที่กำหนด และใช้ตัวอักษรเฉพาะเพื่อเข้ารหัสข้อมูล

BLOC รวบรวมพฤติกรรมของผู้ใช้ในลักษณะที่สามารถปรับให้เข้ากับแพลตฟอร์มโซเชียลมีเดียต่าง ๆ ได้อย่างง่ายดายผ่านพฤติกรรม และอักขระที่ใช้ในเนื้อหา

Nwala กล่าวว่า "เราสร้างแบบจำลองที่จับภาพเครื่องจักรและพฤติกรรมของมนุษย์ จากนั้นเราจะค้นหาว่าบัญชีที่ไม่รู้จักนั้นใกล้กับมนุษย์หรือเครื่องจักรมากกว่า"

อ่านข่าวเต็มได้ที่: William & Mary News

วันพุธที่ 20 กันยายน พ.ศ. 2566

เครื่องมือเจาะทะลวงโฆษณาที่โจมตีโดยใช้วิศวกรรมสังคม

pop-up-ad-blocker
ภาพจาก  Georgia Tech Research

Trident ซึ่งพัฒนาโดยนักวิจัยที่ Georgia Institute of Technology (Georgia Tech) คือโปรแกรมเสริมที่เข้ากันได้กับ Google Chrome ซึ่งสามารถบล็อกโฆษณาออนไลน์ที่ใช้วิศวกรรมสังคมได้ โดยที่นักวิจัยอธิบายว่ามีประสิทธิภาพเกือบสมบูรณ์

Zheng Yang จาก Georgia Tech กล่าวว่า "เป้าหมายคือการระบุโฆษณาที่น่าสงสัยซึ่งมักจะนำผู้ใช้ไปยังเว็บไซต์ที่เป็นอันตรายหรือกระตุ้นให้มีการดาวน์โหลดซอฟต์แวร์ที่ไม่พึงประสงค์ Trident ทำงานภายในเครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ของ Chrome และใช้ AI ที่ซับซ้อนเพื่อประเมินภัยคุกคามที่อาจเกิดขึ้น"

นักวิจัยสร้าง Trident โดยใช้ชุดข้อมูลที่รวบรวมจากเว็บไซต์กว่า 100,000 แห่ง ซึ่งช่วยระบุการโจมตี 1,479 ครั้ง ครอบคลุมการโจมตีทางวิศวกรรมสังคม 6 ประเภททั่วไปที่เจอบนเว็บ

Trident มีอัตราการตรวจจับโฆษณาที่เป็นอันตรายที่เกือบจะสมบูรณ์แบบตลอดระยะเวลาหนึ่งปี โดยให้อัตราผลบวกลวงเพียง 2.57%

อ่านข่าวเต็มได้ที่: Georgia Tech Research

วันอังคารที่ 19 กันยายน พ.ศ. 2566

ทำไมญี่ปุ่นถึงพัฒนา ChatGPT ของตัวเอง

Fugaku-Supercomputer
ภาพจาก Nature

รัฐบาลญี่ปุ่น บริษัทเทคโนโลยีขนาดใหญ่ของญี่ปุ่น และนักวิจัยในญี่ปุ่นกำลังทำงานเพื่อสร้าง ChatGPT เวอร์ชันที่มีตัวแบบภาษาขนาดใหญ่ (large language model) หรือ LLM ที่ใช้ภาษาญี่ปุ่น

LLM ที่ได้รับการฝึกอบรมโดยใช้ชุดข้อมูลในภาษาอื่นไม่ได้คำนึงถึงความแตกต่างในระบบตัวอักษร โครงสร้างประโยค และวัฒนธรรม

Tokyo Institute of Technology, Tohoku University, Fujitsu และ RIKEN กลุ่มศูนย์วิจัยที่ได้รับทุนสนับสนุนจากรัฐบาล กำลังร่วมมือกันในการสร้าง LLM ของญี่ปุ่นโดยใช้ซูเปอร์คอมพิวเตอร์ Fugaku LLM ซึ่งมีกำหนดเปิดตัวในปีหน้า อาจมีพารามิเตอร์อย่างน้อย 3 หมื่นล้านตัว

ในขณะเดียวกัน LLM ที่ได้รับทุนสนับสนุนจากกระทรวงศึกษาธิการ วัฒนธรรม กีฬา วิทยาศาสตร์ และเทคโนโลยีของญี่ปุ่นสามารถเริ่มต้นด้วยพารามิเตอร์แสนล้านตัว และเพิ่มขึ้นได้เมื่อเวลาผ่านไป

Shotaro Kinoshita จาก  Keio University School of Medicine กล่าวว่าการพัฒนา ChatGPT เวอร์ชันภาษาญี่ปุ่นที่แม่นยำอาจมี "ผลกระทบเชิงบวกต่อการวิจัยร่วมระหว่างประเทศ"

อ่านข่าวเต็มได้ที่: Nature

วันจันทร์ที่ 18 กันยายน พ.ศ. 2566

การเรียนรูัของเครื่องจัดการชุดข้อมูลขนาดมหาศาล

out-of-memory-algorithm
ภาพจาก Los Alamos National Laboratory

อัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) ที่พัฒนาขึ้นที่ Los Alamos National Laboratory (LANL) ของกระทรวงพลังงานสหรัฐฯ (DOE) สามารถระบุและแบ่งคุณลักษณะสำคัญของชุดข้อมูลขนาดใหญ่ออกเป็นชุดที่สามารถจัดการได้

นักวิจัยได้ทดสอบอัลกอริทึมบนซูเปอร์คอมพิวเตอร์ Summit ที่ห้องปฏิบัติการแห่งชาติ Oak Ridge ของ DOE โดย Ismael Boureima จาก LANL กล่าวว่า "เราได้พัฒนาวิธี 'หน่วยความจำไม่เพียงพอ' สำหรับวิธีการแยกตัวประกอบเมทริกซ์ที่ไม่เป็นลบ ซึ่งช่วยให้คุณสามารถแยกตัวประกอบชุดข้อมูลขนาดใหญ่กว่าที่เคยทำได้บนฮาร์ดแวร์ที่กำหนด"

อัลกอริทึมถ่ายโอนข้อมูลระหว่างคอมพิวเตอร์ได้อย่างมีประสิทธิภาพโดยเร่งความเร็วในการคำนวณและเชื่อมต่ออย่างรวดเร็วโดยใช้ฮาร์ดแวร์ เช่น หน่วยประมวลผลกราฟิก (GPU) ในขณะที่ทำงานหลายอย่างพร้อมกัน

นักวิจัยของ LANL ใช้อัลกอริทึมในการประมวลผลเมทริกซ์หนาแน่น (desnse matrix) 340 เทราไบต์ และเมทริกซ์กระจัดกระจาย (sparse matrix) 11 เอ็กซาไบต์ ด้วย GPU 25,000 ตัว

อ่านข่าวเต็มได้ที่: Los Alamos National Laboratory