วันพุธที่ 20 กันยายน พ.ศ. 2566

เครื่องมือเจาะทะลวงโฆษณาที่โจมตีโดยใช้วิศวกรรมสังคม

pop-up-ad-blocker
ภาพจาก  Georgia Tech Research

Trident ซึ่งพัฒนาโดยนักวิจัยที่ Georgia Institute of Technology (Georgia Tech) คือโปรแกรมเสริมที่เข้ากันได้กับ Google Chrome ซึ่งสามารถบล็อกโฆษณาออนไลน์ที่ใช้วิศวกรรมสังคมได้ โดยที่นักวิจัยอธิบายว่ามีประสิทธิภาพเกือบสมบูรณ์

Zheng Yang จาก Georgia Tech กล่าวว่า "เป้าหมายคือการระบุโฆษณาที่น่าสงสัยซึ่งมักจะนำผู้ใช้ไปยังเว็บไซต์ที่เป็นอันตรายหรือกระตุ้นให้มีการดาวน์โหลดซอฟต์แวร์ที่ไม่พึงประสงค์ Trident ทำงานภายในเครื่องมือสำหรับนักพัฒนาซอฟต์แวร์ของ Chrome และใช้ AI ที่ซับซ้อนเพื่อประเมินภัยคุกคามที่อาจเกิดขึ้น"

นักวิจัยสร้าง Trident โดยใช้ชุดข้อมูลที่รวบรวมจากเว็บไซต์กว่า 100,000 แห่ง ซึ่งช่วยระบุการโจมตี 1,479 ครั้ง ครอบคลุมการโจมตีทางวิศวกรรมสังคม 6 ประเภททั่วไปที่เจอบนเว็บ

Trident มีอัตราการตรวจจับโฆษณาที่เป็นอันตรายที่เกือบจะสมบูรณ์แบบตลอดระยะเวลาหนึ่งปี โดยให้อัตราผลบวกลวงเพียง 2.57%

อ่านข่าวเต็มได้ที่: Georgia Tech Research

วันอังคารที่ 19 กันยายน พ.ศ. 2566

ทำไมญี่ปุ่นถึงพัฒนา ChatGPT ของตัวเอง

Fugaku-Supercomputer
ภาพจาก Nature

รัฐบาลญี่ปุ่น บริษัทเทคโนโลยีขนาดใหญ่ของญี่ปุ่น และนักวิจัยในญี่ปุ่นกำลังทำงานเพื่อสร้าง ChatGPT เวอร์ชันที่มีตัวแบบภาษาขนาดใหญ่ (large language model) หรือ LLM ที่ใช้ภาษาญี่ปุ่น

LLM ที่ได้รับการฝึกอบรมโดยใช้ชุดข้อมูลในภาษาอื่นไม่ได้คำนึงถึงความแตกต่างในระบบตัวอักษร โครงสร้างประโยค และวัฒนธรรม

Tokyo Institute of Technology, Tohoku University, Fujitsu และ RIKEN กลุ่มศูนย์วิจัยที่ได้รับทุนสนับสนุนจากรัฐบาล กำลังร่วมมือกันในการสร้าง LLM ของญี่ปุ่นโดยใช้ซูเปอร์คอมพิวเตอร์ Fugaku LLM ซึ่งมีกำหนดเปิดตัวในปีหน้า อาจมีพารามิเตอร์อย่างน้อย 3 หมื่นล้านตัว

ในขณะเดียวกัน LLM ที่ได้รับทุนสนับสนุนจากกระทรวงศึกษาธิการ วัฒนธรรม กีฬา วิทยาศาสตร์ และเทคโนโลยีของญี่ปุ่นสามารถเริ่มต้นด้วยพารามิเตอร์แสนล้านตัว และเพิ่มขึ้นได้เมื่อเวลาผ่านไป

Shotaro Kinoshita จาก  Keio University School of Medicine กล่าวว่าการพัฒนา ChatGPT เวอร์ชันภาษาญี่ปุ่นที่แม่นยำอาจมี "ผลกระทบเชิงบวกต่อการวิจัยร่วมระหว่างประเทศ"

อ่านข่าวเต็มได้ที่: Nature

วันจันทร์ที่ 18 กันยายน พ.ศ. 2566

การเรียนรูัของเครื่องจัดการชุดข้อมูลขนาดมหาศาล

out-of-memory-algorithm
ภาพจาก Los Alamos National Laboratory

อัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) ที่พัฒนาขึ้นที่ Los Alamos National Laboratory (LANL) ของกระทรวงพลังงานสหรัฐฯ (DOE) สามารถระบุและแบ่งคุณลักษณะสำคัญของชุดข้อมูลขนาดใหญ่ออกเป็นชุดที่สามารถจัดการได้

นักวิจัยได้ทดสอบอัลกอริทึมบนซูเปอร์คอมพิวเตอร์ Summit ที่ห้องปฏิบัติการแห่งชาติ Oak Ridge ของ DOE โดย Ismael Boureima จาก LANL กล่าวว่า "เราได้พัฒนาวิธี 'หน่วยความจำไม่เพียงพอ' สำหรับวิธีการแยกตัวประกอบเมทริกซ์ที่ไม่เป็นลบ ซึ่งช่วยให้คุณสามารถแยกตัวประกอบชุดข้อมูลขนาดใหญ่กว่าที่เคยทำได้บนฮาร์ดแวร์ที่กำหนด"

อัลกอริทึมถ่ายโอนข้อมูลระหว่างคอมพิวเตอร์ได้อย่างมีประสิทธิภาพโดยเร่งความเร็วในการคำนวณและเชื่อมต่ออย่างรวดเร็วโดยใช้ฮาร์ดแวร์ เช่น หน่วยประมวลผลกราฟิก (GPU) ในขณะที่ทำงานหลายอย่างพร้อมกัน

นักวิจัยของ LANL ใช้อัลกอริทึมในการประมวลผลเมทริกซ์หนาแน่น (desnse matrix) 340 เทราไบต์ และเมทริกซ์กระจัดกระจาย (sparse matrix) 11 เอ็กซาไบต์ ด้วย GPU 25,000 ตัว

อ่านข่าวเต็มได้ที่: Los Alamos National Laboratory

วันอาทิตย์ที่ 17 กันยายน พ.ศ. 2566

Kotlin ขึ้นสู่ 20 อันดับแรกของ Tiobe

balloons
ภาพจาก  InfoWorld

Kotlin ซึ่งเป็นภาษาทางเลือกแทน Java ของ JetBrains ได้เข้าสู่ดัชนีความนิยมภาษาโปรแกรมรายเดือนของ Tiobe โดยอยู่ในอันดับที่ 20 ด้วยคะแนน 0.90% ในเดือนกันยายน

การจัดอันดับคำนวณโดยใช้สูตรที่คำนึงถึงจำนวนวิศวกร หลักสูตร และหน่วยงานที่ใช้แต่ละภาษาโดยอิงจากข้อมูลเครื่องมือค้นหายอดนิยม 10 อันดับแรกของ Tiobe ในเดือนกันยายน ได้แก่ Python, C, C++, Java, C#, JavaScript, Visual Basic, PHP, ภาษา Assembly และ SQL

ในขณะเดียวกัน 10 อันดับแรกในดัชนี Pypl Popularity of Programming Language ฉบับเดือนกันยายน ซึ่งวัดการค้นหาบทช่วยสอนภาษาของ Google ได้แก่ Python, Java, JavaScript, C#, C/C++, PHP, R, TypeScript, Swift และ Objective-C

อ่านข่าวเต็มได้ที่: InfoWorld

วันเสาร์ที่ 16 กันยายน พ.ศ. 2566

คอมพิวเตอร์ที่ใช้ DNA สามารถทำงานกับโปรแกรมได้เป็นแสนล้านโปรแกรม

DNA-strand
ภาพจาก New Scientist

นักวิจัยจากมหาวิทยาลัย Shanghai Jiao Tong (SJTU) ของจีน และ Chinese Academy of Sciences ได้พัฒนาคอมพิวเตอร์เหลวที่สามารถรันโปรแกรมต่างๆ มากกว่าแสนล้านโปรแกรมโดยใช้สาย DNA

นักวิจัยได้รวมโมเลกุล DNA สั้น ๆ เข้ากับวงจรที่ทำหน้าที่เป็นเหมือนสายสัญญาณ และสั่งให้พวกมันสร้างโครงสร้างที่แตกต่างกัน

การเพิ่มโมเลกุลขนาดสั้นต่างๆ ลงในหลอดที่เต็มไปด้วยสาย DNA ช่วยให้อาร์เรย์เกท DNA ที่โปรแกรมได้ (DNA-based programmable gate array ) หรือ DPGA แต่ละตัวสามารถติดตั้งวงจรที่แตกต่างกันได้ 

มีการทดลองครั้งหนึ่งที่ใช้การออกแบบ DPGA สำหรับการจำแนกและเลือกโมเลกุล RNA ขนาดเล็กที่เกี่ยวข้องกับมะเร็งไตประเภทหนึ่ง ซึ่งการทดลองนี้จัดว่าเป็นการบุกเบิกวิธีการทางธรรมชาติสำหรับ "การวินิจฉัยโรคอย่างชาญฉลาดสำหรับโรคประเภทต่างๆ" Fei Wang จาก SJTU กล่าว

อ่านข่าวเต็มได้ที่: New Scientist