Sarun's Blog

วันพุธที่ 28 กันยายน พ.ศ. 2565

ตัวเลขชนิดใหม่ช่วยปรับปรุงความสามารถทางคณิตศาสตร์ของ AI

ภาพจาก IEEE Spectrum

นักวิทยาศาสตร์จาก Complutense University of Madrid ของสเปนได้พัฒนาคอร์ของโปรเซสเซอร์ที่สามารถใช้มาตรฐานโพซิต (posit standard) ซึ่งเป็นการแทนตัวเลขปรับปรุงว่าโปรเซสเซอร์เลขทศนิยมมาตรฐานที่ใช้ในฮาร์ดแวร์ปัจจุบัน

นักวิจัยของ Complutense สังเคราะห์ฮาร์ดแวร์ใน field-programmable gate array เพื่อเปรียบเทียบการคำนวณที่ดำเนินการโดยใช้วิธีการคำนวณเลขทศนิยม 32 บิตแบบเดิมควบคู่ไปกับวิธีโพสิต 32 บิต

โพสิตแสดงให้เห็นถึงการปรับปรุงความแม่นยำในการคูณเมทริกซ์ได้ถึงอันดับของขนาดที่สี่ (four-order-of-magnitude) โดยไม่ได้ใช้เวลาคำนวณเพิ่มขึ้น

David Mallasén Quintana จาก Complutense กล่าวว่า "เป็นไปได้ที่โพสิตจะทำให้การฝึกอบรมปัญญาประดิษฐ์ (artificial intelligence) ได้เร็วขึ้น เพราะทำให้ไม่ต้องยอมทิ้งข้อมูลไปมากนักในขณะฝึกอบรม

อ่านข่าวเต็มได้ที่: IEEE Spectrum

วันจันทร์ที่ 26 กันยายน พ.ศ. 2565

ซอฟต์แวร์เปิดเผยโค้ดต้นฉบับที่จะอยู่ไปเป็นพันปี?

ZDNet

GitHub ได้เสร็จสิ้นการก่อสร้าง Arctic Code Vault ซึ่งเป็นสแนปชอตขนาด 21 เทราไบต์ของที่เก็บซอฟต์แวร์สาธารณะ (public software repository) ทั้งหมด ซึ่งส่วนใหญ่เข้ารหัสในรูปแบบ QR Code และอยู่ลึกลงไป 250 เมตร (820 ฟุต) ภายในภูเขาใน Svalbard ประเทศนอร์เวย์

Jon Evans จาก GitHub Archive Program กล่าวว่า "ความหวังของเราคือการจัดเก็บและจัดทำดัชนีที่เก็บข้อมูลนับล้าน เราได้รวบรวมส่วนต่าง ๆ อันมีค่าของโลกของซอฟต์แวร์สมัยใหม่"

ไฟล์เก็บถาวรนี้ได้รับการออกแบบมาให้ใช้งานได้ยาวนานนับพันปี โดยมีสแนปชอตที่เก็บไว้ในม้วนฟิล์มมากกว่า 180 ม้วน กล่องเหล็กขนาดเกือบ 1.5 ตันจัดเก็บพวกมันไว้อีกทีหนึ่ง และตกแต่งด้วยการแกะสลักที่สร้างโดยปัญญาประดิษฐ์เพื่อดึงดูดคนรุ่นต่อไป

Evans กล่าวว่าห้องนิรภัยอาจช่วยคนที่ต้องการซอฟต์แวร์ที่สูญหายไปได้ และจะทำหน้าที่เป็นบันทึกทางประวัติศาสตร์ด้วย

อ่านข่าวเต็มได้ที่: ZDNet

วันอาทิตย์ที่ 25 กันยายน พ.ศ. 2565

บั๊กของ Python ที่มีมาแล้ว 15 ปี สามารถรันโค้ดในกว่า 350,000 โครงการ

Photo by Artturi Jalli on Unsplash

บั๊กอายุ 15 ปีที่ยังไม่ได้แก้ไขในภาษาเขียนโปรแกรม Python อาจส่งผลกระทบกับที่เก็บ (repository) ของโครงการเปิดเผยโค้ดต้นฉบับ (open-source) มากกว่า 350,000 แห่ง และอาจนำไปสู่การเรียกใช้โค้ด

ช่องโหว่ Path Traversal ซึ่งถูกเปิดเผยในปี 2007 อยู่ในแพ็คเกจ Python tarfile โดยอนุญาตให้แฮกเกอร์เขียนทับไฟล์ใด ๆ ก็ได้ ช่องโหว่เกิดขึ้นเนื่องจากโค้ดในฟังก์ชันการแตกไฟล์ในโมดูล tarfile ของ Python เชื่อถือข้อมูลในอ็อบเจกต์ TarInfo "และเชื่อมพาธที่ส่งผ่านไปยังฟังก์ชันการแตกไฟล์และชื่อในออบเจ็กต์ TarInfo"

นักวิเคราะห์ Charles McFarland ที่ Trellix ได้ค้นพบจุดบกพร่องอีกครั้งในขณะที่ตรวจสอบปัญหาด้านความปลอดภัยอื่น ไม่มีรายงานใดที่ระบุว่าบั๊กถูกใช้ในการโจมตี แม้ว่าจะยังคงเป็นภัยคุกคามในห่วงโซ่อุปทานของซอฟต์แวร์ก็ตาม

อ่านข่าวเต็มได้ที่: BleepingComputer

วันศุกร์ที่ 23 กันยายน พ.ศ. 2565

การเรียนรู้ของเครื่องสร้างตัวแบบสามมิติจากภาพสองมิติ

ภาพจาก Washington University in St. Louis

อัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) หรือ ML ที่พัฒนาโดยนักวิจัยจาก Washington University ในเซนต์หลุยส์สามารถใช้ชุดภาพสองมิติเพียงบางส่วนที่ได้จากกล้องจุลทรรศน์มาตรฐานเพื่อสร้างแบบจำลองเซลล์สามมิติแบบต่อเนื่อง

นักวิจัยประสบความสำเร็จในการแทนตัวอย่างทั้งหมดได้โดยใช้ภาพ 2 มิติจำนวนจำกัด ทำให้ไม่จำเป็นต้องบันทึกไฟล์ภาพจำนวนมาก ระบบภาพยังมีความสามารถในการซูมภาพมนระดับพิกเซลและสร้างส่วนที่ขาดหายไปได้

Ulugbek Kamilov แห่งมหาวิทยาลัยวอชิงตันกล่าวว่า "เราฝึกตัวแบบโดยใช้ชุดของภาพดิจิทัลเพื่อให้ได้ภาพต่อเนื่องกัน ตอนนี้เราสามารถให้มันแสดงภาพในรูปแบบใดก็ได้ตามต้องการ และยังสามารถซูมเข้าได้อย่างราบรื่นโดยที่ภาพไม่แตกเป็นพิกเซล (pixelation)"

อ่านข่าวเต็มได้ที่: Washington University in St. Louis

วันพฤหัสบดีที่ 22 กันยายน พ.ศ. 2565

เราฝึกสอนเครือข่ายประสาทเทียมขนาดใหญ่บนอุปกรณ์ขนาดเล็กได้แล้ว

ภาพจาก IEEE Spectrum

วิธีการฝึกสอนแบบใหม่ขยายความสามารถของอุปกรณ์ขนาดเล็ก ในการฝึกสอนเครือข่ายประสาทเทียมขนาดใหญ่ ในขณะที่อาจช่วยปกป้องความเป็นส่วนตัว

Shishir Patil และเพื่อนร่วมงานที่ University of California, Berkeley ได้รวมเทคนิคการถ่ายโอนและการสร้างใหม่โดยใช้ฮิวริสติกที่ไม่ได้ดีที่สุดเพื่อลดความต้องการหน่วยความจำสำหรับการฝึกสอนผ่านระบบ private optimal energy training หรือ POET

ผู้ใช้ป้อนรายละเอียดทางเทคนิคของอุปกรณ์และข้อมูลเกี่ยวกับสถาปัตยกรรมของเครือข่ายประสาทเทียมที่พวกเขาต้องการฝึกสอน ระบุหน่วยความจำ และเวลาที่ต้องการใช้ ระบบสร้างจะกระบวนการฝึกสอนที่ใช้พลังงานน้อยที่สุด การทดสอบแสดงให้เห็นว่าระบบสามารถลดการใช้หน่วยความจำได้ประมาณ 80% โดยไม่เพิ่มการใช้พลังงานอย่างมีนัยสำคัญ

อ่านข่าวเต็มได้ที่: IEEE Spectrum