วันศุกร์ที่ 30 กันยายน พ.ศ. 2565

วิศวกรสร้างกล้องใต้น้ำไร้สายซึ่งไม่ต้องใช้แบตเตอรี

under-water-camera
ภาพจาก MIT News

วิศวกรของ Massachusetts Institute of Technology (MIT) ได้พัฒนากล้องถ่ายภาพใต้น้ำแบบไร้สายที่ไม่ต้องใช้แบตเตอรี่ ซึ่งพวกเขาอธิบายว่ามันใช้พลังงานอย่างมีประสิทธิภาพกว่ากล้องใต้น้ำอื่นๆ ประมาณ 100,000 เท่า

กล้องให้พลังงานแก่องค์ประกอบด้วยการถ่ายภาพและการสื่อสารด้วยการแปลงพลังงานกลจากคลื่นเสียงเป็นไฟฟ้า และยังใช้คลื่นเสียงเพื่อส่งข้อมูลไปยังเครื่องรับที่จะสร้างภาพขึ้นใหม่  ทรานสดิวเซอร์ piezoelectric ภายนอกเก็บเกี่ยวพลังงานจากคลื่นเสียงเพื่อผลิตพลังงานไฟฟ้า

ไดโอดเปล่งแสงสีแดง เขียว และน้ำเงินช่วยเสริมการทำงานของเซ็นเซอร์รับภาพพลังงานต่ำของกล้องเพื่อสร้างภาพถ่ายสี ในขณะที่ข้อมูลจะถูกส่งไปยังเครื่องรับผ่านการกระเจิงกลับ (backscattering) ใต้น้ำ

Fadel Adib แห่ง MIT กล่าวว่า "เทคโนโลยีนี้สามารถช่วยให้เราสร้างแบบจำลองสภาพภูมิอากาศที่แม่นยำยิ่งขึ้น และเข้าใจได้ดีขึ้นว่าการเปลี่ยนแปลงสภาพภูมิอากาศส่งผลกระทบต่อโลกใต้น้ำอย่างไร"

อ่านข่าวเต็มได้ที่: MIT News

วันพฤหัสบดีที่ 29 กันยายน พ.ศ. 2565

Intel ขยายคลาวด์สำหรับนักพัฒนาเพื่อให้ลูกค้าได้ทดลองชิปตัวใหม่

Intel
ภาพจาก Reuters

Intel กล่าวว่าตั้งใจที่จะขยาย Developer Cloud เพื่อให้ลูกค้าได้ทดลองใช้ชิปใหม่ ๆ ก่อนเปิดตัวในตลาด และหวังว่าจะเพิ่มยอดการใช้งานจากนักพัฒนาแอปพลิเคชัน 

Nick McKeown แห่ง Intel อธิบายว่า "สิ่งที่เราเคยทำในอดีตก็คือทำซอฟต์แวร์ที่ช่วยให้ซิลิคอนระดับต่ำเปล่งประกายได้ แต่นั่นเป็นสิ่งที่มองไม่เห็น" เขากล่าวว่าบริษัทกำลังพยายามทำให้คลาวด์สำหรับนักพัฒนาใช้งานได้ง่ายขึ้น เพื่อดึงดูดนักพัฒนาแอปรุ่นต่อไป

Ria Cheruvu ของ Intel กล่าวว่าคลาวด์สำหรับนักพัฒนากำลังช่วยแก้ไขจุดอ่อนที่นักพัฒนารุ่นใหม่ต้องเผชิญในการทำความเข้าใจและทดลองใช้งานโปรเซสเซอร์

อ่านข่าวเต็มได้ที่: Reuters

วันพุธที่ 28 กันยายน พ.ศ. 2565

ตัวเลขชนิดใหม่ช่วยปรับปรุงความสามารถทางคณิตศาสตร์ของ AI

posit-IEEE-Float
ภาพจาก IEEE Spectrum

นักวิทยาศาสตร์จาก Complutense University of Madrid ของสเปนได้พัฒนาคอร์ของโปรเซสเซอร์ที่สามารถใช้มาตรฐานโพซิต (posit standard) ซึ่งเป็นการแทนตัวเลขปรับปรุงว่าโปรเซสเซอร์เลขทศนิยมมาตรฐานที่ใช้ในฮาร์ดแวร์ปัจจุบัน

นักวิจัยของ Complutense สังเคราะห์ฮาร์ดแวร์ใน field-programmable gate array เพื่อเปรียบเทียบการคำนวณที่ดำเนินการโดยใช้วิธีการคำนวณเลขทศนิยม 32 บิตแบบเดิมควบคู่ไปกับวิธีโพสิต 32 บิต

โพสิตแสดงให้เห็นถึงการปรับปรุงความแม่นยำในการคูณเมทริกซ์ได้ถึงอันดับของขนาดที่สี่ (four-order-of-magnitude) โดยไม่ได้ใช้เวลาคำนวณเพิ่มขึ้น 

David Mallasén Quintana จาก Complutense กล่าวว่า "เป็นไปได้ที่โพสิตจะทำให้การฝึกอบรมปัญญาประดิษฐ์ (artificial intelligence) ได้เร็วขึ้น เพราะทำให้ไม่ต้องยอมทิ้งข้อมูลไปมากนักในขณะฝึกอบรม

อ่านข่าวเต็มได้ที่: IEEE Spectrum

วันจันทร์ที่ 26 กันยายน พ.ศ. 2565

ซอฟต์แวร์เปิดเผยโค้ดต้นฉบับที่จะอยู่ไปเป็นพันปี?

programmer
ZDNet

GitHub ได้เสร็จสิ้นการก่อสร้าง Arctic Code Vault ซึ่งเป็นสแนปชอตขนาด 21 เทราไบต์ของที่เก็บซอฟต์แวร์สาธารณะ (public software repository) ทั้งหมด ซึ่งส่วนใหญ่เข้ารหัสในรูปแบบ QR Code และอยู่ลึกลงไป 250 เมตร (820 ฟุต) ภายในภูเขาใน Svalbard ประเทศนอร์เวย์

Jon Evans จาก GitHub Archive Program กล่าวว่า "ความหวังของเราคือการจัดเก็บและจัดทำดัชนีที่เก็บข้อมูลนับล้าน เราได้รวบรวมส่วนต่าง ๆ อันมีค่าของโลกของซอฟต์แวร์สมัยใหม่"

ไฟล์เก็บถาวรนี้ได้รับการออกแบบมาให้ใช้งานได้ยาวนานนับพันปี โดยมีสแนปชอตที่เก็บไว้ในม้วนฟิล์มมากกว่า 180 ม้วน กล่องเหล็กขนาดเกือบ 1.5 ตันจัดเก็บพวกมันไว้อีกทีหนึ่ง และตกแต่งด้วยการแกะสลักที่สร้างโดยปัญญาประดิษฐ์เพื่อดึงดูดคนรุ่นต่อไป 

Evans กล่าวว่าห้องนิรภัยอาจช่วยคนที่ต้องการซอฟต์แวร์ที่สูญหายไปได้ และจะทำหน้าที่เป็นบันทึกทางประวัติศาสตร์ด้วย

อ่านข่าวเต็มได้ที่: ZDNet

วันอาทิตย์ที่ 25 กันยายน พ.ศ. 2565

บั๊กของ Python ที่มีมาแล้ว 15 ปี สามารถรันโค้ดในกว่า 350,000 โครงการ

python-code
Photo by Artturi Jalli on Unsplash

บั๊กอายุ 15 ปีที่ยังไม่ได้แก้ไขในภาษาเขียนโปรแกรม Python อาจส่งผลกระทบกับที่เก็บ (repository) ของโครงการเปิดเผยโค้ดต้นฉบับ (open-source) มากกว่า 350,000 แห่ง และอาจนำไปสู่การเรียกใช้โค้ด

ช่องโหว่ Path Traversal ซึ่งถูกเปิดเผยในปี 2007 อยู่ในแพ็คเกจ Python tarfile โดยอนุญาตให้แฮกเกอร์เขียนทับไฟล์ใด ๆ ก็ได้ ช่องโหว่เกิดขึ้นเนื่องจากโค้ดในฟังก์ชันการแตกไฟล์ในโมดูล tarfile ของ Python เชื่อถือข้อมูลในอ็อบเจกต์ TarInfo "และเชื่อมพาธที่ส่งผ่านไปยังฟังก์ชันการแตกไฟล์และชื่อในออบเจ็กต์ TarInfo"

นักวิเคราะห์ Charles McFarland ที่ Trellix ได้ค้นพบจุดบกพร่องอีกครั้งในขณะที่ตรวจสอบปัญหาด้านความปลอดภัยอื่น ไม่มีรายงานใดที่ระบุว่าบั๊กถูกใช้ในการโจมตี แม้ว่าจะยังคงเป็นภัยคุกคามในห่วงโซ่อุปทานของซอฟต์แวร์ก็ตาม

อ่านข่าวเต็มได้ที่: BleepingComputer

วันศุกร์ที่ 23 กันยายน พ.ศ. 2565

การเรียนรู้ของเครื่องสร้างตัวแบบสามมิติจากภาพสองมิติ

2d-to-3d-images
ภาพจาก Washington University in St. Louis

อัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) หรือ ML ที่พัฒนาโดยนักวิจัยจาก Washington University ในเซนต์หลุยส์สามารถใช้ชุดภาพสองมิติเพียงบางส่วนที่ได้จากกล้องจุลทรรศน์มาตรฐานเพื่อสร้างแบบจำลองเซลล์สามมิติแบบต่อเนื่อง

นักวิจัยประสบความสำเร็จในการแทนตัวอย่างทั้งหมดได้โดยใช้ภาพ 2 มิติจำนวนจำกัด ทำให้ไม่จำเป็นต้องบันทึกไฟล์ภาพจำนวนมาก ระบบภาพยังมีความสามารถในการซูมภาพมนระดับพิกเซลและสร้างส่วนที่ขาดหายไปได้

Ulugbek Kamilov แห่งมหาวิทยาลัยวอชิงตันกล่าวว่า "เราฝึกตัวแบบโดยใช้ชุดของภาพดิจิทัลเพื่อให้ได้ภาพต่อเนื่องกัน ตอนนี้เราสามารถให้มันแสดงภาพในรูปแบบใดก็ได้ตามต้องการ และยังสามารถซูมเข้าได้อย่างราบรื่นโดยที่ภาพไม่แตกเป็นพิกเซล (pixelation)" 

อ่านข่าวเต็มได้ที่: Washington University in St. Louis

วันพฤหัสบดีที่ 22 กันยายน พ.ศ. 2565

เราฝึกสอนเครือข่ายประสาทเทียมขนาดใหญ่บนอุปกรณ์ขนาดเล็กได้แล้ว

neiral-network
ภาพจาก IEEE Spectrum

วิธีการฝึกสอนแบบใหม่ขยายความสามารถของอุปกรณ์ขนาดเล็ก ในการฝึกสอนเครือข่ายประสาทเทียมขนาดใหญ่ ในขณะที่อาจช่วยปกป้องความเป็นส่วนตัว

Shishir Patil และเพื่อนร่วมงานที่  University of California, Berkeley ได้รวมเทคนิคการถ่ายโอนและการสร้างใหม่โดยใช้ฮิวริสติกที่ไม่ได้ดีที่สุดเพื่อลดความต้องการหน่วยความจำสำหรับการฝึกสอนผ่านระบบ private optimal energy training  หรือ POET 

ผู้ใช้ป้อนรายละเอียดทางเทคนิคของอุปกรณ์และข้อมูลเกี่ยวกับสถาปัตยกรรมของเครือข่ายประสาทเทียมที่พวกเขาต้องการฝึกสอน ระบุหน่วยความจำ และเวลาที่ต้องการใช้ ระบบสร้างจะกระบวนการฝึกสอนที่ใช้พลังงานน้อยที่สุด การทดสอบแสดงให้เห็นว่าระบบสามารถลดการใช้หน่วยความจำได้ประมาณ 80% โดยไม่เพิ่มการใช้พลังงานอย่างมีนัยสำคัญ

อ่านข่าวเต็มได้ที่: IEEE Spectrum

วันอังคารที่ 20 กันยายน พ.ศ. 2565

JavaScript ไม่ใช่ภาษาเขียนโปรแกรมนิยมของนักพัฒนาอีกต่อไปแล้ว

screen-coding
Photo by Juanjo Jaramillo on Unsplash

รายงาน State of Software Delivery ปี 2022 ของ CircleCI พบว่า TypeScript ได้ยึดบัลลังก์ของ JavaScript ในการเป็นภาษาการเขียนโปรแกรมที่นักพัฒนาชื่นชอบมากที่สุดไปแล้ว 

บริษัทมองถึงการเปลี่ยนไปใช้คุณลักษณะที่เป็นมิตรต่อนักพัฒนาของ TypeScript และส่งมอบ (commit) โค้ด การทำงานบ่อยกว่า JavaScript

CircleCI ยังพบว่าความนิยมของ Python นั้นคงที่ในอันดับที่สี่ ในขณะที่ HTML, Java และ PHP ก็ติด 10 อันดับแรกด้วย "ทีมจัดส่ง (delivery) ซอฟต์แวร์ชั้นยอดกำลังใช้เครื่องมือและแนวทางปฏิบัติที่เป็นมิตรกับนักพัฒนา ซึ่งช่วยให้พวกเขาสามารถดำเนินการอัตโนมัติ ปรับขนาด และประสบความสำเร็จในการเปลี่ยนแปลงเมื่อจำเป็น Michael จาก CircleCI กล่าว

อ่านข่าวเต็มได้ที่: TechRadar

วันจันทร์ที่ 19 กันยายน พ.ศ. 2565

นักวิทยาศาสตร์พยายามสอนหุ่นยนต์ให้หัวเราะในช่วงเวลาที่ถูกต้อง

Erica-robot
ภาพจาก The Guardian (U.K.)

Koji Inoue และเพื่อนร่วมงานที่มหาวิทยาลัยเกียวโตของญี่ปุ่นได้พัฒนาระบบปัญญาประดิษฐ์ (artificial intelligence) ที่สามารถแนะนำหุ่นยนต์ให้หัวเราะอย่างถูกวิธีในเวลาที่เหมาะสม 

นักวิจัยได้รวบรวมข้อมูลจากการพูดคุยแบบการพูดคุยทำความรู้จักอย่างรวดเร็ว (speed-dating) มากกว่า 80 ครั้งระหว่างนักเรียนชายกับหุ่นยนต์ Erica ซึ่งในตอนแรกนั้นถูกควบคุมจากระยะไกลโดยใช้นักแสดงหญิง

ทีมงานได้อธิบายข้อมูลการสนทนาสำหรับการหัวเราะคนเดียว การหัวเราะในกลุ่มการเข้าสังคม และเสียงหัวเราะที่เกี่ยวข้องกับความสนุกสนาน จากนั้นจึงฝึกระบบการเรียนรู้ของเครื่องเพื่อตัดสินใจว่าจะหัวเราะหรือไม่ และเลือกประเภทเสียงหัวเราะที่เหมาะสม

นักวิจัยได้ทดสอบอารมณ์ขันของ Erica ด้วยการสร้างบทสนทนาเพื่อพูดคุยกับกับบุคคลหนึ่งคน และรวมเอาอัลกอริทึมเสียงหัวเราะร่วมกันเข้าไว้ในซอฟต์แวร์การสนทนา อัลกอริทึมได้รับคะแนนสูงสุดจากอาสาสมัคร 130 คน ที่ทบทวนการสนทนาเหล่านั้นเพื่อหาความเห็นอกเห็นใจ ความเป็นธรรมชาติ ความเหมือนมนุษย์ และความเข้าใจ

อ่านข่าวเต็มได้ที่: The Guardian (U.K.)


วันเสาร์ที่ 17 กันยายน พ.ศ. 2565

หน้ากากดิจิทัลปกป้องความเป็นส่วนตัวของผู้ป่วย

difital-mask
ภาพจาก University of Cambridge (U.K.)


นักวิจัยจากสหราชอาณาจักรและจีนได้สร้าง "หน้ากากดิจิทัล" ที่อนุญาตให้เก็บภาพใบหน้าในเวชระเบียนในขณะที่ปกป้องการดึงข้อมูลชีวภาพ (biometric) ส่วนบุคคล 

นักวิจัยใช้การสร้างภาพใหม่แบบสามมิติ และอัลกอริทึมการเรียนรู้เชิงลึก (deep )เพื่อลบคุณสมบัติที่ระบุตัวตนได้ออกจากภาพใบหน้าในขณะที่ยังคงรักษาคุณลักษณะที่เกี่ยวข้องกับโรคไว้

หน้ากากดิจิทัลจะอ่านวิดีโอใบหน้าของผู้ป่วย และให้ผลลัพธ์เป็นวิดีโอตามอัลกอริทึม และใช้การสร้างใหม่ 3 มิติ โดยทิ้งข้อมูลไบโอเมตริกส่วนบุคคลของผู้ป่วยให้มากที่สุดเท่าที่จะเป็นไปได้ เพื่อขัดขวางการระบุตัวตน

Patrick Yu-Wai-Man จาก University of Cambridge แห่งสหราชอาณาจักรกล่าวว่าหน้ากากดิจิทัล "นำเสนอแนวทางปฏิบัติในการปกป้องความเป็นส่วนตัวของผู้ป่วยในขณะที่ยังคงให้ข้อมูลที่เป็นประโยชน์ต่อแพทย์"

อ่านข่าวเต็มได้ที่: University of Cambridge (U.K.)

วันพฤหัสบดีที่ 15 กันยายน พ.ศ. 2565

ระบบ AI ทำนายว่าจะป้องกันไฟป่าได้อย่างไร

sattelite-image
Aalto University (Finland)

ตัวแบบโครงข่ายประสาทเทียม (neural network) ที่พัฒนาขึ้นโดยนักวิจัยจาก Aalto University ของฟินแลนด์ สามารถทำนายประสิทธิภาพของกลยุทธ์การจัดการที่ดินแบบต่างๆ เพื่อช่วยบรรเทาไฟป่าได้

การวิเคราะห์มุ่งเน้นไปที่จังหวัด Central Kalimantan ตอนกลางของเกาะบอร์เนียว ตัวแบบคาดการณ์การกระจายของไฟป่าจากการวัดที่ตรวจจับได้ก่อนฤดูที่จะเกิดไฟป่าแต่ละฤดูตั้งแต่ปีค.ศ. 2022 ถึง 2019 

นักวิจัยวิเคราะห์ปัจจัย 31 ประการ จากนั้นคาดการณ์ความน่าจะเป็นของการเกิดไฟป่าในแต่ละจุดบนแผนที่ ผลลัพธ์คือการคาดการณ์การกระจายของไฟป่าประจำปีซึ่งถูกต้อง 80% ถึง 95% ของเวลาทั้งหมด

จากนั้นพวกเขาได้จำลองผลกระทบของกลยุทธ์การจัดการที่ดินแบบต่างๆ ต่อการเกิดไฟ และพบว่าการเปลี่ยนพื้นที่ป่าพุ่ม (shrubland) และป่าละเมาะ (scrubland) เป็นป่าชายเลน (swamp forest) จะลดอัตราการเกิดไฟป่าลงครึ่งหนึ่ง

อ่านข่าวเต็มได้ที่: Aalto University (Finland)


วันอังคารที่ 13 กันยายน พ.ศ. 2565

สมาร์ทโฟนสั่งงานด้วยเสียงมุ่งเป้ากลุ่มคนไม่รู้หนังสือในแอฟริกา

phone-with-African-Languages
ภาพจาก Voice of America News

บริษัท Cerco ร่วมกับ Orange บริษัทโทรคมนาคมของฝรั่งเศส กำลังเปิดตัว "ซูเปอร์โฟน" ที่ติดตั้งระบบผู้ช่วยเสียงสำหรับประชากรประมาณ 40% ของไอวอรี่โคสต์ที่ไม่สามารถอ่านหรือเขียนได้

โทรศัพท์ราคา 60,000 CFA ฟรังก์ (92 ดอลลาร์) มีเป้าหมายเพื่อช่วยให้ผู้คนในประเทศทำงานประจำวันได้ง่ายขึ้น เช่น การตรวจสอบยอดเงินคงเหลือในธนาคาร

โทรศัพท์ใช้ระบบปฏิบัติการ Kone ของ Cerco โดยสามารถตอบสนองต่อคำสั่งจาก 17 ภาษาที่ใช้ในไอวอรี่โคสต์ รวมถึงภาษาแอฟริกาอื่น ๆ อีก 50 ภาษา

เป้าหมายสูงสุดของ Cerco คือการที่จะเข้าถึงประชากรครึ่งหนึ่งของทวีปด้วยโทรศัพท์ Alain Capo-Chichi แห่ง Cerco กล่าวว่า "สถาบันต่างๆ ให้ความสำคัญกับการทำให้ผู้คนรู้หนังสือก่อนที่จะทำให้เทคโนโลยีสามารถเข้าถึงได้ วิธีของเราข้ามการอ่านออกเขียนได้ และมุ่งตรงไปที่การบูรณาการผู้คนเข้าสู่ชีวิตทางเศรษฐกิจและสังคม"

อ่านข่าวเต็มได้ที่: Voice of America News

วันจันทร์ที่ 12 กันยายน พ.ศ. 2565

กล้องไร้เลนส์สร้างภาพ 3 มิติจากการเปิดรับแสงครั้งเดียว

scientists-in-lab
ภาพจาก Optica

นักวิทยาศาสตร์ได้สร้างกล้องไร้เลนส์ที่สร้างภาพสามมิติ จากการเปิดรับแสงครั้งเดียวในแบบเรียลไทม์ "เราเรียกกล้องของเราว่าไม่มีเลนส์ เพราะจะแทนที่เลนส์จำนวนมากที่ใช้ในกล้องทั่วไปด้วยอาร์เรย์ของไมโครเลนส์ที่บางและน้ำหนักเบาซึ่งทำจากโพลีเมอร์ที่ยืดหยุ่นได้" Weijian Yang จาก University of California กล่าว

ไมโครเลนส์แต่ละตัวในอาร์เรย์ช่วยให้กล้องดูวัตถุจากมุมหรือมุมมองต่างๆ ทำให้สามารถให้ข้อมูลเชิงลึกได้ Yang กล่าวว่าอุปกรณ์ดังกล่าวใช้โครงข่ายประสาทเทียม (neural network) "ตามแบบจำลองทางกายภาพของการสร้างภาพใหม่ ซึ่งทำให้กระบวนการเรียนรู้ง่ายขึ้นมาก และส่งผลให้มีการสร้างภาพใหม่ที่มีคุณภาพสูง"

อ่านข่าวเต็มได้ที่: Optica

วันอาทิตย์ที่ 11 กันยายน พ.ศ. 2565

การมีอคติของภาษาอังกฤษในการคอมพิวเตอร์แก้ได้ด้วยรูปภาพ

phone-describe-image
ภาพจาก University of Copenhagen (Denmark)

เกณฑ์มาตรฐานที่ใช้รูปภาพสามารถเอาชนะอคติทางวัฒนธรรมที่เกิดจากชุดข้อมูลการฝึกอบรมการเรียนรู้ของเครื่อง (machine learning) หรือ ML ที่เขียนเป็นภาษาอังกฤษได้

กลุ่มนักวิจัยนานาชาติที่นำโดย University of Copenhagen (KU)  ของเดนมาร์ก ได้พัฒนาเครื่องมือ Image-Grounded Language Understanding Evaluation (IGLUE) ซึ่งสามารถให้คะแนนประสิทธิภาพของทางแก้ปัญหาของ ML ใน 20 ภาษา

ป้ายกำกับรูปภาพใน ML มักเป็นภาษาอังกฤษ ในขณะที่ IGLUE ครอบคลุมตระกูลภาษา 11 ตระกูล บทภาพยนตร์ 9 เรื่อง และพื้นที่มาโครทางภูมิศาสตร์ 3 แห่ง

ภาพของ IGLUE นำเสนอองค์ประกอบเฉพาะวัฒนธรรมที่จัดทำโดยอาสาสมัครในประเทศที่มีความหลากหลายทางภูมิศาสตร์ในภาษาธรรมชาติของพวกเขา

Emanuele Bugliarello จาก KU กล่าวว่านักวิจัยหวังว่าวิธีการพื้นฐานของ IGLUE สามารถปรับปรุงวิธีแก้ปัญหา "ซึ่งช่วยผู้พิการทางสายตาในการติดตามเนื้อเรื่องของภาพยนตร์หรือการสื่อสารด้วยภาพประเภทอื่น"

อ่านข่าวเต็มได้ที่: University of Copenhagen (Denmark)

วันเสาร์ที่ 10 กันยายน พ.ศ. 2565

ยุคต่อไปของการช่วยการได้ยิน อ่านริมฝีปากได้แม้ใส่หน้ากากอนามัย

hearing-aids-read-lip-through-mask
ภาพจาก University of Glasgow (U.K.)

ทีมนานาชาติที่นำโดยนักวิจัยจาก University of Glasgow แห่งสหราชอาณาจักรได้พัฒนาระบบที่สามารถอ่านริมฝีปากได้อย่างแม่นยำผ่านหน้ากากอนามัย โดยใช้การตรวจจับด้วยคลื่นความถี่วิทยุ (radio frequency) หรือ RF และปัญญาประดิษฐ์ (artificial intelligence) หรือ AI  

นักวิจัยได้ให้อาสาสมัครพูดเสียงสระซ้ำในขณะที่สวมหน้ากากและถอดหน้ากาก โดยมีสัญญาณ RF จากเซ็นเซอร์เรดาร์เฉพาะ และเครื่องส่งสัญญาณ Wi-Fi ที่ใช้สแกนใบหน้าขณะพูดและในขณะที่อยู่นิ่ง 

ตัวอย่างข้อมูลผลลัพธ์ที่ได้ 3,600 ตัวอย่างถูกใช้เพื่อฝึกอัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) และการเรียนรู้เชิงลึก (deep learning) เพื่อรับรู้การเคลื่อนไหวของริมฝีปากและปากที่เกี่ยวข้องกับเสียงสระแต่ละเสียง

เนื่องจากสัญญาณ RF สามารถทะลุผ่านหน้ากากได้ อัลกอริทึมการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกจึงสามารถเรียนรู้ที่จะระบุการก่อตัวของเสียงสระจากผู้พูดที่สวมหน้ากาก

อ่านข่าวเต็มได้ที่: University of Glasgow (U.K.)

วันศุกร์ที่ 9 กันยายน พ.ศ. 2565

Google Chrome ออกแพตช์แก้ไขช่องโหว่แบบซีโรเดย์ที่มีความรุนแรงมากไปแล้วหกครั้งในปีนี้

ภาพจาก Ars Technica

วิศวกรของ Google ได้เผยแพร่การอัปเดตฉุกเฉินสำหรับเบราว์เซอร์ Chrome เพื่อแก้ไขข้อบกพร่องซีโร่เดย์ (Zero-day) ที่มีความรุนแรงสูง 

Google กล่าวว่าช่องโหว่ (CVE-2022-3075) เกิดจาก "การตรวจสอบข้อมูลไม่เพียงพอใน Mojo" ซึ่งเป็นองค์ประกอบ Chrome สำหรับการส่งข้อความระหว่างและภายในโพรเซสระหว่างเบราว์เซอร์และระบบปฏิบัติการ

"Google ทราบดีว่ามีรายงานว่ามีช่องโหว่สำหรับ CVE-2022-3075 อยู่ทั่วไป" บริษัทอธิบายโดยไม่เปิดเผยว่าแฮ็กเกอร์กำลังใช้ประโยชน์จากช่องโหว่ หรือเพียงแค่ครอบครองโค้ดที่ใช้เจาะระบบ" 

วิศวกรยังได้ปรับปรุงเบราว์เซอร์ Edge ของ Microsoft ที่ใช้เอ็นจิ้น Chromium เดียวกันกับ Chrome เพื่อแก้ไขข้อผิดพลาดเดียวกัน การใช้ประโยชน์จาก Mojo ถือเป็นช่องโหว่ซีโรเดย์ ครั้งที่หกที่ Chrome พบในปีนี้

อ่านข่าวเต็มได้ที่: Ars Technica

วันพฤหัสบดีที่ 8 กันยายน พ.ศ. 2565

ระบบทำให้ตรวจจับโรคหัวใจผ่านแอปได้

heart
Photo by camilo jimenez on Unsplash

นักวิทยาศาสตร์จาก American Institute of Physics ได้สร้างระบบที่สามารถตรวจจับการตีบของลิ้นหัวใจเอออร์ตา (aortic valve) ได้ ซึ่งพวกเขากำลังพยายามแปลงให้เป็นแอปพลิเคชันโทรศัพท์

Mohanachandran Nair Sindhu Swapna จากมหาวิทยาลัย Kerala ของอินเดียกล่าวว่าระบบนี้สร้างขึ้นโดยใช้เครื่องตรวจฟังเสียงและคอมพิวเตอร์เท่านั้น สามารถวิเคราะห์สภาพได้ ซึ่งทำให้เสียง "ตุบ-ตับ" ของหัวใจเกิดขึ้นพร้อมกันแทนที่จะแยกกัน

นักวิจัยใช้กรเรียนรู้ของเครื่อง (machine learning) เพื่อตรวจสอบกราฟของคะแนนของหัวใจและเพื่อระบุพาหะของหลอดเลือดตีบด้วยผลลัพธ์ที่แม่นยำ 100% Swapna กล่าวว่า "วิธีการที่เสนอนี้สามารถขยายไปยังสัญญาณเสียงหัวใจ สัญญาณเสียงปอด หรือสัญญาณเสียงไอ"

อ่านข่าวเต็มได้ที่: Newsweek


วันพุธที่ 7 กันยายน พ.ศ. 2565

เพิ่มประสิทธิภาพการผสมของไหลด้วยการเรียนรู้ของเครื่อง

RL-for-Fluid-Mixing
ภาพจาก Tokyo University of Science (Japan)

นักวิจัยในญี่ปุ่นได้เสนอแนวทางการเรียนรู้ของเครื่อง (machine learning) เพื่อเพิ่มประสิทธิภาพการผสมของไหล (fluid) สำหรับการไหลแบบราบ

นักวิจัยใช้การเรียนรู้การแบบเสริมแรง (reinforcement learning) หรือ RL ซึ่งตัวแทนอัจฉริยะ (intelligent agent) ดำเนินการในสภาพแวดล้อมเพื่อทำให้รางวัลสะสมมีค่าสูงสุด

Masanobu Inubushi แห่งมหาวิทยาลัยวิทยาศาสตร์แห่งโตเกียวกล่าวว่าโปรแกรมดังกล่าว "ระบุการควบคุมการไหลที่มีประสิทธิภาพ ซึ่งจบลงด้วยการผสมที่รวดเร็วแบบทวีคูณโดยไม่ต้องมีความรู้มาก่อน"

วิธีการ RL ยังช่วยให้เกิดการถ่ายโอนการเรียนรู้ที่มีประสิทธิภาพของ "เครื่องผสม" ที่ผ่านการฝึกอบรมมาแล้ว ซึ่งช่วยลดเวลาและค่าใช้จ่ายในการฝึกอบรมได้อย่างมาก

อ่านข่าวเต็มได้ที่: Tokyo University of Science (Japan)

วันอังคารที่ 6 กันยายน พ.ศ. 2565

อัลกอริทึมปรับการใช้ยาปฏิชีวนะให้เหมาะสมในที่ที่สุขอนามัยและสุขาภิบาลไม่ดี

polluted-water
ภาพจาก University of Florida Health

กลุ่มนักวิทยาศาสตร์นานาชาติได้พัฒนาเครื่องมือที่ใช้ปัญญาประดิษฐ์ซึ่ งใช้อัลกอริทึมคำนวณว่าอาการท้องร่วงเกิดจากไวรัสเพียงอย่างเดียวหรือไม่ เพื่อจำกัดการใช้ยาปฏิชีวนะอย่างผิด ๆ 

อัลกอริทึมการทำนายอาการท้องร่วง (Diarrheal Etiology Prediction) หรือ DEP จะขุดชุดข้อมูลที่มีประวัติทางคลินิก อาการเฉพาะของผู้ป่วย และข้อมูลสภาพอากาศในท้องถิ่น นักวิจัยใช้มันเพื่อตรวจสอบสมมติฐานของพวกเขาว่า มันจะช่วยในการตัดสินใจของแพทย์ในการสั่งจ่ายยาปฏิชีวนะให้กับเด็กที่มีอาการท้องร่วงหรือไม่

โครงการนี้มีแพทย์เข้าร่วม 30 คนและใช้บันทึกสุขภาพของผู้ป่วยเกือบ 1,000 คนอายุระหว่าง 2 เดือนถึง 5 ขวบ ในสถานที่ 7 แห่งในบังกลาเทศและมาลี

อ่านข่าวเต็มได้ที่: University of Florida Health


วันจันทร์ที่ 5 กันยายน พ.ศ. 2565

หุ่นยนต์สุนัขเรียนรู้ที่จะเดินบนสภาพแวดล้อมที่ยากลำบากได้ใน 20 นาที

robot-dog
ภาพจาก New Scientist

นักวิจัยจาก University of California, Berkeley (UC Berkeley) ได้พัฒนาอัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) ที่ช่วยให้สุนัขหุ่นยนต์เรียนรู้ที่จะเดินทางในภูมิประเทศที่ยากลำบากในเวลาเพียง 20 นาที

อัลกอริทึม Q-learning ไม่ต้องการตัวแบบของภูมิประเทศเป้าหมาย Sergey Levine จาก UC Berkeley กล่าวว่า ผลที่ได้คือ "เราไม่จำเป็นต้องเข้าใจว่าสภาพแวดล้อมกายภาพเป็นอย่างไร เราเพียงแค่ปล่อยหุ่นยนต์เข้าไปในสภาพแวดล้อมและเปิดใช้งาน"  อัลกอริทึมจะสอนหุ่นยนต์โดยให้รางวัลสำหรับการกระทำที่ประสบความสำเร็จแต่ละครั้งจนกว่าจะถึงเป้าหมายสูงสุด 

นักวิจัยแสดงให้เห็นว่าหุ่นยนต์สามารถเดินบนภูมิประเทศที่ไม่เคยพบมาก่อน รวมทั้งหญ้า ชั้นเปลือกไม้ ที่นอนเมมโมรี่โฟม และเส้นทางเดินป่า หลังจากให้ฝึกในพื้นที่แต่ละแบบประมาณ 20 นาที

อ่านข่าวเต็มได้ที่: New Scientist

วันอาทิตย์ที่ 4 กันยายน พ.ศ. 2565

PetTrack ช่วยให้เจ้าของรู้ว่าสุนัขอยู่ที่ไหน

dog-with-PetTrack
ภาพจาก Georgia Tech Research

ระบบ PetTrack ที่พัฒนาโดยนักวิจัยของ Georgia Institute of Technology (Georgia Tech) ใช้เซ็นเซอร์ร่วมกันเพื่อบอกเจ้าของสัตว์เลี้ยงว่าสัตว์ของพวกเขาอยู่ที่ไหนในแบบเรียลไทม์ "PetTrack ประกอบด้วยสองอย่าง: หนึ่งคือการรู้ตำแหน่งภายในบ้านของสัตว์เลี้ยง และสองพยายามที่จะเข้าใจว่าพวกมันทำอะไรอยู่" Ashutosh Dhekne จาก Georgia Tech กล่าว

อุปกรณ์ที่สามารถติดเข้ากับปลอกคอของสัตว์เลี้ยงได้นั้นมีเซ็นเซอร์ไร้สายที่ใช้คลื่นวิทยุอัลตร้าไวด์แบนด์เพื่อระบุตำแหน่งของสัตว์ในระยะห่างสูงสุด 100 ฟุต รวมถึง แอคเซเลโรมิเตอร์ (accelerometer๗ เพื่อบอกว่ามันยืน นั่ง หรือพักอยู่ ผู้ใช้สามารถดูข้อมูลนี้ผ่านแอปพลิเคชันสมาร์ตโฟน

Dhekne กล่าวว่า "เมื่อรวมเอาข้อมูลที่บอกว่าสัตว์เลี้ยงอยู่ที่ไหน และเข้าใจว่ามันกำลังทำอะไร เราสามารถสร้างแผนที่สรุปว่าสัตว์เลี้ยงอยู่ที่ไหนในระหว่างวัน และกิจกรรมที่สัตว์เลี้ยงกำลังทำอยู่"

อ่านข่าวเต็มได้ที่: Georgia Tech Research


วันเสาร์ที่ 3 กันยายน พ.ศ. 2565

การจำลองการขับรถที่เหมือนในชีวิตจริงมากขึ้น

drive-simulator
ภาพจาก Ohio State News

นักวิจัยจาก Ohio State University (OSU) ได้ฝึกอบรม Generative Adversarial Network (GAN) เพื่อสร้างฉากสามมิติที่เหมือนจริงจากการสุ่มภาพถ่ายเพื่อใช้จำลองการขับขี่ นักวิจัยสร้างโปรแกรมจำลองของพวกเขาจากเครื่องมือเปิดเผยต้นฉบับ (open source)  CARLA จากนั้นจึงใช้โปรแกรมสังเคราะห์รูปภาพที่ใช้ GAN เพื่อเรนเดอร์ (render) และรวมองค์ประกอบพื้นหลังเข้ากับวัตถุที่ถูกเรนเดอร์ไว้แล้ว

 นักวิจัยระบุว่าการรวมวัตถุพื้นหน้าแยกจากฉากหลังทำให้ได้ภาพที่เหมือนจริงมากขึ้น Ekim Yurtsever จาก OSU กล่าวว่า "เราไม่สามารถแทนที่การทดสอบในโลกจริงได้ แต่ถ้าเราสามารถทำให้การจำลองดีขึ้นอีกเล็กน้อย เราก็จะได้รับข้อมูลเชิงลึกที่ดีขึ้นเกี่ยวกับวิธีการปรับปรุงระบบขับขี่อัตโนมัติและวิธีที่เราโต้ตอบกับพวกมัน"

อ่านข่าวเต็มได้ที่: Ohio State News

วันศุกร์ที่ 2 กันยายน พ.ศ. 2565

AI เรียนแบบรูปของภาษามนุษย์ได้

AI-Learn-Language
ภาพจาก MIT News

นักวิจัยจาก Massachusetts Institute of Technology, Cornell University, และ McGill University  ได้พัฒนาแบบจำลองปัญญาประดิษฐ์ (artificial intelligence) ที่สามารถเรียนรู้กฎเกณฑ์และแบบรูป (pattern) ของภาษามนุษย์ได้โดยอัตโนมัติ โดยไม่ต้องอาศัยคำแนะนำโดยเฉพาะเจาะจงจากมนุษย์

แบบจำลองนี้ได้รับการฝึกอบรมและทดสอบปัญหาจากตำราภาษาศาสตร์ใน 58 ภาษาที่เกี่ยวข้องกับการเปลี่ยนแปลงรูปแบบคำ นักวิจัยตั้งข้อสังเกตว่าตัวแบบสามารถกำหนดชุดกฎที่ถูกต้องเพื่ออธิบายการเปลี่ยนแปลงรูปแบบคำจาก 60% ของปัญหา

Kevin Ellis จาก Cornell กล่าวว่า "สิ่งหนึ่งที่น่าประหลาดใจที่สุดคือเราสามารถเรียนรู้ข้ามภาษาได้ แต่ดูเหมือนจะไม่สร้างความแตกต่างมากนัก นั่นบอกเราสองสิ่ง บางทีเราอาจต้องการวิธีการที่ดีกว่าสำหรับการเรียนรู้ข้ามปัญหา และบางที ถ้าเราไม่สามารถคิดวิธีการเหล่านั้นได้ งานนี้อาจช่วยให้เราตรวจสอบแนวคิดต่าง ๆ ที่เรามีเกี่ยวกับความรู้ที่จะแบ่งปันข้ามปัญหาได้"

อ่านข่าวเต็มได้ที่: MIT News

วันพฤหัสบดีที่ 1 กันยายน พ.ศ. 2565

การรู้จำใบหน้าอาจมีปัญหาในการรู้จำใบหน้าของเราถ้าเราแก่ขึ้นห้าปี

face-aging
ภาพจาก New Scientist

การทดสอบที่ออกแบบโดย Marcel Grimmer แห่งมหาวิทยาลัยวิทยาศาสตร์และเทคโนโลยีแห่งนอร์เวย์ และเพื่อนร่วมงานพบว่าอัลกอริธึมการจดจำใบหน้าเริ่มประสบปัญหาในการระบุตัวบุคคลหลังจากที่บุคคลมีอายุเพิ่มขึ้น 5 ปี 

นักวิจัยใช้โปรแกรมเปิดเผยโค้ดต้นฉบับของเครื่องมือจดจำใบหน้าที่ต่างจากตำรวจและผู้ผลิตสมาร์ทโฟนใช้ และสังเคราะห์ภาพคนที่มีอายุเพิ่มขึ้นด้วยปัญญาประดิษฐ์ (artificial intelligence) จำนวน 50,000 ภาพ 

Grimmer กล่าวว่าความแม่นยำของเครื่องมือลดลงอย่างต่อเนื่องนับจากจุดที่ภาพอ้างอิงเริ่มถูกปรับเปลี่ยน อัลกอริทึมที่ใช้ในการทำให้ใบหน้าแก่โดยสังเคราะห์จากภาพอ้างอิงยังได้รับการพิสูจน์ว่ามีประสิทธิภาพมากกว่าเมื่อเป้าหมายอยู่ระหว่าง 20 ถึง 40 ปี เมื่อเทียบกับเด็กและผู้สูงอายุ ความหมายก็คือ รูปภาพใหม่ ๆ อาจต้องถูกใช้บ่อยขึ้นเพื่อรักษาความถูกต้องและความปลอดภัย

อ่านข่าวเต็มได้ที่: New Scientist