วันอังคารที่ 13 กันยายน พ.ศ. 2565

สมาร์ทโฟนสั่งงานด้วยเสียงมุ่งเป้ากลุ่มคนไม่รู้หนังสือในแอฟริกา

phone-with-African-Languages
ภาพจาก Voice of America News

บริษัท Cerco ร่วมกับ Orange บริษัทโทรคมนาคมของฝรั่งเศส กำลังเปิดตัว "ซูเปอร์โฟน" ที่ติดตั้งระบบผู้ช่วยเสียงสำหรับประชากรประมาณ 40% ของไอวอรี่โคสต์ที่ไม่สามารถอ่านหรือเขียนได้

โทรศัพท์ราคา 60,000 CFA ฟรังก์ (92 ดอลลาร์) มีเป้าหมายเพื่อช่วยให้ผู้คนในประเทศทำงานประจำวันได้ง่ายขึ้น เช่น การตรวจสอบยอดเงินคงเหลือในธนาคาร

โทรศัพท์ใช้ระบบปฏิบัติการ Kone ของ Cerco โดยสามารถตอบสนองต่อคำสั่งจาก 17 ภาษาที่ใช้ในไอวอรี่โคสต์ รวมถึงภาษาแอฟริกาอื่น ๆ อีก 50 ภาษา

เป้าหมายสูงสุดของ Cerco คือการที่จะเข้าถึงประชากรครึ่งหนึ่งของทวีปด้วยโทรศัพท์ Alain Capo-Chichi แห่ง Cerco กล่าวว่า "สถาบันต่างๆ ให้ความสำคัญกับการทำให้ผู้คนรู้หนังสือก่อนที่จะทำให้เทคโนโลยีสามารถเข้าถึงได้ วิธีของเราข้ามการอ่านออกเขียนได้ และมุ่งตรงไปที่การบูรณาการผู้คนเข้าสู่ชีวิตทางเศรษฐกิจและสังคม"

อ่านข่าวเต็มได้ที่: Voice of America News

วันจันทร์ที่ 12 กันยายน พ.ศ. 2565

กล้องไร้เลนส์สร้างภาพ 3 มิติจากการเปิดรับแสงครั้งเดียว

scientists-in-lab
ภาพจาก Optica

นักวิทยาศาสตร์ได้สร้างกล้องไร้เลนส์ที่สร้างภาพสามมิติ จากการเปิดรับแสงครั้งเดียวในแบบเรียลไทม์ "เราเรียกกล้องของเราว่าไม่มีเลนส์ เพราะจะแทนที่เลนส์จำนวนมากที่ใช้ในกล้องทั่วไปด้วยอาร์เรย์ของไมโครเลนส์ที่บางและน้ำหนักเบาซึ่งทำจากโพลีเมอร์ที่ยืดหยุ่นได้" Weijian Yang จาก University of California กล่าว

ไมโครเลนส์แต่ละตัวในอาร์เรย์ช่วยให้กล้องดูวัตถุจากมุมหรือมุมมองต่างๆ ทำให้สามารถให้ข้อมูลเชิงลึกได้ Yang กล่าวว่าอุปกรณ์ดังกล่าวใช้โครงข่ายประสาทเทียม (neural network) "ตามแบบจำลองทางกายภาพของการสร้างภาพใหม่ ซึ่งทำให้กระบวนการเรียนรู้ง่ายขึ้นมาก และส่งผลให้มีการสร้างภาพใหม่ที่มีคุณภาพสูง"

อ่านข่าวเต็มได้ที่: Optica

วันอาทิตย์ที่ 11 กันยายน พ.ศ. 2565

การมีอคติของภาษาอังกฤษในการคอมพิวเตอร์แก้ได้ด้วยรูปภาพ

phone-describe-image
ภาพจาก University of Copenhagen (Denmark)

เกณฑ์มาตรฐานที่ใช้รูปภาพสามารถเอาชนะอคติทางวัฒนธรรมที่เกิดจากชุดข้อมูลการฝึกอบรมการเรียนรู้ของเครื่อง (machine learning) หรือ ML ที่เขียนเป็นภาษาอังกฤษได้

กลุ่มนักวิจัยนานาชาติที่นำโดย University of Copenhagen (KU)  ของเดนมาร์ก ได้พัฒนาเครื่องมือ Image-Grounded Language Understanding Evaluation (IGLUE) ซึ่งสามารถให้คะแนนประสิทธิภาพของทางแก้ปัญหาของ ML ใน 20 ภาษา

ป้ายกำกับรูปภาพใน ML มักเป็นภาษาอังกฤษ ในขณะที่ IGLUE ครอบคลุมตระกูลภาษา 11 ตระกูล บทภาพยนตร์ 9 เรื่อง และพื้นที่มาโครทางภูมิศาสตร์ 3 แห่ง

ภาพของ IGLUE นำเสนอองค์ประกอบเฉพาะวัฒนธรรมที่จัดทำโดยอาสาสมัครในประเทศที่มีความหลากหลายทางภูมิศาสตร์ในภาษาธรรมชาติของพวกเขา

Emanuele Bugliarello จาก KU กล่าวว่านักวิจัยหวังว่าวิธีการพื้นฐานของ IGLUE สามารถปรับปรุงวิธีแก้ปัญหา "ซึ่งช่วยผู้พิการทางสายตาในการติดตามเนื้อเรื่องของภาพยนตร์หรือการสื่อสารด้วยภาพประเภทอื่น"

อ่านข่าวเต็มได้ที่: University of Copenhagen (Denmark)

วันเสาร์ที่ 10 กันยายน พ.ศ. 2565

ยุคต่อไปของการช่วยการได้ยิน อ่านริมฝีปากได้แม้ใส่หน้ากากอนามัย

hearing-aids-read-lip-through-mask
ภาพจาก University of Glasgow (U.K.)

ทีมนานาชาติที่นำโดยนักวิจัยจาก University of Glasgow แห่งสหราชอาณาจักรได้พัฒนาระบบที่สามารถอ่านริมฝีปากได้อย่างแม่นยำผ่านหน้ากากอนามัย โดยใช้การตรวจจับด้วยคลื่นความถี่วิทยุ (radio frequency) หรือ RF และปัญญาประดิษฐ์ (artificial intelligence) หรือ AI  

นักวิจัยได้ให้อาสาสมัครพูดเสียงสระซ้ำในขณะที่สวมหน้ากากและถอดหน้ากาก โดยมีสัญญาณ RF จากเซ็นเซอร์เรดาร์เฉพาะ และเครื่องส่งสัญญาณ Wi-Fi ที่ใช้สแกนใบหน้าขณะพูดและในขณะที่อยู่นิ่ง 

ตัวอย่างข้อมูลผลลัพธ์ที่ได้ 3,600 ตัวอย่างถูกใช้เพื่อฝึกอัลกอริทึมการเรียนรู้ของเครื่อง (machine learning) และการเรียนรู้เชิงลึก (deep learning) เพื่อรับรู้การเคลื่อนไหวของริมฝีปากและปากที่เกี่ยวข้องกับเสียงสระแต่ละเสียง

เนื่องจากสัญญาณ RF สามารถทะลุผ่านหน้ากากได้ อัลกอริทึมการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกจึงสามารถเรียนรู้ที่จะระบุการก่อตัวของเสียงสระจากผู้พูดที่สวมหน้ากาก

อ่านข่าวเต็มได้ที่: University of Glasgow (U.K.)

วันศุกร์ที่ 9 กันยายน พ.ศ. 2565

Google Chrome ออกแพตช์แก้ไขช่องโหว่แบบซีโรเดย์ที่มีความรุนแรงมากไปแล้วหกครั้งในปีนี้

ภาพจาก Ars Technica

วิศวกรของ Google ได้เผยแพร่การอัปเดตฉุกเฉินสำหรับเบราว์เซอร์ Chrome เพื่อแก้ไขข้อบกพร่องซีโร่เดย์ (Zero-day) ที่มีความรุนแรงสูง 

Google กล่าวว่าช่องโหว่ (CVE-2022-3075) เกิดจาก "การตรวจสอบข้อมูลไม่เพียงพอใน Mojo" ซึ่งเป็นองค์ประกอบ Chrome สำหรับการส่งข้อความระหว่างและภายในโพรเซสระหว่างเบราว์เซอร์และระบบปฏิบัติการ

"Google ทราบดีว่ามีรายงานว่ามีช่องโหว่สำหรับ CVE-2022-3075 อยู่ทั่วไป" บริษัทอธิบายโดยไม่เปิดเผยว่าแฮ็กเกอร์กำลังใช้ประโยชน์จากช่องโหว่ หรือเพียงแค่ครอบครองโค้ดที่ใช้เจาะระบบ" 

วิศวกรยังได้ปรับปรุงเบราว์เซอร์ Edge ของ Microsoft ที่ใช้เอ็นจิ้น Chromium เดียวกันกับ Chrome เพื่อแก้ไขข้อผิดพลาดเดียวกัน การใช้ประโยชน์จาก Mojo ถือเป็นช่องโหว่ซีโรเดย์ ครั้งที่หกที่ Chrome พบในปีนี้

อ่านข่าวเต็มได้ที่: Ars Technica