วันอังคารที่ 25 กรกฎาคม พ.ศ. 2566

อัลกอริทึมเรียนภาษาเคมีช่วยเร่งงานวิจัยด้านโพลีเมอร์

polymer-chemical-language
ภาพจาก Georgia Tech News Center

ตัวแบบการเรียนรู้ของเครื่อง (machine learning) polyBERT ที่พัฒนาโดย Christopher Kuenneth และ Rampi Ramprasad จาก Georgia Institute of Technology สามารถปฏิวัติการวิจัยโพลิเมอร์ได้

นักวิจัยได้ฝึกฝนโพลีเบิร์ตบนชุดข้อมูลโครงสร้างทางเคมีของพอลิเมอร์ 80 ล้านชุด เพื่อให้สามารถใช้ "ภาษาเคมี" ของโพลิเมอร์ได้อย่างคล่องแคล่ว

อัลกอริทึมดึงข้อมูลที่มีความหมายมากที่สุดจากโครงสร้างทางเคมีโดยใช้สถาปัตยกรรม Transformer ที่ใช้ในตัวแบบภาษาธรรมชาติ (natural language)

PolyBERT มีประสิทธิภาพเหนือกว่าวิธีการพิมพ์ลายนิ้วมือทางเคมีแบบดั้งเดิมมากกว่าสองลำดับความสำคัญ (two orders of magnitude)  ทำให้สามารถคัดกรองพื้นที่โพลิเมอร์ขนาดใหญ่ได้อย่างรวดเร็วในระดับที่ไม่มีใครเทียบได้

อ่านข่าวเต็มได้ที่: Georgia Tech News Center

วันจันทร์ที่ 24 กรกฎาคม พ.ศ. 2566

แค่โบกมือเท่านั้น เทคโนโลยีไร้เงินสดของ Amazon "จ่ายด้วยฝ่ามือ"

pay-by-palm-Amazon
ภาพจาก CBS News

Amazon ยักษ์ใหญ่ด้านการค้าปลีกได้ประกาศบริการธุรกรรมแบบไร้สัมผัสใหม่ที่ช่วยให้ผู้ซื้อสามารถชำระเงินด้วยฝ่ามือได้ 

ผู้ใช้สามารถทำธุรกรรมโดยเลื่อนฝ่ามือไปเหนืออุปกรณ์ Amazon One ซึ่งสามารถอำนวยความสะดวกในการชำระเงิน การระบุตัวตน โปรแกรมสมาชิก และการเข้าใช้งาน

Amazon กล่าวว่าการชำระเงินด้วยฝ่ามือจะทำซ้ำไม่ได้ เนื่องจากระบบสร้าง "ลายเซ็นฝ่ามือ" ที่ไม่ซ้ำกันสำหรับลูกค้าแต่ละรายโดยการตรวจสอบฝ่ามือและการจัดเรียงของเส้นเลือด ลายเซ็นฝ่ามือแต่ละอันที่บริษัทเพิ่ม สอดคล้องกับการแสดงเวกเตอร์เชิงตัวเลข และจัดเก็บอย่างปลอดภัยใน Amazon Web Services cloud

เทคโนโลยีนี้มีให้บริการแล้วที่สาขาของ Amazon 200 แห่งใน 20 รัฐของสหรัฐฯ และบริษัทตั้งใจที่จะติดตั้งที่ร้านค้า Whole Foods และ Amazon Fresh มากกว่า 500 แห่งภายในสิ้นปีนี้

อ่านข่าวเต็มได้ที่: CBS News


วันอาทิตย์ที่ 23 กรกฎาคม พ.ศ. 2566

เครื่องมือค้นหาและสื่อสังคมสามารถทำนายการแพร่ระบาดของโรคได้

covid-search
ภาพจาก Waterloo News (Canada)

นักวิจัยจาก University of Waterloo ของแคนาดาพบว่าข้อความค้นหาบนเครื่องมือค้นหา และข้อมูลที่โพสต์บนโซเชียลมีเดียสามารถใช้ในการทำนายการระบาดของโรคได้ ในฐานะเป็นระบบเตือนภัยล่วงหน้าตามเวลาจริง

นักวิจัยใช้ข้อมูล Google Trends และ Twitter ในแคนาดาที่โพสต์ตั้งแต่เดือนมกราคมถึงมีนาคม 2020 เพื่อดึงคำหลักเกี่ยวกับอาการของ COVID-19 จากนั้นตรวจสอบข้อมูลนี้กับข้อมูลจาก COVID-19 Canada Open Data Working Group 

พวกเขาสังเกตเห็นความสัมพันธ์ที่ชัดเจนระหว่างข้อความค้นหาที่เกี่ยวข้องกับอาการของ COVID-19 และจำนวนผู้ป่วย COVID-19 รายวันภายในช่วงหนึ่งถึง 13 วัน 

ตัวแบบกดการเรียนรู้ของเครื่อง (machine learning) สำหรับการคาดการณ์ที่พวกเขาสร้างขึ้นนั้นทำงานได้ดีกับการใช้ข้อมูลจาก Google Trends มากกว่าข้อมูลจาก Twitter

อ่านข่าวเต็มได้ที่: Waterloo News (Canada)

วันเสาร์ที่ 22 กรกฎาคม พ.ศ. 2566

ความเทียงตรงของ chatGPT แย่ลง

chatgpt
ภาพจาก  Popular Science

นักวิจัยของ Stanford University และ University of Southern California, Berkeley (UC Berkeley)  แสดงให้เห็นถึงความน่าเชื่อถือที่ลดลงอย่างเห็นได้ชัดของ ChatGPT โมเดลภาษาขนาดใหญ่ (large language model ) หรือ LLM ของ OpenAI เมื่อเวลาผ่านไปโดยไม่มีคำอธิบายที่ชัดเจน

นักวิจัยได้ประเมินแนวโน้มของแชทบอทในการเสนอคำตอบด้วยระดับความแม่นยำและคุณภาพที่แตกต่างกันไป รวมถึงความเหมาะสมในการปฏิบัติตามคำสั่งด้วย ในตัวอย่างหนึ่ง นักวิจัยสังเกตว่าความแม่นยำเกือบ 98% ของ GPT-4 ในการระบุจำนวนเฉพาะลดลงเหลือน้อยกว่า 3% ระหว่างเดือนมีนาคมถึงมิถุนายน 2023 ในขณะที่ความแม่นยำของ GPT-3.5 เพิ่มขึ้น ความสามารถในการสร้างโค้ดของทั้ง GPT-3.5 และ GPT-4 แย่ลงในช่วงเวลาเดียวกันนั้น

Matei Zaharia จาก UC Berkeley แนะนำว่าการลดลงอาจสะท้อนถึงขีดจำกัดจากการเรียนรู้แบบเสริมแรง (reinforcement learning) จากข้อมูลตอบสนองของมนุษย์ หรืออาจเป็นบั๊กในระบบ

อ่านข่าวเต็มได้ที่: Popular Science

วันศุกร์ที่ 21 กรกฎาคม พ.ศ. 2566

วิธีการใหม่ในการมองความเป็นส่วนตัวของข้อมูล

locked-privacy-data
ภาพจาก MIT News

เมตริก (metric) ใหม่ที่พัฒนาขึ้นโดยนักวิจัยของ Massachusetts Institute of Technology (MIT) อนุญาตให้เพิ่มสัญญาณรบกวนจำนวนเล็กน้อยลงในตัวแบบเพื่อปกป้องข้อมูลที่ละเอียดอ่อนในขณะที่ยังคงรักษาความแม่นยำของตัวแบบ

เฟรมเวิร์กที่มาพร้อมกับเมตริก Probably Approximately Correct (PAC) Privacy จะระบุปริมาณสัญญาณรบกวนที่น้อยที่สุดที่จะเพิ่มโดยอัตโนมัติ โดยไม่ต้องรู้การทำงานภายในของตัวแบบ 

PAC Privacy พิจารณาความยากลำบากของฝ่ายตรงข้ามในการสร้างข้อมูลที่ละเอียดอ่อนขึ้นใหม่หลังจากเพิ่มสัญญาณรบกวน และกำหนดปริมาณสัญญาณรบกวนที่เหมาะสมที่สุดตามค่าเอนโทรปีในข้อมูลต้นฉบับจากมุมมองของฝ่ายตรงข้าม

มันทำงานโดยใช้อัลกอริทึมการฝึกอบรมการเรียนรู้ของเครื่อง (machine learning) ของผู้ใช้หลายครั้งในการสุ่มตัวอย่างข้อมูลที่แตกต่างกัน เปรียบเทียบความแปรปรวนของเอาต์พุตทั้งหมดเพื่อคำนวณว่าจะต้องเพิ่มสัญญาณรบกวนเท่าใด

อ่านข่าวเต็มได้ที่: MIT News