นักวิทยาศาสตร์คอมพิวเตอร์จากมหาวิทยาลัย Princeton และ Stanford ได้ร่วมกันหาวิธีที่จะได้ชุดข้อมูลที่เป็นภาพของคนที่ไม่มีอคติหรือมีน้อยลง โดยจะปรับปรุงชุดข้อมูลที่ชื่อ ImageNet ซึ่งมีภาพอยู่ประมาณ 14 ล้านภาพที่ใช้เป็นเครื่องมือสำคัญทางด้าน Computer Vision ในทศษวรรษที่ผ่านมา ImageNet นั้นไม่ได้มีแต่รูปของคนแต่มีรูปของวัตถุ และสิ่งก่อสร้างต่าง ๆ อยู่ด้วย โดยฐานข้อมูลมีขนาดเพิ่มขึ้นอย่างรวดเร็วจากการที่ทั้งมีระบบเก็บรูปอัตโนมัติ และมีผู้คนช่วยกันส่งรูปหรือคำอธิบายรูปเข้ามา แต่ประเด็นที่นักวิจัยกำลังสนใจก็คือกลุ่มที่เป็นรูปภาพบุคคล ซึ่งที่กังวลกันก็คือความอคติโดยเฉพาะ ในด้านที่ค่อนข้างจะมีความสำคัญเช่นเชื้อชาติ และเพศสภาพ นอกจากนี้ยังอาจมีรูปภาพที่มีคนเข้ามาเกี่ยวข้องซึ่งเป็นผลที่เกิดขึ้นโดยไม่ได้ตั้งใจในช่วงการสร้างข้อมูลรูปภาพ โดยทางผู้ดูแลได้มีระบบเพื่อตรวจจับรูปภาพเหล่านี้แล้ว และได้เสนอให้ลบภาพเหล่านี้ออกไป นอกจากนี้ยังได้ออกแบบเครื่องมือเพื่อให้ผู้ใช้ได้ระบุและเลือกชุดข้อมูลของคน เพื่อให้ได้ข้อมูลที่มีความสมดุลทั้งด้านอายุ การแสดงออกทางเพศ หรือสีผิว ซึ่งก็จะข่วยให้การพัฒนาขั้นตอนวิธีในการจำแนกคน จากท่าทาง หรือใบหน้า ทำได้โดยปราศจากอคติมากขึ้น (ก็คือทำให้ได้ผลลัพธ์ที่ถูกต้องมากขึ้นนั่นเอง) นักวิจัยบอกว่างานด้าน computer vison ได้ถูกนำไปใช้มากมายในหลากหลายบริบท ถึงตอนนี้เราก็ต้องกลับมามองด้านความเที่ยงตรง (fairness) ของข้อมูลกันได้แล้ว
อ่านข่าวเต็มได้ที่: Princeton University News
เพิ่มเติมเสริมข่าว:
คำว่าถ้าส่งขยะเข้าไปก็ได้ขยะออกมา ยังคงใช้ได้เสมอกับวงการคอมพิวเตอร์ ตัวอย่างความอคติก็คือการที่เราอาจจะมีข้อมูลแบบใดแบบหนึ่งมากเกินไป หรือมีข้อมูลที่อาจไม่ถูกต้อง ตัวอย่างเช่นถ้าค้นคำคำหนึ่งที่เกี่ยวกับการเหยียดเพศ มันก็อาจจะแสดงหน้าคนขึ้นมา โดยที่คนนั้นก็อาจไม่ได้เหยียดเพศ แต่อาจจะไปอยู่ในรูปเดียวกับคนที่พูดจากเรื่องเหยียดเพศ เอาง่าย ๆ ก็ได้ครับ พวกเราเคยค้นชื่อตัวเองด้วย Google ไหมครับ ถ้าไม่เคยลองก็ลองดูนะครับ แล้วลองกดตรง images ดูว่าผลเป็นยังไง ดังนั้นในการฝึกสอนระบบถ้าฝึกสอนด้วยข้อมูลเหล่านี้ มันจะทำให้เวลาระบบประมวลผลมันก็จะเกิดความไม่เป็นธรรม เปรียบง่าย ๆ ก็เหมือนกับเราฟังความข้างเดียว หรือมีอคติกับอีกฝ่ายเป็นทุนอยู่แล้วนั่นแหละครับ ผลลัพธ์การตัดสินของเรามันก็จะไม่เที่ยงธรรม
ไม่มีความคิดเห็น:
แสดงความคิดเห็น