วันพฤหัสบดีที่ 11 พฤศจิกายน พ.ศ. 2564

คำที่ใช้ในงานวิจัยด้านการทำเหมืองข้อความนั้นมีอคติ

coding
Photo by Shahadat Rahman on Unsplash

นักวิจัยของ Cornell University พบรายการคำศัพท์ที่บรรจุและแบ่งปันกันเพื่อหาปริมาณอคติในข้อความออนไลน์ มักประกอบด้วยคำหรือ "กลุ่มคำ (seeds)" ที่มีอคติทั้งโดยตัวมันเองและกลุ่มของมัน ตัวอย่างเช่น การมีคำว่า "แม่ (mom)" ในกลุ่มคำที่ใช้วิเคราะห์ข้อความที่เกี่ยวกับเรื่องเพศในการทำงานบ้านจะทำให้ได้ผลลัพธ์เป็นเพศหญิง Maria Antoniak จาก Cornell กล่าวว่า "เป้าหมายไม่ใช่เพื่อด้อยค่าการค้นหา แต่เพื่อช่วยให้นักวิจัยคิดถึงความเสี่ยงที่อาจเกิดขึ้นจากกลุ่มคำที่ใช้สำหรับการตรวจจับอคติ"  เธอกล่าวว่ากลุ่มคำบางกลุ่มไม่มีเอกสาร หรืออยู่ลึกเข้าไปในรหัสของตัวแบบและชุดข้อมูล Antoniak แนะนำให้นักวิจัยด้านมนุษยศาสตร์ดิจิทัลและการประมวลผลภาษาธรรมชาติ ติดตามต้นกำเนิดของชุดกลุ่มคำและคุณสมบัติของมัน ตรวจสอบและทดสอบด้วยตนเอง และจัดทำเอกสารเกี่ยวกับกลุ่มคำและเหตุผลของการได้มาของกลุ่มคำนี้ 

อ่านข่าวเต็มได้ที่: Cornell Chronicle

ไม่มีความคิดเห็น:

แสดงความคิดเห็น