Friday, June 3, 2016

อคติในอัลกอริทึม (Algorithm Bias) เมื่อคอมพิวเตอร์ไม่ได้เป็นกลางอย่างที่คิด

เมื่อช่วงรอบเดือนที่ผ่านมา มีข่าวที่ระบุว่า Facebook ทำการควบคุมเนื้อหาในส่วนของ Trending ที่มักจะแสดงในหน้าแรกของ News Feed ซึ่งกลายมาเป็นเรื่องใหญ่ จนนำมาสู่การออกมายืนยันจากผู้บริหารของ Facebook เองว่าไม่มีการควบคุมใดๆ แต่ในภายหลังก็มีการยกเลิกอัลกอริทึมดังกล่าวนี้ไป

ประเด็นดังกล่าวนี้อาจสะท้อนถึงสิ่งที่เรียกว่า “Algorithm Bias” หรืออคติในอัลกอริทึม (บางคนแปลว่า “ความไม่เป็นกลางของอัลกอริทึม”) ซึ่งแปลว่าอัลกอริทึม มีกลไกและกระบวนการในการประมวลผลและให้ค่าหรือผลลัพธ์ที่ไม่เป็นกลางอย่างที่ควรจะเป็น และการนำเสนอข้อมูลที่ไม่เป็นกลางเหล่านี้อาจนำไปสู่การชักนำความคิด ไม่ก็เปลี่ยนแปลงชีวิตผู้คนที่เกี่ยวข้องได้ และถือเป็นประเด็นสำคัญของบทความนี้ 

บทความนี้จะนำเสนอความเข้าใจพื้นฐานว่าอะไรคืออคติในอัลกอริทึม และส่งผลกระทบอย่างไรได้บ้าง รวมถึงจะแก้ไขปัญหาอย่างไร ทั้งนี้ มุมมองในบทความชิ้นนี้มาจากฐานของผู้เขียนที่อยู่ในโลกสังคมศาสตร์ มองมายังปัญหาซึ่งคาบเกี่ยวกับปัญหาในโลกคอมพิวเตอร์ ดังนั้นบทความชิ้นนี้จะไม่ลงรายละเอียดในเชิงเทคนิคมากนัก ด้วยข้อจำกัดทางความรู้ที่มี

กรณี Facebook กับการใช้อัลกอริทึมเลือกข้อมูลมานำเสนอบน Trending

เมื่อช่วงต้นเดือนพฤษภาคม มีบทสัมภาษณ์อดีตพนักงานของ Facebook ที่ระบุว่าบริษัทมีทีมงานที่จะคอยคัดเลือกข่าวขึ้นสู่ส่วน Trending หรือเป็นส่วนที่บอกว่าอะไรกำลังเป็นที่พูดคุยกันบน Facebook ซึ่งการคัดเลือกนี้จะทำผ่านอัลกอริทึมมาก่อนชั้นหนึ่ง และจะถูกคัดกรองอีกทีหนึ่ง ซึ่งภายหลังทั้งผู้บริหารและผู้ก่อตั้ง ออกมายืนยันว่า พนักงานมีหน้าที่ในการดูแล (supervision) เท่านั้น ไม่ได้มีส่วนเกี่ยวข้องกับการเลือกประเด็นข่าวแต่อย่างใดแต่ให้หลังเพียงสองสัปดาห์ บริษัทออกมาประกาศว่าจะปรับปรุงแนวทางในการนำเสนอบนระบบ Trending โดยยกเลิกระบบเดิมที่อิงอัลกอริทึม และใช้เนื้อหาจากสำนักข่าวและเว็บไซต์ข่าวชื่อดังแทน พร้อมยืนยันว่าไม่มีความผิดปกติหรือความไม่เป็นกลางในระบบการคัดเลือกข่าวขึ้นส่วน Trending บนหน้า Facebook



ในแง่หนึ่ง กรณีของ Facebook สะท้อนถึงอำนาจของผู้ให้บริการต่างๆ บนโลกออนไลน์ ว่ามีอำนาจในการเป็นผู้คัดเลือกเนื้อหาและแนวทางในการสื่อสาร (gatekeeper) ซึ่งไม่ใช่ประเด็นหลักของบทความ (ทว่ามีความเกี่ยวพัน ซึ่งจะแสดงให้เห็นในภายหลัง) แต่ในอีกมิติหนึ่ง การที่บริษัทออกมายอมเปลี่ยนแนวทางในการคัดเลือกข่าวที่แต่เดิมอิงกับระบบอัลกอริทึม เป็นการยอมรับทางอ้อมว่าอัลกอริทึมตนเองก็มีส่วนที่ทำให้การคัดเลือกประเด็นบน Trending ผิดไปจากที่ควรจะเป็น ซึ่งเมื่อไปรวมกับแนวทางเดิมที่อาศัยพนักงานช่วยตรวจสอบประเด็น ก็กลายเป็นว่าทำให้การนำเสนอบนส่วน Trending บิดไปจากเดิม

เราไม่มีทางรู้ได้ว่าเบื้องหลังเกิดอะไรขึ้นกับอัลกอริทึมที่ Facebook ยกเลิกและเปลี่ยนไปใช้แนวทางดูจากสำนักข่าวแทน แต่แนวทางที่สงสัยได้มีอยู่สองประการ ประการแรกคืออัลกอริทึมไม่มีประสิทธิภาพพอ ซึ่งในกรณีแบบนี้ Facebook สามารถปรับปรุงอัลกอริทึมได้ไม่ยากนัก (ด้วยความสามารถของบริษัทอย่าง Facebook คงไม่ใช่สิ่งที่ยากแน่นอน) และอีกประการคืออัลกอริทึมนั้นมีอคติในการเลือกข่าวอยู่จริงๆ ซึ่งทำให้การนำเสนอประเด็นใน Trending นั้นเปลี่ยนแปลงไปจากที่ควรจะเป็น และเป็นสมมติฐานของบทความนี้ว่าอัลกอริทึมของ Facebook ในส่วนของ Trending มีสิ่งที่เรียกว่า อคติในอัลกอริทึม ทำให้บริษัทตัดสินใจต้องยกเลิกการใช้อัลกิริทึมนี้ไป

อัลกอริทึม อคติในอัลกอริทึม กับความเป็นกลางของคอมพิวเตอร์

หากอธิบายอย่างง่ายที่สุด อัลกอริทึมคือชุดกระบวนการตัดสินใจที่ถูกเขียนขึ้นโดยคอมพิวเตอร์ เพื่อให้ประมวลผลข้อมูลแล้วให้ผลลัพธ์ออกมา Claire Cain Miller ผู้สื่อข่าวเทคโนโลยีของหนังสือพิมพ์ The New York Times เทียบว่าอัลกอริทึมเป็นเสมือน “กล่องดำ” (black box) สำหรับผู้ใช้เทคโนโลยี เพราะผู้ใช้ย่อมไม่มีทางรู้ว่าข้อมูลที่ถูกนำเสนอขึ้นมาให้กับตนเองนั้น ถูกคัดเลือกขึ้นมาอย่างไร และมีกระบวนการทำงานอย่างไร ตัวอย่างเช่น หากค้นหาคำว่า “พิซซ่า” บน Google ตัวระบบค้นหาก็จะมีคำค้นหาที่แนะนำเสริมขึ้นมาอย่าง “พิซซ่า ร้านอร่อย” หรือ “พิซซ่า 1 แถม 1” เป็นต้น



ความที่ผู้ใช้ทั่วไปไม่รู้ว่าอัลกอริทึมเหล่านี้ทำงานอย่างไรในการตัดสินใจข้อมูลบ้าง (แถมเกือบทุกบริษัทมักจะปิดส่วนนี้ไว้เป็นความลับ เพราะมักเกี่ยวพันกับวิธีการดำเนินธุรกิจ) ย่อมแปลว่าผู้ใช้ถูกควบคุมและรับรู้เนื้อหา รวมถึงมีแนวโน้มในการจะปฏิบัติตามข้อมูลหรือ output ที่ถูกคัดสรรจากอัลกอริทึมเหล่านี้ ในกรณีระบบค้นหา ผู้ใช้ย่อมมีความโน้มเอียงที่จะเชื่อผลลัพธ์จากการค้นหาในอันดับต้นๆ หรือในกรณีอื่นๆ เช่นการให้ระบบให้คะแนน (score) จากข้อมูลที่ถูกป้อนเข้าไป ผู้ใช้ก็ย่อมมีความโน้มเอียงที่จะเลือกข้อมูลเหล่านี้ได้

จุดนี้ทำให้อัลกอริทึมมีความสำคัญอย่างมากกับชีวิตประจำวันของคนใช้เทคโนโลยีทั่วไป และย่อมมีผลกับความเชื่อหรือการกระทำได้ในระยะยาว หากได้รับการนำเสนอข้อมูลที่ซ้ำๆ อย่างต่อเนื่อง และอัลกอริทึมนั้นไม่ได้มีเพียงแต่เฉพาะบนซอฟต์แวร์แต่เพียงอย่างเดียว แต่อุปกรณ์ฮาร์ดแวร์ต่างๆ ก็มีกระบวนการทำงานที่ผู้ใช้ไม่รู้เช่นกัน ดังนั้นอัลกอริทึมย่อมมีได้ทั้งระดับฮาร์ดแวร์และซอฟต์แวร์

สาเหตุที่ทำให้เราเชื่อในอัลกอริทึมเหล่านี้ เพราะความเชื่อเบื้องต้นที่ว่าคอมพิวเตอร์นั้นมีความเป็นกลาง (neutral) และไม่สนใจว่าผู้ใช้จะมีหน้าตาหรือลักษณะอย่างไร ความเชื่อที่ว่านี้ย่อมทำให้เราเชื่อว่าอัลกอริทึมมีความเป็นกลาง และเชื่อว่าจะประมวลผลได้เที่ยงตรง แต่จากกรณีอย่างซอฟต์แวร์ประเมินความเสี่ยงอาชญากรรมที่ศาลในสหรัฐอเมริกาใช้ ก็พบว่าความเชื่อนี้ไม่จริงเสมอไป และในกรณีของ Facebook เอง นักวิชาการอย่าง Zeynep Tufekci ผู้ช่วยศาสตราจารย์จาก University of North Carolina, Chapel Hill ก็เคยระบุว่าอัลกอริทึมของ Facebook ในส่วน News Feed มีการควบคุมเนื้อหาในระดับหนึ่งอยู่ด้วย สิ่งเหล่านี้ก็คือ “อคติในอัลกอริทึม”

อคติในอัลกอริทึมมีอยู่ได้แทบจะในทุกที่

อคติในอัลกอริทึม เป็นสิ่งที่สามารถเกิดขึ้นได้ในทุกขั้นตอนและทุกระดับ ในระดับของฮาร์ดแวร์ ขั้นตอนการออกแบบอุปกรณ์และการประมวลผล ตลอดจนถึงโครงสร้างในการตัดสินใจ ย่อมสามารถมีอคติเกิดขึ้นได้ แม้จะไม่เคยมีกรณีตรงๆ ออกมาให้ปรากฎชัดเจน แต่กรณีที่เทียบเคียงได้ดีที่สุดคือกรณีความผิดพลาดของหน่วยประมวลผล Intel Pentium ที่เรียกว่า “Pentium FDIV bug” ซึ่งทำให้การประมวลผลค่าบางอย่างในหน่วยประมวลมีความผิดไปจากปกติ ซึ่งแสดงให้เห็นว่าการออกแบบในระดับฮาร์ดแวร์ ย่อมมีผลที่ทำให้การประมวลค่าบางอย่างมีความผิดปกติไปได้

ในระดับของซอฟต์แวร์ก็ไม่ต่างจากฮาร์ดแวร์เช่นกัน กล่าวคือ ขั้นตอนการออกแบบอัลกอริทึมย่อมสามารถกำหนดและให้ระบบประมวลผลออกมาเพื่อให้ค่าที่ได้ตามต้องการอย่างไม่ยาก ตัวอย่างเช่น ผมอาจเขียนซอฟต์แวร์ในการจับฉลากรางวัล ที่สามารถกำหนดให้จับฉลากออกมาได้หมายเลขเพียงไม่กี่ชุดเท่านั้น แทนที่จะปล่อยให้ซอฟต์แวร์สุ่มตัวเลขเลือกอย่างเสรี หรือไม่ก็กำหนดขั้นตอนเอาไว้ว่าสุ่มได้กี่ครั้ง ซึ่งในทางคณิตศาสตร์ การสุ่มในแต่ละครั้งย่อมมีโอกาสที่จะได้ผลลัพธ์จากค่าที่เป็นไปได้อย่างจำกัด (แม้ว่าค่าเหล่านั้นบางทีอาจเป็นล้านๆ ค่าก็ตาม)



ตัวอย่างด้านบนอาจจะสะท้อนในระดับการออกแบบซอฟต์แวร์หรือฮาร์ดแวร์ในระดับที่ไม่ซับซ้อนนัก แต่ในความเป็นจริงที่ระบบคอมพิวเตอร์ทำงานได้ซับซ้อนกว่านั้นมาก กระบวนการใส่อคติลงไปในอัลกอริทึมไม่ใช่มีเพียงแต่กระบวนการสร้างอัลกอริทึมแบบที่ยกตัวอย่างเท่านั้น แต่ยังรวมไปถึงงานที่สลับซับซ้อน อย่างเช่นการนำเสนอข่าวใน News Feed ของ Facebook ซึ่งเกี่ยวพันกับข้อมูลขนาดใหญ่ (big data) เป็นต้น และในจุดนี้เองที่ทำให้คนที่ควบคุมการออกแบบอัลกอริทึม ย่อมสามารถใส่อคติหรือความไม่เป็นกลางลงไปได้ และย่อมทำให้คนออกแบบอัลกอริทึม มีอำนาจเหนือผู้ใช้งานอย่างหลีกเลี่ยงไม่ได้ (เช่นเคย News Feed ของ Facebook ที่เลือกคุณภาพของโพสต์ก็ย่อมเป็นหนึ่งในนั้น)

แม้ว่าเราจะปรับปรุงกระบวนการและตัดอคติออกไปจากการออกแบบอัลกอริทึมได้ แต่ก็ใช่ว่าเราจะขจัดอคติในอัลกอริทึมได้หมด David Oppenheimer นักวิชาการด้านกฎหมายการเลือกปฏิบัติจาก University of California, Berkeley ระบุว่า อัลกอริทึมที่แม้จะออกแบบมาเป็นกลางแค่ไหน ตัวมันเองมีความสามารถในการทำซ้ำอคติหรือการเลือกปฏิบัติจากสังคมด้วย สิ่งเหล่านี้ไม่ได้เกี่ยวข้องกับตัวของอัลกอริทึมโดยตรง แต่เป็นเรื่องที่ข้อมูลซึ่งอัลกอริทึมได้รับมา

อคติในอัลกอริทึมเหล่านี้มีความสำคัญในการชีวิตของเราอย่างหลีกเลี่ยงไม่ได้ โดยเฉพาะในปัจจุบันที่ระบบปัญญาประดิษฐ์ เริ่มมีบทบาทในชีวิตประจำวันของเรามากขึ้นเรื่อยๆ เนื่องจากคอมพิวเตอร์ที่มีปัญญาประดิษฐ์ย่อมเรียนรู้จากข้อมูลเหล่านี้ และทำให้การประมวลผลโดยใช้อัลกอริทึมของคอมพิวเตอร์มีความไม่เป็นกลางไปด้วย (เกิดสิ่งที่เรียกว่า Inductive bias) ตัวอย่างเช่นกรณีซอฟต์แวร์ประเมินความเสี่ยงอาชญากรรมของสหรัฐ ที่มักจะประเมินว่าคนผิวดำมีโอกาสกระทำผิดมากกว่าคนผิวขาว ทำให้การได้รับการประกันตัวต่ำลง หรือไม่ก็ต้องวางหลักประกันสูงมาก เป็นต้น

อคติในอัลกอริทึมในฐานะเครื่องมือแสดงออกและความเห็น?

ในมุมกลับที่อาจจะถกเถียงได้ อัลกอริทึมเองก็สามารถถูกพิจารณาได้ว่าเป็นงานที่แสดงถึงความคิดสร้างสรรค์และถือเป็นเสรีภาพได้ด้วยเช่นกัน ตัวอย่างเช่นกรณีของ Google ที่ศาลเห็นว่าอัลกอริทึมในการค้นหาถือเป็นสิทธิในการแสดงความเห็นได้ด้วย
แต่คำถามที่สำคัญก็คือ สิทธิในฐานะที่เป็นเครื่องมือแสดงออก โดยไม่ไปลิดรอนสิทธิเสรีภาพนั้นอยู่ตรงไหน? สำหรับนักวิชาการอย่าง Issah Berlin ที่มองเรื่องเสรีภาพในเชิงบวกและลบ (Positive/Negative Liberty) เรื่องนี้เป็นประเด็นที่ตอบได้ยากมาก ซึ่งถ้าตอบให้ง่ายที่สุด คือต้องพิจารณาตามสถานการณ์ว่าตกลงแล้วมันเป็นเครื่องมือในการแสดงออกที่ไปรุกรานสิทธิหรือเสรีภาพคนอื่นหรือไม่

กรณีของ Google เองก็ไม่ใช่จะได้ชัยชนะจากการตัดสินข้างต้นเสมอไป ตัวอย่างเช่นกรณีล่าสุดที่ศาลท้องถิ่นของ Florida ระบุว่า อัลกอริทึมของ Google ไม่ได้อยู่บนกรอบของ First Amendment ตามรัฐธรรมนูญของสหรัฐฯ แต่ประการใด

จะแก้ไขปัญหาอคติในอัลกอริทึม ไม่ใช่เรื่องง่าย แต่ก็ไม่ใช่เป็นไปไม่ได้

เช่นเดียวกับงานวิจัยในสายวิชาการที่อคติในการเลือกตัวอย่างหรือประเด็นเป็นสิ่งที่หลีกเลี่ยงไม่ได้ (และมักจะต้องถูกเขียนเอาไว้ในงานวิจัยอย่างชัดเจน) อคติในอัลกอริทึมเป็นสิ่งที่หลีกเลี่ยงไม่ได้ เพราะตราบใดที่มนุษย์ยังเป็นผู้ออกแบบและควบคุมอัลกอริทึมเหล่านี้ ย่อมหลีกเลี่ยงไม่ได้ที่จะใส่อคติของตนเองลงไปไม่ว่าจะโดยทางตรงหรือทางอ้อม

อย่างไรก็ตาม แนวทางที่พอเป็นไปได้ในการแก้ไขอคติในอัลกอริทึมคือการให้มีความโปร่งใสในการตรวจสอบอัลกอริทึม (algorithm transparency) ซึ่งแนวทางนี้คือการเน้นให้ซอฟต์แวร์เปิดซอร์สโค้ด (open source) สู่สาธารณะ เพื่อที่จะได้มีคนตรวจสอบความเป็นกลางของอัลกอริทึมเหล่านี้ให้มากที่สุด

อีกวิธีหนึ่ง ซึ่งถูกเสนอโดยนักวิจัยจากมหาวิทยาลัย Carnegie Mellon University ก็คือการป้อนข้อมูลเข้าไปในอัลกอริทึม แล้วสังเกตความผิดปกติของค่าที่ให้ออกมา วิธีหลังนี้เป็นการทดสอบกับซอฟต์แวร์ที่ปิดโค้ด ไม่เผยแพร่กับสาธารณะ ซึ่งยังอยู่ในสถานะของการเป็นงานวิจัยศึกษาเท่านั้น

ในท้ายที่สุด การแก้ไขคงตกไปอยู่ที่เรื่องของการออกแบบตัวอัลกอริทึมตั้งแต่แรก โดยนักพัฒนาเองจะต้องพยายามที่จะรักษาความเป็นกลางของอัลกอริทึมเหล่านี้ให้ได้มากที่สุด และออกแบบด้วยความเป็นกลางให้มากที่สุด และถ้ามีความเป็นใดๆ ที่จะต้องแก้ไขก็ควรดำเนินการให้เร็วที่สุด เพื่อจะได้ลดผลกระทบลงให้น้อยที่สุด สำหรับผู้ใช้เอง เรื่องเหล่านี้เป็นสิ่งที่สังเกตได้ยากถึงยากมาก แต่คงไม่มีอะไรดีที่สุดในการใช้วิจารณญาณอย่างรอบคอบ เพื่อไม่ให้อคติของอัลกอริทึมมีผลกระทบกับความคิดและการใช้ชีวิตประจำวันในท้ายที่สุด

No comments:

Post a Comment