สรุปคู่มือออกแบบ AI จาก People + AI โดย Google [ตอน 1]

เรื่องของการออกแบบ AI เป็นสิ่งที่มาแรงและน่าสนใจ ในอีกมุมนึงก็เป็นเรื่องที่ค่อนข้างเป็นที่น่ากังวลของหลาย ๆ ฝ่ายว่าเราจะออกแบบ AI อย่างไรให้เข้าใจ user และไม่ละเมิดเรื่องของ Privacy วันนี้แอดนัทเลยได้หยิบเอกสารตัวนึงที่น่าสนใจของ Google มาถอดรหัสสรุปให้เพื่อน ๆ อ่านกันแบบเข้าใจง่าย เล่ากันแบบพื้นฐาน ผู้ที่ไม่มีพื้นฐานด้าน AI ก็อ่านได้แน่นอน มาติดตามกันเลย

📖 บทความนี้มีอะไรบ้าง แสดง

people ai guidebook ออกแบบ ai — people + ai guidebook

People + AI Research (PAIR) คืออะไร

People + AI Guidebook คือคู่มือในการออกแบบสำหรับคนที่ทำงานด้าน AI เป็นเอกสารที่จะช่วยให้เราคิดถึง user ก่อนการออกแบบ ถูกเผยแพร่ในปี 2019 จัดทำโดยผู้ที่ทำงานใน Google ที่ทำงานฝั่ง UX และผู้ที่เชี่ยวชาญด้าน AI มากกว่า 100 คน เป็นเอกสารที่รวบรวมความรู้ Practice ประสบการณ์ดี ๆ ที่ Google ได้ทำงานมา ไม่ว่าจะเป็นวิธีการทำ Research, เอกสาร Research ที่ถูกวิจัยใน Google, วิธีการสร้างเครื่องมือ, วิธีการสร้าง frameworks ในการออกแบบ หรือวิธีทำงานกับสังคมที่แตกต่างและหลากหลาย

ai guidebook ออกแบบ ai — ai guidebook chapters

ในเอกสาร Guidebook นี้ประกอบไปด้วย 6 หัวข้อคือ

User Needs + Defining Success
Data Collection + Evaluation
Mental Models
Explainability + Trust
Feedback + Control
Error + Graceful Failure

ในบทความตอนที่ 1 นี้แอดนัทจะพามาเจาะลึกเนื้อหาในเรื่องของ User needs + Defining Success ซึ่งเป็นส่วนของที่ UX จะได้แตะมากที่สุดในการช่วยออกแบบ AI เล่าวิธีวางแผนการออกแบบ AI โดยอิงจากผู้ใช้งาน มาติดตามกันเลย

1. User Needs + Defining Success

ก่อนการเริ่มต้นการออกแบบนั้น เราจะต้องมาวิเคราะห์กันก่อนว่าการทำ AI นี้จะช่วยสร้างคุณค่าและตอบโจทย์ให้กับ user ได้จริงหรือไม่ ด้วยการตั้งคำถาม 5 ข้อดังต่อไปนี้ คือ

อะไรคือสิ่งที่เป็นปัญหาของ user ที่เราต้องการจะแก้ไขด้วย AI ?
มันมีความต้องการของผู้ใช้งานที่ดูซ้ำ ๆ กันจนดูเหมือนว่าเป็นพฤติกรรม จนกลายเป็น Patterns หรือไม่ ?
อะไรคือคำว่า Success การวัดผล ของ AI ที่คุณต้องการจะทำ ? คุณจะวัดผลแบบไหน จะรู้ได้ยังไงว่าอันนี้คือสำเร็จแล้ว ?
ดูว่า Scope ของความต้องการของเราคืออะไร แล้วถ้าการแก้ไขปัญหาของเราคือการไม่ใช้ AI แบบนั้นจะโอเคมั้ย ?
ถ้าต้องใช้ AI จริง ๆ Type ของ AI แบบไหนที่ดีที่สุด (automate หรือ augment) ?

1.1 ตามหาความต้องการของผู้ใช้งาน และจุดแข็งของ AI

จริง ๆ ขั้นตอนนี้จะเหมือนกันทำ user research แบบ human-centered โดยทั่วไปที่เราใช้กันเลย ก็คือออกไปพูดคุยกับผู้คน ดูข้อมูล Data ที่เรามีอยู่ ดูว่ามีปัญหานี้เกิดขึ้นอยู่จริง ๆ หรือไม่ มองหาพฤติกรรมซ้ำ ๆ ของผู้ใช้งานของเรา ให้เราหลุดออกจากเรื่องเทคโนโลยีไปมีโฟกัสที่ user ก่อน

โดยวิธีในการตามหาปัญหา ก็มีอยู่หลากหลายวิธีด้วยกัน Google เขาก็แนะนำว่าให้ลองใช้ Method จาก IDEO’s Design Kit methods section เป็นตัวอย่างได้

Key concept

ก่อนเริ่มการออกแบบ AI เราควรมีการทำ UX Research เพื่อดูความต้องการที่แท้จริงผู้ใช้งาน
แต่แทนที่เราจะตั้งถามว่า “Can we use AI to _________?”
เราควรเริ่มถามคำถามแบบ human-centred ที่คิดถึงผู้ใช้งานเป็นหลัก ด้วยการถามคำถามแบบ How might we คือ

– How might we solve __________ ?
– Can AI solve this problem in a unique way?

เล่าไปแล้วก็ดูจะ Abstract เกินไปมาก ๆ เรามาดูตัวอย่างกันเลย

เพื่อน ๆ เคยผ่านประสบการณ์จองตั๋วเครื่องบินด้วยตนเองหรือไม่ แล้วจำได้หรือเปล่าว่าขั้นตอนการจองตั๋วของเราเป็นแบบไหน ?
มีใครรู้จัก Google Flights บ้าง?

Google Flights คือระบบที่ช่วยให้เราตามหาสายการบินที่ถูกและดีที่สุด โดยในแอพนี้ได้ถูกออกแบบด้วย AI มีฟีเจอร์หลักที่เรียกว่า flight insights เป็นระบบ AI ที่จะช่วยบอกเราว่าเวลาไหนคือเวลาที่ดีที่สุดในการซื้อตั๋วเครื่องบิน โดยทีมที่ทำฟีเจอร์ flight insights ได้ใช้ข้อมูลจากตัว People + AI Guidebook ในการสร้างฟีเจอร์นี้ในตลอดระยะเวลาหลายปีที่ผ่านมา

1.2 เข้าใจ Needs และ Patterns ของผู้ใช้งาน

เริ่มกันด้วยการตอบคำถามที่จะช่วยให้เราสามารถเข้าใจ user ของเราได้

? เรามีความต้องการของผู้ใช้งานที่ดูซ้ำ ๆ กันจนดูเหมือนว่าเป็นพฤติกรรม จนกลายเป็น Patterns หรือไม่ ?

ข้อดีของการหา Patterns คือจะช่วยให้เราสามารถมองเห็นสิ่งที่เป็นปัญหาซ้ำ ๆ กลุ่มก้อน และยังสามารถช่วยให้เราใช้ไอเดียตรงนี้ไปตามหาข้อมูลที่ถูกต้องเพื่อมา Train AI ของเราได้อีกด้วยในอนาคต

ทีม UX ของ Flight insights เขาได้ไปเจอความต้องการของ user มาว่า

Need > When to book for best price
Pattern > Repeatedly check multiples sites

ทีม UX ได้เจอความต้องการของผู้ใช้งาน (Need) ว่า “ผู้คนต้องการรู้เวลาที่จะจองตั๋วเครื่องบินในราคาที่ดีที่สุด”
และยังไปเจอสิ่งที่ผู้คนทำตามซ้ำ ๆ กันจนเกิดเป็นพฤติกรรม (Pattern) คือ “เข้าไปเช็คเว็บไซต์หลายเว็บ หรือเว็บไซต์เดิมหลายเวลาเพื่อดูว่าเวลาไหนราคาจะถูกที่สุด”

1.3 เราจะวัดผลความสำเร็จของ AI ที่เราจะทำได้อย่างไร ?

คำถามถัดไปที่เราจะต้องตอบให้ได้

? อะไรคือคำว่า Success ของ AI ที่คุณต้องการจะทำ ? คุณจะวัดผลแบบไหน จะรู้ได้ยังไงว่าอันนี้คือสำเร็จแล้ว ?

พวกเราทุกคนน่าจะรู้ metrics ที่ใช้วัดผลโดยทั่วไปบนเว็บไซต์อย่าง ยอด views, engagement, clicks ที่เป็นเชิง quantitative data แต่ว่าการวัดผลแบบ human-centred นั้นจะซับซ้อนกว่าที่เราคิดซักหน่อย โดยใน Guidebook ของ Google ได้แนะนำข้อที่เราควรคำนึงถึงมาหลายอย่างด้วยกันเลยสำหรับการออกแบบ AI เช่น

เราจะทำให้ผู้ใช้งานมีชีวิตที่สะดวกสบายขึ้นหรือไม่ ?
เราจะช่วยสร้าง engagement ให้คนอยากใช้งานระยะยาวกับ product ของเราได้หรือไม่ ?
เราทำให้ผู้ใช้งานของเรามีความสุขมากขึ้นหรือเปล่า ?
ถ้าผู้ใช้งานใช้แล้วมีความสุข เขาอยากจะแนะนำคนอื่นให้มาใช้ product ของเรามั้ย ?

อีกเรื่องที่ต้องคิดถึงคือเรื่องของ secondary effects คือเหมือนว่าไอ้ที่เราวัดผลมานั้นมันดูดีหมดทุกอย่าง ซึ่งอาจจะเกิดจากทำ dark patterns หรือการ optimize แบบจงใจให้ได้ผลลัพธ์ที่ดี เช่น การทำคอนเทนต์แบบ click bait ที่หลอกลวงคนอ่านด้วยชื่อบทความ แต่พอเข้าไปอ่านจริง ๆ กลับไม่มีสาระซะงั้น แต่ก็ได้ยอด view สูงเหลือเกิน ดังนั้นเราจึงต้องลงไปดูด้วยว่า qualitative research ของเรา ผู้คนพูดถึงสินค้าของเราอย่างไร เขาคิดกับเราแบบไหน

อีกวิธีที่ช่วยในการวัดผล Success ที่ Google แนะนำมาคือ แผนผัง Confusion metrix

ภาพด้านบนนี้เป็นแผนผังที่ใช้ในการตรวจการทำงานของโมเดล AI แบบพื้นฐานที่เรานิยมใช้งานกัน เป็นตารางที่จะช่วยบอกว่าโมเดลของเรานั้นทำงานถูกหรือทำงานผิด โดยวิธีการการวัดผลความสำเร็จ จะอยู่ในช่องของ TRUE นั่นก็คือ true positives และ true negatives (น้องหน้ายิ้มสีน้ำเงิน)

และจะมีสองประเภทที่เราจัดว่าเป็น ERRORS คือผลลัพธ์ที่เป็นแบบ false positives และ false negatives (น้องหน้าบึ้งสีแดง)

กลับมาที่ตัวอย่างของเรา โมเดลของการแสดงราคาตั๋วเครื่องบิน
ข้างล่างนี้จะเป็นตัวอย่าง Confusion matrix ของ Google flights ที่จะคำนวณว่าราคาตั๋วเครื่องบินนั้นจะขึ้นไปในอนาคตหรือเปล่า

มาดูคำอธิบายกันเลย

confusion metrix - google flights example — confusion metrix – google flights example

อธิบายตารางที่ว่านี้ ถ้าเราดูจากช่องสีเหลือง = การทำนายของ AI
ส่วนช่องสีเขียว = ราคาที่สูงขึ้นจริงของสายการบิน

หากเรามาลองมองทีละช่อง
กรณีที่ 1 ถ้าหาก AI ทำนายว่า ราคาจะสูงขึ้น (Price increase) และราคาตั๋วจริงสูงขึ้น (Price increase) อันนี้ถือว่าทำนายถูกต้อง คือ Good

กรณีที่ 2 ถ้าหาก AI ทำนายว่า ราคาจะไม่สูงขึ้น (No increase) และราคาตั๋วจริงก็ไม่สูงขึ้น (No increase) อันนี้ก็ยังถือว่าทำนายถูกต้อง คือ Good

กรณี 3 ถ้าหาก AI ทำนายว่า ราคาจะสูงขึ้น (Price increase) แต่ราคาจริงกลับไม่เพิ่ม (No increase) อันนี้ก็ยังถือว่า OK พอรับได้ แค่ราคาจากระบบมันบอกว่าสูงเฉย ๆ แต่ราคาตอนจ่ายเงินไม่สูง แปลว่าผู้ซื้อตั๋วก็ไม่ต้องจ่ายเงินเพิ่ม

กรณีที่ 4 ที่แย่ที่สุด ถ้า AI ทำนายว่า ราคาจะไม่สูงขึ้น (No increase) แต่ราคาตั๋วจริงนั้นกลับเพิ่มขึ้น (Price increase) อันนี้รับไม่ได้แล้ว เพราะว่าจะทำให้ผู้ซื้อตั๋วนั้นต้องเสียเงินจำนวนมาก เผลอ ๆ อาจจะทำให้ user ที่เชื่อมั่นใน AI ของ Google นี้ซื้อตั๋วไม่ทันและตกเครื่องบินในรอบนั้นไปได้

แปลว่าถ้าหากเกิดความผิดพลาดของโมเดล มีกรณีที่ 4 นี้เกิดขึ้น จะทำให้ส่งผลกระทบต่อธุรกิจอย่างแน่นอน ดังนั้นเราควรจะต้องมีการทดสอบและทำ Test จำลองโมเดล AI ของเราให้ถี่ถ้วนก่อนการนำมาใช้งานจริง เพื่อให้มั่นใจได้ว่าการทำ AI ของเรานั้นจะไม่ส่งผลกระทบต่อธุรกิจนั่นเอง

หลังจากเราวางแผน metrix เสร็จแล้ว แผนผังนี้จะช่วยให้เราตอบคำที่แท้จริงได้ว่าเราจะวัดผลความสำเร็จของ AI ของเราได้อย่างไร
และ success ของโปรเจคจองตั๋วเครื่องบินนี้คือ

Success > ซื้อตั๋วในราคาที่ดีสุดและในเวลาที่ดีที่สุด
Optimize > เวลาที่ดีที่สุดในการซื้อ, หลีกเลี่ยงการเกิด false negatives

1.4 Scope ความต้องการของเราคืออะไร ?

ในหัวข้อนี้เราจะมาเจาะดูว่าความต้องการของเรานั้น สามารถแก้ปัญหาด้วยการไม่ใช้ AI ได้หรือเปล่า การถามคำถามในข้อนี้จะเป็นการช่วยจำกัดความต้องการของเราให้แคบลง จะช่วยให้เราไม่เปลืองทรัพยากรในการมาสร้าง AI ใหม่ เพราะอย่าลืมว่าการหาข้อมูลเพื่อมา train AI นั้นเป็นขั้นตอนการทำงานที่มีค่าใช้จ่ายที่สูงมาก ๆ

? Scope ของความต้องการของเราคืออะไร แล้วถ้าการแก้ไขปัญหาของเราคือการไม่ใช้ AI แบบนั้นจะโอเคมั้ย ?

อย่างทีม Google flights เขาได้ลองใช้ตัวระบบที่ไม่ใช่ AI มาก่อนเช่นกัน เพื่อดูว่ามันทำงานได้จริงมั้ย แต่ปรากฏว่ามันดูแลยากมาก และผลลัพธ์ที่ได้ไม่ค่อยแม่นยำที่จะทำให้ผู้ใช้งานพึงพอใจ

และ Google flights เองก็มีข้อมูลของจำนวนสายการบินที่มากเกินไป ทำให้การ scale นั้นทำได้ยาก การทำ AI ก็เลยมาตอบโจทย์ในการแก้ปัญหานี้ เขาก็เลยสรุปได้ว่า Scope งานของเขาคือ

Scope > ต้องการ AI เพราะว่า scale ระบบปัจจุบันยาก มีความซับซ้อนสูง เพื่อตอบโจทย์ความต้องการของผู้ใช้งาน
เป็นเรื่องที่ต้องบาลานซ์ระหว่างความต้องการของผู้ใช้งานและเรื่องของความยั่งยืนทางด้าน engineering

1.5 แล้วประเภทของ AI แบบไหนที่ดีที่สุด

หลังจากเรารู้ Scope ของงานเราแล้วว่าต้องใช้ AI แน่นอนแล้ว เราก็ต้องตอบคำถามถัดไปเกี่ยวกับประเภทของการทำงาน ว่าเราจะให้ส่วนไหนเอไอทำงาน ส่วนไหนจะให้คนนั้นจัดการเอง

? ถ้าต้องใช้ AI จริง ๆ Type ของ AI แบบไหนที่ดีที่สุด (ให้ระบบทำ automate หรือ ให้คนทำ augment) ?

โดยตารางสองฝั่งด้านล่างนี้จะบอกประเภทของงานสองแบบ
Automation = ให้ระบบทำ
Augmentation = ให้คนทำ

Automation ให้ระบบทำ

People don’t know how to do something
สิ่งที่คนไม่รู้ว่าจะทำอย่างไร
People can’t do something
สิ่งที่คนทำไม่ได้
Task is boring, repetitive, or dangerous
งานส่วนที่น่าเบื่อ, ซ้ำ ๆ หรืออันตราย
เช่น การวัดอากาศอุณภูมิ วัดสารพิษในพื้นที่อันตราย

Augmentation ให้คนทำ

People enjoy or feel responsible for task
สิ่งที่คนชื่นชอบที่จะทำ หรือรู้สึกมีความรับผิดชอบในการจัดการ เช่นการเขียนการ์ดงานวันเกิด
High stakes
งานส่วนที่มีความสำคัญ ทำผิดพลาดไม่ได้
Complicated personal preferences
ความชอบส่วนบุคคลที่มีความซับซ้อน

ถ้ายกตัวอย่างงานที่ให้คนทำ (Augmentation) ของทีมกูเกิ้ล

งานส่วนที่มีความสำคัญ เช่น การคิดวิเคราะห์ว่าราคาตั๋วแพงเกินไปหรือเปล่า เอไอตอบแทนไม่ได้ คนเท่านั้นที่จะสามารถบอกได้ว่าอันนี้มันแพงเกินไปสำหรับฉันหรือไม่
ความชอบส่วนบุคคลที่มีความซับซ้อน เช่น ฉันจะไปงานแต่งของครอบครัวทันหรือเปล่า ไปวันไหน ตรงส่วนนี้เอไอตอบแทนไม่ได้
หรือ บางคนอาจจะชอบบินแบบข้ามคืน ไปถึงเช้า, บางคนอาจจะเกลียดการเดินทางกลางคืน เอไอไม่สามารถเลือกเที่ยวบินตามเวลาที่ชื่นชอบได้

ดังนั้นเราจึงจะต้องมีส่วน Augment ที่จะช่วยให้ผู้ใช้งานสามารถปรับแต่งและเลือกสรรได้ด้วยตนเองผ่านทางระบบของเราด้วย

เมื่อเราตอบคำถามได้ครบทั้งหมด 4 ข้อแล้ว ไม่ว่าจะเป็น Patterns, Success, Scope และ Type เราก็สามารถนำข้อมูลที่เราได้นั้นไปวางแผนสำหรับการเตรียมข้อมูล ที่จะมาใช้เทรน AI ของเรา หัวข้อที่สองที่จะเล่าต่อจากนี้นั่นก็คือ Data collection + Evaluation

ในเอกสารส่วนที่สอง Data Collection + Evaluation จะพูดถึงเรื่องของการหาข้อมูล วิเคราะห์ จัดเรียงข้อมูลให้ถูกต้องก่อนที่จะนำมาใช้เทรน AI ของเราให้ออกมาได้ดั่งปรารถนาที่เราตั้งใจ

เนื้อหาในตอนที่สองนั้น แอดนัทจะขอยกไว้ต่อกันในตอนหน้า เหมือนกับตัดจบโฆษณา มาติดตามกันต่อในบทความถัดไปนะคะ

สำหรับเนื้อหาทั้งหมดที่อธิบายมานี้ เพื่อน ๆ สามารถดูตามคู่มือของ Google ได้ผ่านทางเว็บไซต์ People + AI นี้ ในเว็บไซต์จะมีไฟล์ PDF คู่มือให้เราดาวน์โหลดเพื่อเราไปทำการรีเสิชก่อนเริ่มออกแบบด้วยค่ะ

ถ้าใครสนใจเรื่องที่เกี่ยวกับเรื่องการทำ Data collection ที่ต้องทำความเข้าใจจากพื้นฐานของ user needs อย่าลืมกด Like เพจ Designil หรือกดรับ Notification ผ่านทางหน้าเว็บไซต์ แล้วมาพบกันใหม่ตอนที่ 2 นะคะ

อ่านบทความตอน 2 ที่นี่
สรุปคู่มือออกแบบ AI จาก People + AI โดย Google เรื่อง Data collection [ตอน 2]

บทความที่เกี่ยวข้อง

ข้อมูลจาก

สรุปคู่มือออกแบบ AI จาก People + AI โดย Google [ตอน 1]

People + AI Research (PAIR) คืออะไร

ในเอกสาร Guidebook นี้ประกอบไปด้วย 6 หัวข้อคือ

1. User Needs + Defining Success