สรุปคู่มือออกแบบ AI จาก People + AI โดย Google [ตอน 1]

Natk

เรื่องของการออกแบบ AI เป็นสิ่งที่มาแรงและน่าสนใจ ในอีกมุมนึงก็เป็นเรื่องที่ค่อนข้างเป็นที่น่ากังวลของหลาย ๆ ฝ่ายว่าเราจะออกแบบ AI อย่างไรให้เข้าใจ user และไม่ละเมิดเรื่องของ Privacy วันนี้แอดนัทเลยได้หยิบเอกสารตัวนึงที่น่าสนใจของ Google มาถอดรหัสสรุปให้เพื่อน ๆ อ่านกันแบบเข้าใจง่าย เล่ากันแบบพื้นฐาน ผู้ที่ไม่มีพื้นฐานด้าน AI ก็อ่านได้แน่นอน มาติดตามกันเลย

people ai guidebook ออกแบบ ai
people + ai guidebook

People + AI Research (PAIR) คืออะไร

People + AI Guidebook คือคู่มือในการออกแบบสำหรับคนที่ทำงานด้าน AI เป็นเอกสารที่จะช่วยให้เราคิดถึง user ก่อนการออกแบบ ถูกเผยแพร่ในปี 2019 จัดทำโดยผู้ที่ทำงานใน Google ที่ทำงานฝั่ง UX และผู้ที่เชี่ยวชาญด้าน AI มากกว่า 100 คน เป็นเอกสารที่รวบรวมความรู้ Practice ประสบการณ์ดี ๆ ที่ Google ได้ทำงานมา ไม่ว่าจะเป็นวิธีการทำ Research, เอกสาร Research ที่ถูกวิจัยใน Google, วิธีการสร้างเครื่องมือ, วิธีการสร้าง frameworks ในการออกแบบ หรือวิธีทำงานกับสังคมที่แตกต่างและหลากหลาย

ai guidebook ออกแบบ ai
ai guidebook chapters

ในเอกสาร Guidebook นี้ประกอบไปด้วย 6 หัวข้อคือ

  1. User Needs + Defining Success
  2. Data Collection + Evaluation
  3. Mental Models
  4. Explainability + Trust
  5. Feedback + Control
  6. Error + Graceful Failure

ในบทความตอนที่ 1 นี้แอดนัทจะพามาเจาะลึกเนื้อหาในเรื่องของ User needs + Defining Success ซึ่งเป็นส่วนของที่ UX จะได้แตะมากที่สุดในการช่วยออกแบบ AI เล่าวิธีวางแผนการออกแบบ AI โดยอิงจากผู้ใช้งาน มาติดตามกันเลย

1. User Needs + Defining Success

ก่อนการเริ่มต้นการออกแบบนั้น เราจะต้องมาวิเคราะห์กันก่อนว่าการทำ AI นี้จะช่วยสร้างคุณค่าและตอบโจทย์ให้กับ user ได้จริงหรือไม่ ด้วยการตั้งคำถาม 5 ข้อดังต่อไปนี้ คือ

  1. อะไรคือสิ่งที่เป็นปัญหาของ user ที่เราต้องการจะแก้ไขด้วย AI ?
  2. มันมีความต้องการของผู้ใช้งานที่ดูซ้ำ ๆ กันจนดูเหมือนว่าเป็นพฤติกรรม จนกลายเป็น Patterns หรือไม่ ?
  3. อะไรคือคำว่า Success การวัดผล ของ AI ที่คุณต้องการจะทำ ? คุณจะวัดผลแบบไหน จะรู้ได้ยังไงว่าอันนี้คือสำเร็จแล้ว ?
  4. ดูว่า Scope ของความต้องการของเราคืออะไร แล้วถ้าการแก้ไขปัญหาของเราคือการไม่ใช้ AI แบบนั้นจะโอเคมั้ย ?
  5. ถ้าต้องใช้ AI จริง ๆ Type ของ AI แบบไหนที่ดีที่สุด (automate หรือ augment) ?

1.1 ตามหาความต้องการของผู้ใช้งาน และจุดแข็งของ AI

จริง ๆ ขั้นตอนนี้จะเหมือนกันทำ user research แบบ human-centered โดยทั่วไปที่เราใช้กันเลย ก็คือออกไปพูดคุยกับผู้คน ดูข้อมูล Data ที่เรามีอยู่ ดูว่ามีปัญหานี้เกิดขึ้นอยู่จริง ๆ หรือไม่ มองหาพฤติกรรมซ้ำ ๆ ของผู้ใช้งานของเรา ให้เราหลุดออกจากเรื่องเทคโนโลยีไปมีโฟกัสที่ user ก่อน

โดยวิธีในการตามหาปัญหา ก็มีอยู่หลากหลายวิธีด้วยกัน Google เขาก็แนะนำว่าให้ลองใช้ Method จาก  IDEO’s Design Kit methods section เป็นตัวอย่างได้

Key concept

ก่อนเริ่มการออกแบบ AI เราควรมีการทำ UX Research เพื่อดูความต้องการที่แท้จริงผู้ใช้งาน
แต่แทนที่เราจะตั้งถามว่า “Can we use AI to _________?
เราควรเริ่มถามคำถามแบบ human-centred ที่คิดถึงผู้ใช้งานเป็นหลัก ด้วยการถามคำถามแบบ How might we คือ

– How might we solve __________ ?​
– Can AI solve this problem in a unique way?

เล่าไปแล้วก็ดูจะ Abstract เกินไปมาก ๆ เรามาดูตัวอย่างกันเลย

เพื่อน ๆ เคยผ่านประสบการณ์จองตั๋วเครื่องบินด้วยตนเองหรือไม่ แล้วจำได้หรือเปล่าว่าขั้นตอนการจองตั๋วของเราเป็นแบบไหน ?
มีใครรู้จัก Google Flights บ้าง?

google flights
google flights

Google Flights คือระบบที่ช่วยให้เราตามหาสายการบินที่ถูกและดีที่สุด โดยในแอพนี้ได้ถูกออกแบบด้วย AI มีฟีเจอร์หลักที่เรียกว่า flight insights เป็นระบบ AI ที่จะช่วยบอกเราว่าเวลาไหนคือเวลาที่ดีที่สุดในการซื้อตั๋วเครื่องบิน โดยทีมที่ทำฟีเจอร์ flight insights ได้ใช้ข้อมูลจากตัว People + AI Guidebook ในการสร้างฟีเจอร์นี้ในตลอดระยะเวลาหลายปีที่ผ่านมา

1.2 เข้าใจ Needs และ Patterns ของผู้ใช้งาน

เริ่มกันด้วยการตอบคำถามที่จะช่วยให้เราสามารถเข้าใจ user ของเราได้

? เรามีความต้องการของผู้ใช้งานที่ดูซ้ำ ๆ กันจนดูเหมือนว่าเป็นพฤติกรรม จนกลายเป็น Patterns หรือไม่ ?

ข้อดีของการหา Patterns คือจะช่วยให้เราสามารถมองเห็นสิ่งที่เป็นปัญหาซ้ำ ๆ กลุ่มก้อน และยังสามารถช่วยให้เราใช้ไอเดียตรงนี้ไปตามหาข้อมูลที่ถูกต้องเพื่อมา Train AI ของเราได้อีกด้วยในอนาคต

ทีม UX ของ Flight insights เขาได้ไปเจอความต้องการของ user มาว่า

Need > When to book for best price
Pattern > Repeatedly check multiples sites

ทีม UX ได้เจอความต้องการของผู้ใช้งาน (Need) ว่า “ผู้คนต้องการรู้เวลาที่จะจองตั๋วเครื่องบินในราคาที่ดีที่สุด”
และยังไปเจอสิ่งที่ผู้คนทำตามซ้ำ ๆ กันจนเกิดเป็นพฤติกรรม (Pattern) คือ “เข้าไปเช็คเว็บไซต์หลายเว็บ หรือเว็บไซต์เดิมหลายเวลาเพื่อดูว่าเวลาไหนราคาจะถูกที่สุด”

1.3 เราจะวัดผลความสำเร็จของ AI ที่เราจะทำได้อย่างไร ?

คำถามถัดไปที่เราจะต้องตอบให้ได้

? อะไรคือคำว่า Success ของ AI ที่คุณต้องการจะทำ ? คุณจะวัดผลแบบไหน จะรู้ได้ยังไงว่าอันนี้คือสำเร็จแล้ว ?

พวกเราทุกคนน่าจะรู้ metrics ที่ใช้วัดผลโดยทั่วไปบนเว็บไซต์อย่าง ยอด views, engagement, clicks ที่เป็นเชิง quantitative data แต่ว่าการวัดผลแบบ human-centred นั้นจะซับซ้อนกว่าที่เราคิดซักหน่อย โดยใน Guidebook ของ Google ได้แนะนำข้อที่เราควรคำนึงถึงมาหลายอย่างด้วยกันเลยสำหรับการออกแบบ AI เช่น

  • เราจะทำให้ผู้ใช้งานมีชีวิตที่สะดวกสบายขึ้นหรือไม่ ?
  • เราจะช่วยสร้าง engagement ให้คนอยากใช้งานระยะยาวกับ product ของเราได้หรือไม่ ?
  • เราทำให้ผู้ใช้งานของเรามีความสุขมากขึ้นหรือเปล่า ?
  • ถ้าผู้ใช้งานใช้แล้วมีความสุข เขาอยากจะแนะนำคนอื่นให้มาใช้ product ของเรามั้ย ?

อีกเรื่องที่ต้องคิดถึงคือเรื่องของ secondary effects คือเหมือนว่าไอ้ที่เราวัดผลมานั้นมันดูดีหมดทุกอย่าง ซึ่งอาจจะเกิดจากทำ dark patterns หรือการ optimize แบบจงใจให้ได้ผลลัพธ์ที่ดี เช่น การทำคอนเทนต์แบบ click bait ที่หลอกลวงคนอ่านด้วยชื่อบทความ แต่พอเข้าไปอ่านจริง ๆ กลับไม่มีสาระซะงั้น แต่ก็ได้ยอด view สูงเหลือเกิน ดังนั้นเราจึงต้องลงไปดูด้วยว่า qualitative research ของเรา ผู้คนพูดถึงสินค้าของเราอย่างไร เขาคิดกับเราแบบไหน

อีกวิธีที่ช่วยในการวัดผล Success ที่ Google แนะนำมาคือ แผนผัง Confusion metrix

UN Vis 01
Confusion metrix

ภาพด้านบนนี้เป็นแผนผังที่ใช้ในการตรวจการทำงานของโมเดล AI แบบพื้นฐานที่เรานิยมใช้งานกัน เป็นตารางที่จะช่วยบอกว่าโมเดลของเรานั้นทำงานถูกหรือทำงานผิด โดยวิธีการการวัดผลความสำเร็จ จะอยู่ในช่องของ TRUE นั่นก็คือ true positives และ true negatives (น้องหน้ายิ้มสีน้ำเงิน)

และจะมีสองประเภทที่เราจัดว่าเป็น ERRORS คือผลลัพธ์ที่เป็นแบบ false positives และ false negatives (น้องหน้าบึ้งสีแดง)

กลับมาที่ตัวอย่างของเรา โมเดลของการแสดงราคาตั๋วเครื่องบิน
ข้างล่างนี้จะเป็นตัวอย่าง Confusion matrix ของ Google flights ที่จะคำนวณว่าราคาตั๋วเครื่องบินนั้นจะขึ้นไปในอนาคตหรือเปล่า

มาดูคำอธิบายกันเลย

confusion metrix - google flights example
confusion metrix – google flights example

อธิบายตารางที่ว่านี้ ถ้าเราดูจากช่องสีเหลือง = การทำนายของ AI
ส่วนช่องสีเขียว = ราคาที่สูงขึ้นจริงของสายการบิน

หากเรามาลองมองทีละช่อง
กรณีที่ 1 ถ้าหาก AI ทำนายว่า ราคาจะสูงขึ้น (Price increase) และราคาตั๋วจริงสูงขึ้น (Price increase) อันนี้ถือว่าทำนายถูกต้อง คือ Good

กรณีที่ 2 ถ้าหาก AI ทำนายว่า ราคาจะไม่สูงขึ้น (No increase) และราคาตั๋วจริงก็ไม่สูงขึ้น (No increase) อันนี้ก็ยังถือว่าทำนายถูกต้อง คือ Good

กรณี 3 ถ้าหาก AI ทำนายว่า ราคาจะสูงขึ้น (Price increase) แต่ราคาจริงกลับไม่เพิ่ม (No increase) อันนี้ก็ยังถือว่า OK พอรับได้ แค่ราคาจากระบบมันบอกว่าสูงเฉย ๆ แต่ราคาตอนจ่ายเงินไม่สูง แปลว่าผู้ซื้อตั๋วก็ไม่ต้องจ่ายเงินเพิ่ม

กรณีที่ 4 ที่แย่ที่สุด ถ้า AI ทำนายว่า ราคาจะไม่สูงขึ้น (No increase) แต่ราคาตั๋วจริงนั้นกลับเพิ่มขึ้น (Price increase) อันนี้รับไม่ได้แล้ว เพราะว่าจะทำให้ผู้ซื้อตั๋วนั้นต้องเสียเงินจำนวนมาก เผลอ ๆ อาจจะทำให้ user ที่เชื่อมั่นใน AI ของ Google นี้ซื้อตั๋วไม่ทันและตกเครื่องบินในรอบนั้นไปได้

แปลว่าถ้าหากเกิดความผิดพลาดของโมเดล มีกรณีที่ 4 นี้เกิดขึ้น จะทำให้ส่งผลกระทบต่อธุรกิจอย่างแน่นอน ดังนั้นเราควรจะต้องมีการทดสอบและทำ Test จำลองโมเดล AI ของเราให้ถี่ถ้วนก่อนการนำมาใช้งานจริง เพื่อให้มั่นใจได้ว่าการทำ AI ของเรานั้นจะไม่ส่งผลกระทบต่อธุรกิจนั่นเอง

หลังจากเราวางแผน metrix เสร็จแล้ว แผนผังนี้จะช่วยให้เราตอบคำที่แท้จริงได้ว่าเราจะวัดผลความสำเร็จของ AI ของเราได้อย่างไร
และ success ของโปรเจคจองตั๋วเครื่องบินนี้คือ

Success > ซื้อตั๋วในราคาที่ดีสุดและในเวลาที่ดีที่สุด
Optimize > เวลาที่ดีที่สุดในการซื้อ, หลีกเลี่ยงการเกิด false negatives

ตัวอย่าง google flights
ตัวอย่าง google flights

1.4 Scope ความต้องการของเราคืออะไร ?

ในหัวข้อนี้เราจะมาเจาะดูว่าความต้องการของเรานั้น สามารถแก้ปัญหาด้วยการไม่ใช้ AI ได้หรือเปล่า การถามคำถามในข้อนี้จะเป็นการช่วยจำกัดความต้องการของเราให้แคบลง จะช่วยให้เราไม่เปลืองทรัพยากรในการมาสร้าง AI ใหม่ เพราะอย่าลืมว่าการหาข้อมูลเพื่อมา train AI นั้นเป็นขั้นตอนการทำงานที่มีค่าใช้จ่ายที่สูงมาก ๆ

? Scope ของความต้องการของเราคืออะไร แล้วถ้าการแก้ไขปัญหาของเราคือการไม่ใช้ AI แบบนั้นจะโอเคมั้ย ?

อย่างทีม Google flights เขาได้ลองใช้ตัวระบบที่ไม่ใช่ AI มาก่อนเช่นกัน เพื่อดูว่ามันทำงานได้จริงมั้ย แต่ปรากฏว่ามันดูแลยากมาก และผลลัพธ์ที่ได้ไม่ค่อยแม่นยำที่จะทำให้ผู้ใช้งานพึงพอใจ

และ Google flights เองก็มีข้อมูลของจำนวนสายการบินที่มากเกินไป ทำให้การ scale นั้นทำได้ยาก การทำ AI ก็เลยมาตอบโจทย์ในการแก้ปัญหานี้ เขาก็เลยสรุปได้ว่า Scope งานของเขาคือ

Scope > ต้องการ AI เพราะว่า scale ระบบปัจจุบันยาก มีความซับซ้อนสูง เพื่อตอบโจทย์ความต้องการของผู้ใช้งาน
เป็นเรื่องที่ต้องบาลานซ์ระหว่างความต้องการของผู้ใช้งานและเรื่องของความยั่งยืนทางด้าน engineering

1.5 แล้วประเภทของ AI แบบไหนที่ดีที่สุด

หลังจากเรารู้ Scope ของงานเราแล้วว่าต้องใช้ AI แน่นอนแล้ว เราก็ต้องตอบคำถามถัดไปเกี่ยวกับประเภทของการทำงาน ว่าเราจะให้ส่วนไหนเอไอทำงาน ส่วนไหนจะให้คนนั้นจัดการเอง

? ถ้าต้องใช้ AI จริง ๆ Type ของ AI แบบไหนที่ดีที่สุด (ให้ระบบทำ automate หรือ ให้คนทำ augment) ?

โดยตารางสองฝั่งด้านล่างนี้จะบอกประเภทของงานสองแบบ
Automation = ให้ระบบทำ
Augmentation = ให้คนทำ

Automation ให้ระบบทำ

  • People don’t know how to do something
    สิ่งที่คนไม่รู้ว่าจะทำอย่างไร
  • People can’t do something
    สิ่งที่คนทำไม่ได้
  • Task is boring, repetitive, or dangerous
    งานส่วนที่น่าเบื่อ, ซ้ำ ๆ หรืออันตราย
    เช่น การวัดอากาศอุณภูมิ วัดสารพิษในพื้นที่อันตราย

Augmentation ให้คนทำ

  • People enjoy or feel responsible for task
    สิ่งที่คนชื่นชอบที่จะทำ หรือรู้สึกมีความรับผิดชอบในการจัดการ เช่นการเขียนการ์ดงานวันเกิด
  • High stakes
    งานส่วนที่มีความสำคัญ ทำผิดพลาดไม่ได้
  • Complicated personal preferences
    ความชอบส่วนบุคคลที่มีความซับซ้อน

ถ้ายกตัวอย่างงานที่ให้คนทำ (Augmentation) ของทีมกูเกิ้ล

งานส่วนที่มีความสำคัญ เช่น การคิดวิเคราะห์ว่าราคาตั๋วแพงเกินไปหรือเปล่า เอไอตอบแทนไม่ได้ คนเท่านั้นที่จะสามารถบอกได้ว่าอันนี้มันแพงเกินไปสำหรับฉันหรือไม่
ความชอบส่วนบุคคลที่มีความซับซ้อน เช่น ฉันจะไปงานแต่งของครอบครัวทันหรือเปล่า ไปวันไหน ตรงส่วนนี้เอไอตอบแทนไม่ได้
หรือ บางคนอาจจะชอบบินแบบข้ามคืน ไปถึงเช้า, บางคนอาจจะเกลียดการเดินทางกลางคืน เอไอไม่สามารถเลือกเที่ยวบินตามเวลาที่ชื่นชอบได้

ดังนั้นเราจึงจะต้องมีส่วน Augment ที่จะช่วยให้ผู้ใช้งานสามารถปรับแต่งและเลือกสรรได้ด้วยตนเองผ่านทางระบบของเราด้วย

identify data
identify data

เมื่อเราตอบคำถามได้ครบทั้งหมด 4 ข้อแล้ว ไม่ว่าจะเป็น Patterns, Success, Scope และ Type เราก็สามารถนำข้อมูลที่เราได้นั้นไปวางแผนสำหรับการเตรียมข้อมูล ที่จะมาใช้เทรน AI ของเรา หัวข้อที่สองที่จะเล่าต่อจากนี้นั่นก็คือ Data collection + Evaluation

ในเอกสารส่วนที่สอง Data Collection + Evaluation จะพูดถึงเรื่องของการหาข้อมูล วิเคราะห์ จัดเรียงข้อมูลให้ถูกต้องก่อนที่จะนำมาใช้เทรน AI ของเราให้ออกมาได้ดั่งปรารถนาที่เราตั้งใจ

เนื้อหาในตอนที่สองนั้น แอดนัทจะขอยกไว้ต่อกันในตอนหน้า เหมือนกับตัดจบโฆษณา มาติดตามกันต่อในบทความถัดไปนะคะ


สำหรับเนื้อหาทั้งหมดที่อธิบายมานี้ เพื่อน ๆ สามารถดูตามคู่มือของ Google ได้ผ่านทางเว็บไซต์ People + AI นี้ ในเว็บไซต์จะมีไฟล์ PDF คู่มือให้เราดาวน์โหลดเพื่อเราไปทำการรีเสิชก่อนเริ่มออกแบบด้วยค่ะ

ถ้าใครสนใจเรื่องที่เกี่ยวกับเรื่องการทำ Data collection ที่ต้องทำความเข้าใจจากพื้นฐานของ user needs อย่าลืมกด Like เพจ Designil หรือกดรับ Notification ผ่านทางหน้าเว็บไซต์ แล้วมาพบกันใหม่ตอนที่ 2 นะคะ

อ่านบทความตอน 2 ที่นี่
สรุปคู่มือออกแบบ AI จาก People + AI โดย Google เรื่อง Data collection [ตอน 2]

บทความที่เกี่ยวข้อง

ข้อมูลจาก

Natk

Natk

UI Specialist ซิดนีย์ ออสเตรเลีย | ประสบการณ์ทำงาน 11 ปี | สนใจเรื่อง User Interface, User Experience, Accessibility, Education | ผู้ก่อตั้งกลุ่มเฟซบุ๊ก Tech ไทยในออสเตรเลีย | ผู้ดูแลเว็บไซต์ Designil
บทความทั้งหมด