Otter แปลงไฟล์เสียงเป็นตัวหนังสือ Speech to text ทูลคู่ใจของ UX Designer

Natk

Speech to text เครื่องมือช่วยแปลงเสียงเป็นตัวหนังสือ Otter.ai แอปแปลงไฟล์เสียงพูดเป็นข้อความที่ได้รับความนิยมมากที่สุดในโลก แม้เทคโนโลยี ai นี้จะยังไม่สมบูรณ์แบบมาก แต่การถอดเสียงที่รวดเร็วและแม่นยำ การระบุผู้พูด และเครื่องมือการจัดการที่คล่องตัวนั้นทำให้ทูลนี้เป็นที่นิยมในหมู่วงการคนทำ UX Research หรือ Reserch ทุกประเภท

สวัสดีค่ะ เพื่อน ๆ ชาว Designil วันนี้แอดนัทจะกลับมารีวิวเครื่องมือช่วยทำรีเสิชสุดฮิตยอดนิยม ที่มีชื่อว่า Otter.ai ทูลทางด้านเอไอ ที่จะช่วยให้เพื่อน ๆ ถอดเทป แปลงไฟล์เสียงเป็นตัวหนังสือหรือที่เรียกกันว่า Speech to text ช่วยให้เราสามารถนำข้อมูลที่ได้จากการทำสัมภาษณ์ไปใช้ในการ clustering, affinity mapping และอื่น ๆ ได้อีกมากมายเพื่อใช้กับงาน Research ของเรา

เรามาดูกันเลยว่าตัว Otter นั้นจะมีฟีเจอร์อะไรที่ช่วยสนับสนุนการทำงานของเราได้บ้าง

otter ai speech to text preview
otter ai preview

Otter.ai คืออะไร?

Otter เป็นหนึ่งในแอปแปลงไฟล์เสียงพูดเป็นข้อความที่ยอดเยี่ยมสำหรับ Researcher โดยทั่วไปจะช่วยให้ผู้ใช้ถอดเสียงการสนทนาด้วยเสียงได้ผ่านอุปกรณ์ที่หลากหลาย เช่น บนเดสก์ท็อป Android และ iOS และมีแผนให้บริการฟรีสำหรับผู้ใช้งานใหม่ แบบ Free trial

และยังมีข้อดีในการบันทึกบนสนทนา ทั้งเป็นแบบเดี่ยวและแบบกลุ่ม จำแนกผู้พูดได้ และคาดเดาคำได้อย่างแม่นยำ แม้จะเป็นคำศัพท์เฉพาะทาง อีกทั้งยังแก้ไขคำเฉพาะบางส่วนให้เป็นคำที่ถูกต้องได้ด้วย

ฟีเจอร์เด็ด ๆ

ข้อดีของทูลตัวนี้จะมีฟีเจอร์เด่น ๆ 3 อันด้วยกันคือ

  1. Record
    สามารถบันทึกเสียงเก็บไว้ในระบบ เพื่อมาฟังย้อนหลังสำหรับการเก็บข้อมูลได้
  2. Live transcibe
    สามารถบันทึกเสียง ฟังเสียงสด ๆ จากสถานการณ์จริง พร้อมจำแนกแยกเสียงผู้พูดแต่ละคน ช่วยแปลงเป็นตัวหนังสือได้อัตโนมัติ
  3. Share
    ส่งบันทึกการอัดเสียงและตัวหนังสือนี้ให้กับทีมที่ทำงานร่วมกันได้

นอกจากนี้ Otter ยังให้ผู้ใช้แก้ไขและจัดการการถอดเสียงเป็นคำในแอปได้โดยตรง บันทึกเสียงนี้สามารถเล่นได้ที่ความเร็วต่างกันเช่น 1.5x และอื่น ๆ เรายังสามารถแทรกรูปภาพและเนื้อหาอื่นๆ ลงในข้อความถอดเสียงได้โดยตรง

หรือถ้าเกิดคุณไม่ได้อัดเสียงแบบสด ๆ แต่มีไฟล์เสียงอยู่ในเครื่องแล้วล่ะก็ คุณก็สามารถนำเข้าไฟล์เสียงและวิดีโอเพื่อถอดเสียงได้ด้วยในแอปนี้

ราคา

ไฟล์ที่รองรับในการแปลงไฟล์เสียง

ผู้ใช้สามารถนำเข้าไฟล์เสียงหรือวิดีโอ รูปแบบที่รองรับ ได้แก่ AAC, AVIm M4A, MOV, MPEG, MP4, WMA และ WMV

  • นอกจากนี้ ผู้ใช้แผน Pro และ Business ยังสามารถ export ไฟล์เป็น DOCX, MP3, PDF, SRT และ TXT
  • ผู้ใช้บริการฟรี จะมีการจำกัดการ export โดยทำได้แค่ไฟล์ MP3 หรือ TXT

สรุปข้อดี ข้อเสีย

ข้อดี

  • การถอดเสียงเป็นคำแบบเรียลไทม์ที่รวดเร็ว
  • UI (User interface) ใช้งานได้ง่าย เรียนรู้ได้ไว
  • สามารถบันทึกเสียงเป็นตัวหนังสือได้แบบ Realtime
  • ใช้งานได้ง่ายเพราะรองรับคอมพิวเตอร์ iOS และ Android

ข้อเสีย

  • ไม่มี Live chat support
  • ราคายังสูงมาก เมื่อเทียบกับ Tool อื่น
  • ตัวฟรี ใช้งานได้แค่ 30 นาทีเท่านั้น
  • ยังไม่รองรับภาษาไทย
  • ยังไม่แม่นยำเมื่อเทียบกับทูลตัวอื่น

Otter สำหรับบันทึกการประชุมภาษาอังกฤษ (Speech to text)

ต้องบอกก่อนว่าแอดนัททำงานที่ออสเตรเลียมา 4 ปี ยังมีปัญหาทางด้านการฟังภาษาอังกฤษยาว ๆ สำหรับบทสนทนาที่มีหลาย ๆ คนเลยค่ะ ปัญหาในการประชุมที่เป็นภาษาอังกฤษที่แอดนัทเจอคือ

  1. ฟังประชุมไม่ทัน
  2. คนแย่งกันพูด
  3. จับใจความระหว่างการประชุมไม่ได้
  4. จดข้อมูลสาระสำคัญระหว่างการประชุมออกมาได้ไม่ครบถ้วน ทำให้พลาดประเด็นหลัก ๆ ของการประชุมแต่ละครั้งไป
  5. มีสำเนียงที่หลากหลาย และภาษาอังกฤษของเรายังไม่แข็งแรง ทำให้พลาดประเด็นสำคัญ
  6. ตอบคำถามไม่ได้ เพราะฟังคำถามไม่รู้เรื่องระหว่างการพรีเซนต์

แอดนัทเจอปัญหานี้ทำให้การทำงานของเราผิดพลาดพอสมควร เนื่องจากเราเก็บประเด็นไม่ครบ หรือบางทีประชุมยาวไปสองชั่วโมง แอดนัทจับประเด็นหลัก ๆ ได้แค่ 10 นาทีเท่านั้น (ไอ้ก่อนหน้านี้ฟังไม่ทันหมดเลย) พอจะกลับมาทำงานก็จำไม่ได้ว่าเราประชุมอะไรไป…… อ้าวเวรกรรม ลืมหมด

แอดนัทเลยหันมาลองใช้ Otter เลยค่ะ ใช้ทำ Transcript ระหว่างการประชุมใหญ่ ๆ ได้แบบ Live แปลว่าคนพูดมา แอปก็แปลสด ๆ ไปพร้อมกัน

ช่วยให้แอดนัทได้เห็นบทสนทนาพร้อมกับฟังไปพร้อม ๆ กันได้เพื่อเพิ่มความมั่นใจในการตอบคำถามและการทำงาน

meeting takeaways otter.ai
meeting takeaways – otter

อย่างภาพด้านบนนี้ จะเป็นภาพของการทำ Takeaways ช่วยจดสาระบันทึกสำคัญระหว่างบทสนทนาออกมาเป็นสรุปสั้น ๆ สำหรับการทำงานของเรา

otter calendar
otter calendar

Otter ยังมีฟีเจอร์เชื่อมต่อกับปฏิทิน Outlook และปฏิทินของ Google ให้เราสามารถใช้ otter บันทึกการประชุมได้ตลอดทั้งวัน เป็นฟีเจอร์ใหม่ที่เพิ่งออกมาเร็ว ๆ นี้เลย


Otter สำหรับงาน UX Research

ปัจจุบันแอดนัทใช้ Otter ทำงาน User interview, User research ทั้งแบบคุยออนไลน์ หรือคุยผ่านทางโทรศัพท์ ส่วนตัวใช้ทำงานมานานกว่าสามสี่ปี เป็นทูลที่ช่วยทุ่นเวลาได้เยอะมากในขั้นตอนการทำรีเสิช และทำให้การทำรีเสิชของแอดนัทสั้นลงหลายชั่วโมง

ตัวอย่างเช่นช่วงการทำ Analysis & Synthesis ข้อมูลภาษาอังกฤษที่เป็นเสียงเป็นอะไรที่ทรมานมาก เนื่องจากแอดนัทไม่ได้เป็น native speaker ดังนั้นการได้ Otter มาช่วยในการแปลงเสียงภาษาอังกฤษเป็นตัวหนังสือ ช่วยให้แอดนัททำงานได้ไวมากขึ้นเยอะเลยค่ะ

คำเฉพาะทางที่เป็นคำศัพท์อย่างเช่นชื่อประเทศ ชื่อมหาวิทยาลัย ชื่อคอร์สเรียนต่าง ๆ ตัว Otter ก็สามารถจับคำได้อย่างใกล้เคียงมาก แถมบันทึกคำศัพท์ให้เป็นตัวพิมพ์ใหญ่ได้ด้วย ถ้าหากว่าคำไหนที่ไม่ชัดเจน เราสามารถกดกลับไปแก้คำนั้น ๆ ในแอปได้ตลอด และยังสามารถแก้คำได้ผ่านทางเว็บไซต์และแอปไปพร้อม ๆ กัน

สำหรับคนที่งบน้อย Otter ยังมีตัวฟรีให้ใช้บริการ สามารถอัดเสียงได้ประมาณ 30 นาที และจำกัดที่ 600 นาทีต่อเดือน ถ้าเกิดทำรีเสิชที่เกิน 30 นาที เราก็เลือกอัดเสียงเป็น 2 เทปพร้อมกันได้

และอีกฟีเจอร์ที่ชอบมากที่สุดสำหรับการสรุปผลข้อความการทำรีเสิชคือส่วนของ Summary keywords & word clouds

word cloud from otter speech to text
word cloud

ตัว Word cloud จะช่วยสรุปผลคำที่ User ของเราพูดถึงบ่อย ๆ เวลาทำสัมภาษณ์ ทำให้เราสามารถเห็นคำศัพท์ที่หลากหลายได้มากขึ้น

อาทิเช่น User ของเราอาจจะบ่นว่า เว็บไซต์ไม่สวยเลย Too plain ถ้าเกิดเรามี User ประมาณ 25 คน และทุกคนพูดถึงคำนี้บ่อยมากที่สุด ตัวระบบก็จะช่วยเน้นคำให้เราได้นั่นเองค่ะ ง่ายและไวมากขึ้นในการทำ Synthesis เลย

อีกข้อที่ช่วยได้เยอะมากคือ

เวลาที่เราทำรีเสิช แต่เราไม่มีคนไปช่วยเราจดระหว่างการทำ Interview การใช้ Otter จะช่วยบันทึกข้อมูลการทำสัมภาษณ์พร้อมกับทำ Live transcript ได้อย่างรวดเร็ว ช่วยลดขั้นตอนและลดคนได้ในยามฉุกเฉิน (แต่จริงๆ มีคนจดก็ดีกว่านะคะ)

การใช้คนจด ทำให้บางครั้งเราอาจจะพลาดประเด็นสำคัญระหว่างการทำรีเสิชไป การมีทั้งคนจด และแอปช่วยจด จะช่วยให้เราได้ข้อมูลที่ครบถ้วนมากกว่าการจดเองด้วยมือนั่นเองค่ะ


หวังว่าบทความนี้จะตอบโจทย์กับเพื่อน ๆ ที่จะใช้ทูลเหล่านี้ในการทำ Research กันนะคะ ทั้งนี้ทั้งนั้นบทความนี้เขียนจากผู้ที่ทำงานด้าน UX UI แล้วมาเจอกันใหม่ในบทความหน้าค่า

บทความที่เกี่ยวข้อง

ข้อมูลจาก

Designil ทำงานกันอย่างเต็มที่เพื่อสร้างคอนเทนต์ดีๆ มีสาระประโยชน์ให้กับผู้อ่าน สิ่งที่ทีมงานแนะนำทั้งหมดมาจากการค้นคว้าและทดลองใช้งานจริงหลายสัปดาห์ หากคุณชอบเนื้อหาแบบนี้และอยากสนับสนุนให้ทีมงานให้มีแรงสร้างคอนเทนต์ดีๆ ในอนาคต สามารถซื้อสินค้าหรือบริการผ่านลิงก์บนบทความของเราได้นะครับ บางลิงก์ทางทีมงานจะได้รับส่วนแบ่งเล็กน้อยโดยจะไม่เป็นการเพิ่มภาระค่าใช้จ่ายให้กับทางผู้อ่าน ขอบคุณสำหรับการติดตามครับ การทำงานของเรา

Natk

Natk

UI Specialist ซิดนีย์ ออสเตรเลีย | ประสบการณ์ทำงาน 11 ปี | สนใจเรื่อง User Interface, User Experience, Accessibility, Education | ผู้ก่อตั้งกลุ่มเฟซบุ๊ก Tech ไทยในออสเตรเลีย | ผู้ดูแลเว็บไซต์ Designil
บทความทั้งหมด