ถึงเวลาปิด Noise และเปิด Voice
Technology & Innovation

ถึงเวลาปิด Noise และเปิด Voice

  • 15 Nov 2019
  • 28030

ดูเหมือนว่าเทรนด์การ “เลือกได้ยิน” จะกำลังเปลี่ยนไลฟ์สไตล์การใช้ชีวิตของคนยุคใหม่ไปโดยสิ้นเชิง โดยเหล่าบริษัทเทคโนโลยีและสตาร์ตอัพในซิลิคอนแวลลีย์ต่างกำลังเร่งพัฒนาเทคโนโลยี Hearable ที่คาดว่าจะมาแรงและแซงเทคโนโลยี Wearable ได้ในอนาคต เพราะลองจินตนาการดูว่า ชีวิตจะง่ายขนาดไหน หากคุณแค่ใส่หูฟังเครื่องเดียวก็เหมือนมีผู้ช่วยชาญฉลาดอย่าง Alexa, Siri และ Google Assistant อยู่ช่วยคุณได้ทุกที่ทุกเวลาราวกับภาพยนตร์เรื่อง Her (2013) ไม่มีผิด แต่คำถามที่ตามมาก็คือ เทคโนโลยีที่ช่วยมอบความสะดวกสบายและเพิ่มความเป็นส่วนตัวเช่นนี้จะยิ่งทำให้มนุษย์รู้สึกห่างเหินกันมากกว่าเดิมหรือไม่

เพราะนอกจากความว้าวของการเปิดตัว Google Duplex ฟีเจอร์ใหม่จาก Google Assistant ที่สามารถโทรจองร้านอาหารและโต้ตอบกับมนุษย์ได้ดีและเป็นธรรมชาติมากเสียจนแทบแยกไม่ออกว่าเป็น AI แล้ว ล่าสุดสถาบัน MIT ก็ได้เปิดตัวปัญญาประดิษฐ์ AlterEgo เครื่องมือที่สามารถแปลคำสั่งจากสมองได้โดยตรงโดยที่ผู้ใช้งานไม่จำเป็นต้องพูดออกคำสั่งดัง ๆ ออกมา หรืออธิบายให้ง่ายขึ้นอีกก็คือ เครื่องมือนี้สามารถอ่านคำสั่งที่เป็นเพียงแค่ “เสียงในใจ” ของผู้ใช้งาน และตอบกลับให้ผู้ใช้งานได้รู้เพียงคนเดียวเท่านั้น ซึ่งตอนนี้ AlterEgo ก็ฉลาดเสียจนสามารถแก้ปัญหาทางคณิตศาสตร์และเล่นหมากรุกได้แล้ว อย่างไรก็ตาม อาร์นาฟ คาเปอร์ (Arnav Kapur) ผู้พัฒนาเครื่องมือนี้ย้ำว่า AlterEgo ไม่ใช่เครื่องมือที่มีไว้เพื่ออ่านใจมนุษย์ เพราะผู้ใช้งานจำเป็นต้องออกคำสั่งในใจเพื่อสื่อสารกับเครื่องมือโดยตรง โดยทีมงานผู้พัฒนาเครื่องมือนี้ยังหวังว่า AlterEgo จะเป็นตัวช่วยลดความยุ่งยากในการติดต่อสื่อสารกับผู้อื่น รวมถึงเพิ่มความเป็นส่วนตัว และยังสามารถใช้เป็นผู้ช่วยปฏิบัติภารกิจลับของทหารในยามที่ไม่สามารถใช้เสียงได้ ตลอดจนเป็นเครื่องมือที่จะช่วยสื่อสารให้กับผู้ที่มีปัญหาด้านการพูดอีกด้วย

สำหรับคนเบื่อที่จะพูด AlterEgo อาจเป็นเครื่องมือในฝันที่น่ามีไว้ในครอบครอง แต่คงน่าเสียดายหากเราเกิดมามีเสียงแต่ไม่ได้ใช้ จะดีกว่าไหมหากเราสามารถบริจาคเสียงเพื่อคนที่ไม่มีโอกาสมีเสียงเป็นของตัวเองโดยใช้เวลาแค่ไม่กี่ชั่วโมง

ไอเดียนี้เกิดขึ้นจริงแล้วโดยรูพาล พาเทล (Rupal Patel) นักวิทยาศาสตร์ด้านการพูดที่ได้ทำการศึกษาผู้ที่มีความบกพร่องด้านการพูดและพบว่า แม้คนที่พูดไม่ได้จะไม่สามารถเปล่งเสียงออกมาเป็นคำให้คนอื่นๆ เข้าใจเพราะมีตัวกรองเสียงที่ผิดปกติ แต่พวกเขายังสามารถควบคุมระดับเสียงสูงต่ำ ความดัง และจังหวะของเสียงได้ เหล่านี้คือเอกลักษณ์เสียงจริง ๆ ของผู้ที่มีปัญหาด้านการพูดที่หลงเหลืออยู่ รูพาลจึงร่วมมือกับดร. ทิม บันเนลล์ (Dr. Tim Bunnell) ผู้เชี่ยวชาญเรื่องเสียงสังเคราะห์ และทำการสร้างเสียงใหม่ที่ผสานเอกลักษณ์เสียงจริงของผู้บกพร่องด้านการพูดเข้ากับเสียงของผู้บริจาค

โปรเจ็กต์ที่ชื่อว่า VocaliD (ย่อมาจากคำว่า Vocal Identity หรือ เอกลักษณ์เสียง) จึงเกิดขึ้นเพื่อเปิดโอกาสให้คนมาบริจาคเสียงของตัวเองโดยการอ่านประโยคสั้น ๆ ที่ครอบคลุมเสียงทั้งหมดที่มีอยู่ในภาษา ซึ่งใช้เวลาอ่านประมาณ 3-4 ชั่วโมง เพื่อรวบรวมเสียงเหล่านี้เก็บไว้เป็นคลังเสียง ก่อนจะนำไปเข้ากระบวนการผสานเสียงของผู้บริจาคที่มีเอกลักษณ์ใกล้เคียงกับเสียงของผู้ที่มีความบกพร่องด้านการพูดเข้าไว้ด้วยกัน จนเกิดเป็นเสียงใหม่ที่ยังคงเอกลักษณ์ใกล้เคียงกับเสียงจริง ๆ ของพวกเขาไว้มากที่สุด

เด็กชายวิลเลียมผู้ที่ไม่เคยมีเสียงของตัวเองมานาน 9 ปี คือคนแรกที่ทีมงาน VocaliD สร้างเสียงสังเคราะห์จากเอกลักษณ์เสียงเดิมของเขาได้สำเร็จ ซึ่งสิ่งแรกที่วิลเลียมตอบสนองต่อเสียงใหม่ของเขาผ่านการพิมพ์ข้อความตอบกลับมาก็คือ "Never heard me before." ที่น่าจะสื่อถึงความสำเร็จของโครงการนี้ได้เป็นอย่างดี ที่ได้มอบเสียงซึ่งเปลี่ยนชีวิตของผู้บกพร่องด้านการพูด ให้รู้สึกถึงการมีตัวตนและมีชีวิตชีวาขึ้นมาอีกครั้ง เหมือนอย่างที่รูพาล พาเทล เชื่อมั่นถึงความสำคัญของเสียงที่สะท้อนถึงตัวตนของมนุษย์อันทรงพลัง และได้ยกย่องคำพูดของเฮนรี แวดสเวอร์ธ ลองเฟลโลว์ (Henry Wadsworth Longfellow) กวีเอกชาวอเมริกัน ที่เคยบอกเอาไว้ว่า "เสียงของมนุษย์คือเครื่องดนตรีของจิตวิญญาณ"

ที่มาภาพ : Kaweepat Phuycharoen

ที่มา:
วิดีโอ “Synthetic voices, as unique as fingerprints” โดย Rupal Patel จาก ted.com
บทความ “Overview: AlterEgo” จาก media.mit.edu

เรื่อง : วรรณเพ็ญ บุญเพ็ญ