image
Technology & Innovation

ถอดรหัสภาษาโบราณด้วย AI

  • 04 Nov 2020
  • 45

รู้หรือไม่ว่า ภาษาส่วนใหญ่ที่เคยเกิดขึ้นตลอดประวัติศาสตร์มนุษย์เป็นภาษาที่ตายแล้ว

ปัจจุบันภาษาที่ใช้กันอยู่ทั่วโลกนั้นมีราว 7,000 ภาษา ซึ่งนับเป็นจำนวนไม่ถึงครึ่งของภาษาทั้งหมดที่เคยเกิดขึ้นมาตลอดประวัติศาสตร์ของมนุษยชาติ ภาษาที่ตายไปนั้น ส่วนมากมักสูญหายไปตามเวลา เนื่องจากคนรุ่นหลังไม่มีข้อมูลเกี่ยวกับตัวอักษร โครงสร้างไวยากรณ์ หรือคำศัพท์มากพอที่จะย้อนกลับไป “ถอดรหัส” ภาษาเหล่านั้นได้อย่างถูกต้อง และเมื่อภาษานั้นไม่สามารถถูกศึกษาและทำความเข้าใจได้ ผลกระทบจึงไม่ใช่แค่การหายไปของภาษาเท่านั้น แต่องค์ความรู้ทั้งหมดเกี่ยวกับผู้คนและวัฒนธรรมของผู้ใช้ภาษานั้น ๆ ก็จะสูญหายตามไปด้วย

โดยทั่วไปการศึกษาภาษาโบราณจะอาศัยการวิเคราะห์จากหลักฐานลายลักษณ์อักษรประเภทต่าง ๆ เพื่อดูว่ามีความสัมพันธ์ใกล้เคียงกับภาษาอะไร ซึ่งอาจจะเป็นภาษาที่ใช้ในปัจจุบันหรือภาษาโบราณที่เคยได้รับการถอดรหัสแล้วก็ได้ แต่ความยากนั้นจะมาพร้อมกับความเก่าแก่และไม่สมบูรณ์ของหลักฐานที่เสื่อมสลายไปตามกาลเวลา อีกทั้งยังเป็นกระบวนการที่ต้องใช้ความเชี่ยวชาญและความละเอียดสูงมาก ทำให้ในปัจจุบัน เริ่มมีการนำปัญญาประดิษฐ์ (AI) และเทคนิค Machine Learning1 มาใช้ในกระบวนการศึกษาทางประวัติศาสตร์มากขึ้น เพื่อช่วยให้กระบวนการค้นคว้าต่าง ๆ ใช้ระยะเวลาน้อยลง และมีประสิทธิภาพมากยิ่งขึ้น 

ทีมนักวิทยาศาสตร์คอมพิวเตอร์จาก DeepMind ร่วมกับมหาวิทยาลัยออกซ์ฟอร์ด พัฒนา AI ชื่อว่า “Pythia” (ไพเธีย : เทพยากรแห่งวิหารเดลฟีตามตำนานกรีก) ด้วยการฝึกฝนอัลกอริทึมให้จดจำคำต่าง ๆ เพื่อนำมาวิเคราะห์และทำนายคำที่หายไปจากจารึกภาษากรีกโบราณที่เสียหาย ซึ่งพบข้อผิดพลาดเพียง 30.1% เทียบกับมนุษย์ที่พบข้อผิดพลาดถึง 57.3% 

ในขณะเดียวกันทีมวิจัยจากสถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) และทีมจากวิจัย AI จากกูเกิล ก็ได้ลองนำเทคนิค Machine Learning มาใช้แปลภาษา Linear B บนศิลาจารึก ซึ่งเป็นอักษรโบราณที่พบบริเวณประเทศกรีซราว 1,400 ปีก่อนคริสตกาล โดยเป็นการแปลภาษาแบบอัตโนมัติ เทียบเคียงกับภาษากรีกโบราณที่มีความใกล้เคียงกันเป็นครั้งแรก ซึ่งก็ได้ผลลัพธ์ที่มีความแม่นยำถึง 67.3% และมีแนวโน้มที่จะพัฒนาขึ้นอย่างต่อเนื่อง

อีกหนึ่งนวัตกรรมจากทีมวิจัย MIT คือการพัฒนา AI เพื่อถอดความหมายของภาษาแบบไม่ต้องพึ่งพาการเทียบเคียงกับภาษาอื่น ซึ่งจะช่วยให้เราทำความเข้าใจภาษาโบราณได้โดยไม่จำเป็นต้องรู้มาก่อนว่าอักษรนั้นเกี่ยวข้องหรือใกล้เคียงกับภาษาอะไร แต่ AI จะเข้ามาแปลภาษาโดยใช้องค์ความรู้ทางภาษาศาตร์และประวัติศาสตร์ พร้อมทั้งระบุได้้ด้วยว่า ภาษานั้นอยู่ในตระกูลภาษาใด และหากทำสำเร็จก็หมายความว่า เราจะสามารถทำความเข้าใจภาษาได้เกือบทุกภาษาบนโลก ซึ่งทางทีมพัฒนาคาดว่าจะใช้คำตั้งต้นเพียงหนึ่งพันคำในการถอดรหัส

นวัตกรรมเหล่านี้กำลังเข้ามาพลิกฟื้นองค์ความรู้ที่ตายแล้วทางประวัติศาสตร์ให้กลับมามีชีวิตอีกครั้ง และยิ่ง AI ได้รับการฝึกฝนและพัฒนาไปมากเท่าไร เราก็จะได้ข้อมูลที่แม่นยำมากขึ้นเท่านั้น อันจะเป็นตัวช่วยสำคัญในการขยายขีดจำกัดทางความรู้ เติมเต็มช่วงเวลาที่เคยหล่นหายไปในประวัติศาสตร์ และทำให้เราเข้าใจอดีตและการเปลี่ยนแปลงต่าง ๆ ได้มากยิ่งขึ้น

ที่มาภาพเปิด : Jeremy Zero/Unsplash

ที่มา : บทความ “Machine learning has been used to automatically translate long-lost languages” จาก technologyreview.com
บทความ “MIT Using Artificial Intelligence to Translate Ancient ‘Dead’ Languages” จาก scitechdaily.com
บทความ “Restoring ancient text using deep learning: a case study on Greek epigraphy” โดย Yannis Assael, Thea Sommerschield และ Jonathan Prag จาก deepmind.com
ethnologue.com

เรื่อง : ณัฐชา ตะวันนาโชติ