'วาจา.เวอร์ชั่น 6.0' คอมพิวเตอร์พูดได้

    Attention: open in a new window. PDFPrintE-mail

      หากมีบริการออกเสียงเป็นคำพูดให้เราได้ คงจะทำให้การดำเนินชีวิตประจำวันสะดวกขึ้น ยิ่งคนที่มีข้อจำกัดทางการสื่อสารด้วยแล้ว จะทำให้ง่ายต่อการดำรงชีวิตได้อย่าง มีประสิทธิภาพ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) มีผลงานวิจัยเทคโนโลยีสังเคราะห์เสียงพูดภาษาไทยที่เรียกว่า "วาจา เวอร์ชั่น 6.0" ออกมา สำหรับวาจา เวอร์ชั่น 6.0 เป็นระบบที่สามารถนำไปใช้งานได้ทั้งในเชิงธุรกิจ การศึกษา และสังคม โดยตั้งเป้าหมายสำคัญไปยังกลุ่มธุรกิจที่พัฒนาระบบ หรือให้บริการด้าน Call Center ซึ่งระบบดังกล่าวจะช่วยลดภาระงานประเภททำซ้ำ อาจก่อให้เกิดความเบื่อหน่ายในการทำงาน ช่วยเพิ่มเอกลักษณ์ที่โดดเด่นด้านเทคโนโลยี ให้แก่ผลิตภัณฑ์หรือบริการได้ หากเป็นผลิตภัณฑ์ที่ต้องการจะพัฒนาขึ้นใหม่ ระบบวาจา เวอร์ชั่น 6.0 จะมีบทบาทที่ช่วยสร้างภาพลักษณ์ของผลิตภัณฑ์ เน้นการใช้งานที่สอดคล้องกับวิถีชีวิตคนในปัจจุบัน ที่ต้องการความสะดวกรวดเร็ว

      ส่วนรูปแบบการถ่ายทอดเทคโนโลยีและการให้บริการนั้นประกอบด้วย การอนุญาตให้ใช้สิทธิการร่วมพัฒนา การร่วมลงทุน การดาวน์โหลดซอฟต์แวร์ไปใช้งาน และการ นำไปพัฒนาเป็นซอฟต์แวร์ประยุกต์ต่างๆ

      เทคโนโลยีสังเคราะห์เสียงพูด (Textto-Speech Synthesis : TTS) เป็นเทคโนโลยีด้านคอมพิวเตอร์ประเภทปัญญาประดิษฐ์ ช่วยแปลงข้อความจากตัวอักษรเป็นเสียงพูดหรือเสียงอ่านได้โดยอัตโนมัติ ซึ่งศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) ได้พัฒนาเทคโนโลยีภายใต้ชื่อ "วาจา เวอร์ชั่น 6.0" เป็นเทคโนโลยีใหม่ที่บีบอัดฐานข้อมูลเสียงขนาดใหญ่เป็นแบบจำลองทางสถิติในการสังเคราะห์เสียง แบบจำลองสามารถผลิตเสียงได้ราบเรียบ ไม่เกิดการสะดุด อีกทั้งสามารถปรับค่าต่างๆในเนื้อเสียง เช่น เสียงสูงต่ำ เสียงสั้นยาว

      คุณสมบัติสำคัญประกอบด้วย 1.เป็นหนึ่งในระบบสังเคราะห์เสียงพูดภาษาไทยที่มีคุณภาพสูงสุดในปัจจุบัน 2.มีส่วนวิเคราะห์ข้อความประกอบด้วย ส่วนตัดแบ่งคำที่มีความถูกต้องเกิน 95% และวิเคราะห์คำอ่านภาษาไทยได้ถูกต้องเกิน 92% แม้จะเป็นคำที่ไม่ปรากฏในพจนานุกรมของระบบ 3.สามารถวิเคราะห์คำอ่านของคำภาษาอังกฤษได้ด้วยการใช้พจนานุกรมคำภาษาอังกฤษ ซึ่งปัจจุบันมีคำศัพท์ที่ใช้บ่อยในภาษาไทยประมาณ 10,000 คำ 4.มีเครื่องมือสำหรับเพิ่มคำศัพท์และคำอ่านที่ต้องการได้

      ปัจจุบัน "วาจา เวอร์ชั่น 6.0" เปิดให้บริการใน 2 รูปแบบคือ แบบอิสระ (Standalone) ผู้ใช้งานสามารถดาวน์โหลดไปใช้งานในเครื่องคอมพิวเตอร์ของตนเองได้ และแบบให้บริการผ่านเว็บหรือที่เรียกว่า Web Service โดยใช้งานผ่านเครือข่ายอินเทอร์เน็ต สามารถเรียกใช้บริการผ่าน Web Service ได้โดยไม่ต้องติดตั้งซอฟต์แวร์วาจาบนเครื่อง ช่วยลดปัญหาความยุ่งยากของแพลตฟอร์มที่หลากหลายในปัจจุบัน ไม่ว่าจะเป็น Windows iOS หรือ Android      การให้บริการ Web Service รองรับ ผู้ใช้จำนวนมากจึงจำเป็นต้องมีโครงสร้างพื้น ฐานที่ดี ทั้งด้านฮาร์ดแวร์แม่ข่าย มาตรฐานการให้บริการ ตลอดจนการให้คำปรึกษาที่ดี ดังนั้น เนคเทคจึงได้ร่วมมือกับพันธมิตรทางธุรกิจรายแรกในประเทศไทยคือ บริษัท อินเทอร์เน็ตประเทศไทย จำกัด (มหาชน) ซึ่งจะเป็นผู้ดูแลบริการ Web Service เพื่อตอบสนองความต้องการของผู้ใช้ในการนำไปต่อยอดทางธุรกิจ

      ระบบวาจา เวอร์ชั่น 6.0 และระบบไอเอเจนต์ได้ถูกนำไปประยุกต์ใช้ในการให้บริการสาธารณะในหลากหลายรูปแบบ ได้แก่

      1. ไอเอเจนต์ เป็นระบบตอบรับโทรศัพท์ (Interactive Voice Response, IVR) หรือที่เรียกว่าคอลเซ็นเตอร์ (Call Center) ซึ่งเป็นกลุ่มผู้ใช้งานที่มีตลาดใหญ่ที่สุด
      2. .TVIS  เป็นบริการตอบรับโทรศัพท์อัตโนมัติสำหรับรายงานข้อมูลสภาพจราจร 
      3. NVIS  เป็นระบบอัตโนมัติที่รับ RSS feed ข้อความข่าวสั้นจากแหล่งข่าวต่างๆ เช่น MCOT, ASTV, TPBS และ CH7 มาแปลงเป็นเสียงพูดให้บริการผู้ใช้ที่โทรศัพท์
      4. POST-VOICE  เป็นระบบโพสต์ข้อความเสียงอัตโนมัติใน Social Network ประเภท Facebook และ Twitter  
      5. ISAY เป็นบริการพื้นฐานสำหรับการสังเคราะห์เสียงพูดภาษาไทย โดยผู้ใช้สามารถพิมพ์ข้อความใดๆและกดปุ่มเพื่อแปลงข้อความเป็นเสียงพูด ในกรณีที่ผู้ใช้พิมพ์ข้อความเป็นภาษาอื่นๆที่ไม่ใช่ภาษาไทย ระบบจะสามารถตรวจสอบได้ว่าเป็นภาษาใด และนำไปแปลเป็นข้อความภาษาไทย

      ที่ผ่านมามีหน่วยงานทั้งภาครัฐและภาคเอกชนนำ "วาจา เวอร์ชั่น 6.0" ไปให้บริการในองค์กรของตนในรูปแบบที่หลากหลาย อาทิ โรงพยาบาลจุฬาลงกรณ์ สภากาชาดไทย พัฒนาเป็นระบบติดตามดูแลผู้ป่วยเบาหวานผ่านโทรศัพท์มือถือ ผู้ป่วยและแพทย์สามารถกำหนดเวลาในการติดตามผลการรักษาและการดูแลสุขภาพตนเอง, โรงพยาบาลเทศบาลเชียงใหม่นำไปประกอบใช้ในระบบเรียกคิวผู้ป่วยในโรงพยาบาล, มหาวิทยาลัยรามคำแหงนำไปใช้สร้าง eLearning content สำหรับการเรียนการสอน, โรงพยาบาลศิริราชนำไปใช้ในการช่วยให้ผู้ป่วยที่มีปัญหาในการออกเสียง สามารถสื่อสารได้ด้วยการใช้เสียงสังเคราะห์ที่เรียกชื่อว่า ICU Talk

      ขณะเดียวกันสถาบันเทคโนโลยีนานาชาติสิรินธรนำไปใช้เป็นซอฟต์แวร์ที่ทำงานบนเครื่องโทรศัพท์มือถือแบบ Windows Mobile เพื่อสร้างเสียงสังเคราะห์จากข้อความต่างๆบนเครื่อง เช่น อ่าน อีเมล์ แสดงเสียงตัวเลขปุ่มกดเรียกชื่อว่า pTalk ปัจจุบันถูกบรรจุอยู่ในเครื่องโทรศัพท์ที่มหาวิทยาลัยธรรมศาสตร์ เพื่อจัดสรรไว้สำหรับอำนวยความสะดวกในการใช้ชีวิตของนักศึกษาที่บกพร่องทางสายตา รวมถึงเนคเทคนำมาใช้ในระบบตอบรับโทรศัพท์อัตโนมัติ (NECTEC Call Center) เพื่อให้ข้อมูลงานวิจัยและพัฒนา นอกจากนี้กรมสรรพากรได้ประยุกต์ใช้ข้อมูลข่าวต่างๆด้วยข้อความและคลิปเสียงที่ผู้ใช้สามารถกดเพื่อฟังแทนการอ่านได้

      ดังจะเห็นได้ว่า "วาจา เวอร์ชั่น 6.0" สามารถนำไปใช้งานได้จริงทั้งในหน่วยงานภาครัฐและเอกชน นับเป็นการเพิ่มมูลค่าและโอกาสทางธุรกิจบริการด้วยเทคโนโลยีการสังเคราะห์เสียงพูดนั่นเอง

      ที่มา:  ปาริชาติ กาญจนกูล. คอลัมน์ ทันโลกไอซีที 'วาจา.เวอร์ชั่น 6.0'คอมพิวเตอร์พูดได้. หนังสือพิมพ์โลกวันนี้ ฉบับวันที่ 11 เมษายน 2554

        Items details

        • Hits: 1385 clicks
        • Average hits: 106.5 clicks / month

        TCE-Plugin by www.teglo.info



        บทความนี้มีประโยชน์มากน้อยเพียงใด: / 9
        น้อยมากที่สุด