จากโพสต์ แนะนำ Synthesizer for NVDA เชื่อว่าหลายคนคงยังไม่พอใจกับคุณภาพของเสียงฟรีที่มีให้ใช้งานกัน

ล่าสุดวันนี้ มีการประกาศอย่างเป็นทางการจาก blog ของ NVDA แล้วว่า เราสามารถซื้อเสียง Synthesizer จากค่าย Nuance มาใช้งานร่วมกับ NVDA ได้แล้ว

Vocalizer คือชื่อเรียกเสียง Speech Synthesizer ของ Nuance โดยที่หลายคนก็อาจจะคุ้นกับชื่อ RealSpeak ที่ใช้ในโปรแกรม Jaws ซึ่งมันก็คล้ายๆ กัน คือเป็นเสียงสังเคราะห์ ที่มีคุณภาพสูง จนฟังดูเป็นเสียงธรรมชาติได้ใกล้เคียงกับเสียงพูดของมนุษย์ได้มากที่สุด

และจากหัวข้อของโพสต์นี้ แน่นอนว่าหนึ่งในเสียงที่มีให้เลือกมากมาย ก็มีเสียง "นาริสา" หรือ Narisa ซึ่งก็คือเสียงภาษาไทยใน VoiceOver ที่มีให้ใช้ในผลิตภัณฑ์ต่างๆ จาก Apple ที่หลายคนน่าจะคุ้นเคยกันอยู่แล้ว จาก iOS devices iPhone, iPad, iPod touch เป็นต้น หรือแม้แต่ใน Mac OS เองตั้งแต่ v. 10.7 ก็มีเสียงนาริสานี้ไปเป็นหนึ่งใน เสียงของ VoiceOver ให้เลือกใช้กันด้วยเช่นกัน ดังนั้นสำหรับผู้ใช้ NVDA เราจึงมีทางเลือกสำหรับเสียงสังเคราะห์ในภาษาไทยเพิ่มขึ้นอีกหนึ่งตัวแล้ว นอกจาก ตาทิพย์

ข้อดีของการใช้ NVDA+เสียงนาริสา ก็คือ เราสามารถจะใช้ Screen reader ของเราแบบพกพา คือใส่ FlashDrive ไปใช้กับเครื่องไหนก็ได้ ซึ่งเป็นข้อดีของตัว NVDA อยู่แล้ว แต่ถ้าเราใช้ตาทิพย์ เราก็จะเจอข้อจำกัดว่า เราไม่สามารถทำให้ตาทิพย์ กลายเป็นโปรแกรมแบบพกพา (Portable) ไปด้วยได้ แต่เมื่อมีนาริสาตัวนี้ ข้อจำกัดตรงนี้จึงถูกทำลายไป

ถัดมา สำหรับคนที่คิดว่าเสียงตาทิพย์ (ซึ่งต้องอ้างอิงอยู่กับ SAPI4/SAPI5) มันอ่านได้ไม่เร็วทันใจ จากการทดลองพบว่า ถ้าเราใช้เสียงนาริสา การอ่านจะสามารถอ่านได้เร็วกว่าตาทิพย์พอสมควร คือโดยปกติ เราอาจจะใช้ตาทิพย์กันที่ความเร็วในระดับเต็ม 100% แต่พอมาใช้เสียงนาริสา เพียงแค่สัก 80% เราก็จะรู้สึกว่ามันเร็วพอสมควรแล้ว แต่ถ้าเราปรับให้เร็วสุด ยังไงมันก็ยังไม่เร็วเท่าเสียงของ eloquence ได้นะครับ :P

แต่ก็ใช่ว่ามันจะมีแต่ข้อดีไปทั้งหมด ข้อเสียของมันก็มีอยู่บ้าง อย่างแรกที่เห็นได้ชัดคือ ไฟล์เสียงของ Vocalizer ที่มีให้ใช้นี้ แต่ละเสียงมีขนาดค่อนข้างใหญ่ คืออยู่ราวๆ 300-600MB ต่อเสียง โดยเสียงนาริสาของเรานี้ ก็มีขนาดถึง 436Mb กันเลยทีเดียว ดังนั้นหากใครที่คิดจะนำ NVDA+Narisa ไปใช้แบบพกพาแล้วล่ะก็ คุณคงจะต้องหา FlashDrive ที่มีขนาดใหญ่หน่อยล่ะ ถึงจะพอใส่ รวมถึงคนที่จะใช้อยู่บนคอมพิวเตอร์โดยการลงแบบการติดตั้งแบบปกติด้วยก็เช่นกัน คงต้องเผื่อพื้นที่ใน drive ที่ติดตั้งโปรแกรม NVDA ไว้ให้มากหน่อย โดยเฉพาะถ้าคุณคิดว่าจะใช้เสียง Vocalizer หลายๆ เสียง

ข้อเสียอีกข้อหนึ่งก็คือ การอ่าน แน่นอนว่าคนที่เคยใช้ VoiceOver คงจะรู้ถึงจุดด้อยในการอ่านของเสียงนาริสากันอยู่แล้ว พอมันถูกนำมาใช้ร่วมกับ NVDA นี่ก็เช่นกัน ข้อเสียทุกอย่างก็ยังอยู่ครบท่วน เห็นจะดีขึ้นหน่อยก็ตรงที่ความราบรื่นในการอ่าน เนื่องจากเรามีหน่วยประมวลผลที่แรงกว่าในอุปกรณ์พกพาอย่างสมาร์ตโฟนหรือแท็บเล็ต ดังนั้นการอ่านของนาริสา จึงทำได้อย่างราบรื่น ไม่มีกระตุกให้รำคาญใจแต่อย่างใด

ซึ่งปัญหาการอ่าน ผิดๆ ถูกๆ นี้ เราสามารถใช้ฟังชั่นแก้ไขการอ่าน หรือ Dictionary ของ NVDA มาแก้ไขได้ในระดับหนึ่ง คล้ายๆ กับที่มีคนทำ JPT Tatip Dictionary plug in ออกมานั่นเอง ถ้ามีผู้ใช้มากในระดับหนึ่ง เราก็น่าจะร่วมกันพัฒนาการอ่านของนาริสานี้ได้ไม่ยาก

แต่ปัญหาที่แย่ที่สุด และน่าจะแก้ไขด้วยผู้ใช้ไม่ได้นั่นก็คือ สำเนียงการอ่านภาษาอังกฤษของนาริสานั้นถือว่า ค่อนข้าง "แย่" คือถ้าเราใช้ตาทิพย์ ตัวตาทิพย์เอง ก็อ่านภาษาอังกฤษได้ค่อนข้างดีในระดับหนึ่อยู่แล้ว รวมกับการที่เรายังต้องใช้ตาทิพย์คู่กับเสียง SAPI4/SAPI5 ซึ่งเป็น TTS ภาษาอังกฤษอยู่แล้ว ดังนั้นเมื่อเราอ่านไปเจอภาษาอังกฤษ บางทีมันก็จะใช้เสียง SAPI อ่านให้เราฟัง ซึ่งก็จะถูกต้องและชัดเจนดี

แต่พอมาใช้เป็นเสียงนาริสา ซึ่งมันสามารถทำงานได้ด้วยตัวเองแบบเดี่ยวๆ (เป็นสาเหตุทำให้มันเป็นโปรแกรมที่ใช้งานแบบพกพาได้ด้วย) ทำให้เราต้องหวังเพิ่งการอ่านจากตัวมันเองเพียงเท่านั้น ซึ่งหากผู้พัฒนาทำให้มันอ่านภาษาอังกฤษได้แค่ไหน มันก็จะอ่านได้แค่นั้น ซึ่งจุดนี้แนะนำให้ทดลองด้วยตัวเองดีกว่าครับ ว่าใครจะรับการอ่านภาษาอังกฤษจากนาริสานี้กันได้มากน้อยแค่ไหน

บอกข้อดีข้อเสีย ทำให้อยากใช้กันมาพอสมควรแล้ว มาถึงประเด็นสำคัญ ที่ต้องยกมาไว้ตอนท้าย เพราะเป็นสิ่งที่หลายคนคงไม่อยากให้มันมี นั่นก็คือ เสียง Vocalizer for NVDA นี้ "ไม่ฟรี" นะครับ หากเราอยากใช้งานเราจะต้องจ่ายเงิน 75 ยูโร หรือ $95 เพื่อซื้อสิทธิ์ในการใช้งานแบบเต็มๆ โดยหากใครสนใจ สามารถ ดูรายละเอียดการซื้อได้จาก http://www.vocalizer-nvda.com/en/ ตรงส่วนของ Where to buy

แต่เดี๋ยวก่อน... ทาง Nuance และนักพัฒนา ก็ไม่ได้ใจร้ายจนเกินไป เขาเปิดให้เราโหลดมาทดลองใช้งานกันฟรีๆ ได้ก่อนครับ โดยถ้าผู้เขียนเข้าใจไม่ผิด เขามีระยะเวลาการทดลองให้เรา 10 วัน หลังจากนั้น ถ้าเปิดใช้งาน เขาก็จะถามหา license ซึ่งถ้าใครต้องการใช้ต่อ ก็ไปเสียเงินซื้อสิทธิ์การใช้งานจากเขราเสียแต่โดยดี 55

แต่ถ้าคุณซื้อ license Vocalizer for NVDA นี้แล้ว นอกจากจะได้เสียง synthesizer ที่มีคุณภาพสูงมาใช้งานแล้ว ทุกๆ 8% ของค่า license จะถูกบริจาคไปยังกลุ่มนักพัฒนาโปรแกรม NVDA อีกด้วย เท่ากับเป็นการสนับสนุนโครงการ open source screen reader ตัวนี้ในทางหนึ่ง :D

ขั้นตอนและเงื่อนไขการใช้งาน

  1. Vocalizer for NVDA นี้จะใช้งานได้กับ NVDA version 2012.2 ขึ้นไปเท่านั้น ในส่วนนี้คงไม่ใช่เรื่องยาก ในเมื่อ NVDA เขาแจกฟรี เราก็ควรที่จะใช้ตัวล่าสุดกันอยู่แล้ว
  2. เราต้องลง Vocalizer driver ซึ่งเขาทำให้อยู่ในรูปแบบของ NVDA add-on มาให้เรียบร้อยแล้ว วิธีการติดตั้งและถอนการติดตั้ง NVDA add-ons อ่านได้จากที่นี่ Download vocalizer-driver-2.02 clickHere ซึ่งตัวนี้จะเป็นตัวจัดการเรื่อง License โดยจะมีเมนูเพิ่มขึ้นมาใน NVDA menu หลัก สามารถเข้าไปอ่านรายละเอียดดูได้ว่า เราใช้ demo ได้ถึงวันไหน
  3. จากนั้นเราก็ต้องไปโหลดเสียง Synthesizer ในสำเนียงที่เราต้องการใช้ มาติดตั้ง (มาเป็น NVDA add-on package อีกเช่นเดิม) โดยเข้าไปโหลดกันได้ที่ Vocalizer for NVDA downloads page โดยจะมีเสียงให้เลือกมากมาย แต่ใครที่สนใจเสียงนาริสาเป็นพิเศษ ให้กดลงไปล่างสุด แล้วกด shift+h ย้อนขึ้นมา ก็จะเจอเสียงนาริสาเลยทันทีครับ (เอาภาษาไทยเราไว้ล่างสุดซะงั้น) หรือจะ กดโหลดจากตรงนี้เลยก็ได้

เมื่อทำครบตามขั้นตอนทั้งหมดแล้ว เมื่อเราเข้าไปตรงที่เลือกเสียง Synthesizer ของ NVDA (NVDA+control+s) ก็จะเห็นว่า มี Nuance Vocalizer 5.5 เพิ่มมาเป็นตัวเลือกให้อีกอันนึง

และเมื่อเลือกเป็น synthesizer ตัวนี้แล้ว ใน voice settings เราก็จะสามารถเปลี่ยนเป็นเสียงต่างๆ ที่เราโหลดมาติดตั้งตามข้อ 3. ได้

และถ้าใครลง plug in Synth_Switch ที่เคยแจกไปในกระทู้ที่แล้วไว้ มันจะยังใช้กับเสียง Vocalizer นี้ไม่ได้นะครับ ยกเว้นจะไปปรับแต่งโค้ต หรือรอใครทำออกมาแจก (ถ้ามีคนขอเราก็จะทำแจก หุหุ)

ที่มา: tweet จาก @NVAccess

Want a portable, performant and high-quality voice for NVDA? Check out Nuance Vocalizer for NVDA! http://www.nvda-project.org/blog/VocalizerAndNVDA

เพิ่มเติม มีตัวอย่างการอ่านของ "นาริสา" โดยผู้เขียนได้บันทึกตอนที่นาริสาอ่านบทความจากอินเทอร์เน็ต (จาก IE นี่แหละ) ก็ลองกดฟังกันได้จากคลิปนี้นะครับ :D