閩南方言智能語音數據庫研究
講座提要:
本文以 AI 語音系統研發為例,說明適用於智能語音系统的閩南方言語料庫建制的原則和方法。針對系統中 ASR 端准確率未超過 85%,TTS 端不夠準確自然流暢等閩南方言智能語音系統自主研發難題,提出面向低資源的閩南方言,需建設大規模方言語料庫、制定數據標注方案,同時建立大規模的、規範標注的語言模型和聲學模型語料庫,以及基於大文本語料的閩南方言語音-語法界面研究。通過資料化手段保護和傳承閩南方言,同時推進方言本體和應用研究。
主講人:許彬彬教授,福建漳州人,博士,廈門大學中文系助理教授,碩士生導師,福建師範大學兼職副研究員。在國内外一流刊物及學科重要學術會議發表論文幾十篇。專著 1 部,參與教材編寫 3 部,文獻題解 1 部。主持國家社科基金青年項目 1 項,中央高校基本科研項目 2 項,横向課題 2 項,福建省社科規劃一般項目 1 項;參與國家社科基金重大課題 4 項,國家社科基金冷門絕學團隊項目 1項,國家社科基金冷門絕學個人項目1項,國家社科基金青年項目3 項,福建省中青年教師教育科研項目 A 類社科重點課題 1 項,横向課題2項。指導學生獲得多項創新競賽獎。研發首個閩南方言語音合成系統,於 2019 年上線。
講座時間:26/11/2025(週三)19:30-21:00 /線下E21-3118



