COSPRO & Toolkit係中研院語言所特聘研究員鄭秋豫從事語流韻律研究,於1994至2005年收集之國語連續語流語料,及依研究需要所發展的工具平台,可供語音研究、語音合成與語者辨識等多方面應用。
COSPRO包含9個子語料庫,每個子語料庫針對不同的語流韻律現象設計而成:COSPRO 01-08為麥克風朗讀語音,COSPRO 09則為麥克風自發性語音。內容包括不同長度的語料:孤立詞組(1至4字詞)、孤立句(含直述、驚嘆、疑問句)、無意義字串隨機排列句(“Word Salad”),及段落語篇(85至996音節)。
本資料庫共10.5GB,約132小時,共有114人次口語資料(53男61女)。其中7.7 GB的語料已經過處理,並附說明,釋出wav檔案、每位語者的朗讀(轉寫)文本(*.txt)、人工調整音標檔(*.adjusted / *.syl),以及停延韻律標記檔(*.break);其餘未經處理之原始語料,則釋出wav檔案、語者的朗讀(轉寫)文本(*.txt),以及程式處理過後的音標檔(*.phn)。
COSPRO與其他語料庫最大的差異在於:包含 (1)人工調整音標檔(*.adjusted / *.syl):不只是HTK處理過的音段標註檔案(*.phn)。處理完成之語料均以人工方式對齊語音音段邊界,標註子音與母音的時間碼。(2)停延韻律標記檔(*.break):經過訓練之標音員以聽感為基礎標註韻律,並通過標註一致性檢驗。人工感知韻律標註的主要意義在於:以本語料庫所提供的韻律標記做為語音信號分析的標準答案,而非得自文本分析結果,是符合語音事實的韻律單位,目的是突顯語音與文本不完全匹配的事實。
COSPRO Toolkit則為一視窗介面,易操作的語音分析暨合成之工具平台,集合了Adobe Audition、Praat及Speech Viewer等常見語音分析(合成)軟體之特點,其主要功能包括:聲學訊號分析功能、標記口語語流功能以及重新合成語音訊號功能,特別適合作為教學工具。
語料內容包羅不同長度的語料,短至孤立詞組(1-4字詞),長至段落語篇(85-996音節),強調連續語流中的語篇關連性與敍事效應的聲學表現,故有別於其他強調音段特性以及孤立短句的語音資料庫。
24T-940322
know-how
- 國語語篇韻律研究
- 國語語音合成
- 國語語音辨識
鄭秋豫
檔案下載