中央研究院智財技轉處對外服務網

中央研究院口語韻律語料庫暨工具平台

摘要

COSPRO & Toolkit係中研院語言所特聘研究員鄭秋豫從事語流韻律研究，於1994至2005年收集之國語連續語流語料，及依研究需要所發展的工具平台，可供語音研究、語音合成與語者辨識等多方面應用。

COSPRO包含9個子語料庫，每個子語料庫針對不同的語流韻律現象設計而成：COSPRO 01-08為麥克風朗讀語音，COSPRO 09則為麥克風自發性語音。內容包括不同長度的語料：孤立詞組（1至4字詞）、孤立句（含直述、驚嘆、疑問句）、無意義字串隨機排列句（“Word Salad”），及段落語篇（85至996音節）。

本資料庫共10.5GB，約132小時，共有114人次口語資料（53男61女）。其中7.7 GB的語料已經過處理，並附說明，釋出wav檔案、每位語者的朗讀（轉寫）文本（*.txt）、人工調整音標檔（*.adjusted / *.syl），以及停延韻律標記檔（*.break）；其餘未經處理之原始語料，則釋出wav檔案、語者的朗讀（轉寫）文本（*.txt），以及程式處理過後的音標檔（*.phn）。

COSPRO與其他語料庫最大的差異在於：包含 (1)人工調整音標檔（*.adjusted / *.syl）：不只是HTK處理過的音段標註檔案（*.phn）。處理完成之語料均以人工方式對齊語音音段邊界，標註子音與母音的時間碼。(2)停延韻律標記檔（*.break）：經過訓練之標音員以聽感為基礎標註韻律，並通過標註一致性檢驗。人工感知韻律標註的主要意義在於：以本語料庫所提供的韻律標記做為語音信號分析的標準答案，而非得自文本分析結果，是符合語音事實的韻律單位，目的是突顯語音與文本不完全匹配的事實。

COSPRO Toolkit則為一視窗介面，易操作的語音分析暨合成之工具平台，集合了Adobe Audition、Praat及Speech Viewer等常見語音分析（合成）軟體之特點，其主要功能包括：聲學訊號分析功能、標記口語語流功能以及重新合成語音訊號功能，特別適合作為教學工具。

技術優勢

語料內容包羅不同長度的語料，短至孤立詞組(1-4字詞)，長至段落語篇（85-996音節），強調連續語流中的語篇關連性與敍事效應的聲學表現，故有別於其他強調音段特性以及孤立短句的語音資料庫。

本院覽號

24T-940322

公告日期

授權狀態

已授權中（非專屬，仍歡迎洽談授權）

智財權狀態

know-how

應用範圍

國語語篇韻律研究
國語語音合成
國語語音辨識

創作人

鄭秋豫

檔案下載

中央研究院口語韻律語料庫暨工具平台