AESOP-ILAS語料庫為「亞洲口音英語跨國語音資料庫AESOP(Asian English Speech cOrpus Project)國際聯盟」的台灣二語英語部分,由蔣經國國際學術交流基金會同名專題計畫資助,計畫編號DB002-D-08,執行期間民98.07.01~101.12.31,計畫主持人為中研院語言所特聘研究員兼所長鄭秋豫。
1、發音人:總計540人次
(1)AESOP-ILAS 1:美式英語母語者(L1)12人(男性6人,女性6人),台灣地區國語母語者(L2)488人(男性231人,女性257人),共500人次。
(2)AESOP-ILAS 2:美式英語母語者(L1)10人(男性5人,女性5人),台灣地區國語母語者(L2)30人(男性15人,女性15人),共40人次。
2、語料庫大小:總計13.9GB,約812小時;包含原始音檔(*.wav),及對照文本(*.corpus)
(1)AESOP-ILAS 1:8.58GB,約500小時
每筆語料錄音時間平均1小時。
(2)AESOP-ILAS 2:5.32GB,約312小時
每筆語料錄音時間平均7.8小時(L1:5.25小時;L2:8.7小時)。
3、語料設計:
(1)AESOP-ILAS 1:朗讀短句與短語篇語料共6種,誘發性半自發人機對話1種,自發性看圖描述1種,共8種。
(2)AESOP-ILAS 2:朗讀單詞、窄焦點短句、長語篇段落語料各1種,誘發性半自發人機對話1種,中文短語篇段落語料1種,共5種。
24T-1040202
know-how
本語料庫不以音段或某特定或個別語音特徵為目標,而以音節、詞組、片語、短句與多短語語段等各級不同大小的語言層次及單位,強調較全面性、具溝通訊息的韻律現象及語音特徵,以期提供更豐富的語音分析與評量指標。
鄭秋豫
檔案下載