中文語音辨識系統
2024-09-04
中文語音辨識系統
本院覽號
05T-1110325
公告日期
2024-09-04
智財權狀態
know-how
摘要
本中文語音辨識系統採用Kaldi工具包開發,核心模組包括中文發音字典、語音模型、語言模型及辨識系統架構。系統包括即時語音辨識核心及離線語音辨識核心,前者可以應用在各種需要即時辨識輸入語音的應用系統,例如人機互動系統、智慧音箱等,後者可以應用於將錄音檔轉逐字稿、幫影片上字幕等。
技術優勢
- 系統成熟:經過本團隊多年的努力,中文語音辨識技術已經相當成熟,所開發的中文語音辨識系統功能亦相當完整。
- 操作簡單:辨識核心可輕易串連下游應用系統。
應用範圍
- 各種需要即時辨識輸入語音的應用系統,例如人機互動系統、智慧音箱等
- 錄音轉寫
- 錄音資料查詢
圖1.中文語音辨識系統展示介面。目前提供四項功能:即時辨識、音檔上傳辨識、YouTube影片連結上傳辨識、呼叫API辨識。 \
創作人
王新民、高明達、曹昱
檔案下載