跳到主要內容區塊

中央研究院智財技轉處對外服務網

智財技轉對外服務網logo 智財技轉對外服務網logo
  • :::
  • 網站導覽
  • 中央研究院
  • English
  • 網站導覽
  • 中央研究院
  • 最新消息
    • 本處消息
  • 資訊公開
    • 資訊公告
    • 法規輯要
    • 技術推廣刊物
    • 統計資訊
    • 智財小常識
    • 徵才資訊
  • 創作人
    • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
    • 研發成果智財保護
    • 與院外廠商進行共同研發
    • 研發成果技術移轉
    • 已專屬授權技術清單查詢
    • 制式文件
  • 廠商
    • 廠商需求與諮詢
    • 材料移轉申請
    • 探索技術(多元搜尋)
    • 熱搜技術
    • 技術授權或共同研發
    • 制式契約
  • 關於本處
    • 本處處長
    • 智財處介紹及業務窗口
    • 研管會介紹
  • 事務所專區
    • 登入
EN
相關技術(依語言模型分析所得之相關性)
  • 05A-930712

    供多人共同操作單一電腦螢幕之主動是操作控制權轉移裝置及方法
  • 24T-1080124

    中研院中文口語詞頻表
  • 05A-910512

    結合即時視訊與螢幕展示的同步遠距教學系統
  • 05T-1100924

    使用帶中文字幕的台語劇自動擴增台語語音辨識之訓練資料的技術
  • 05T-1110222

    Transformer 架構下的增強型中文語言模型與任務套件(CKIP Transformers)
  • 24T-1110609

    每日腦點心
  • 05T-1070906

    iCorpus: 台華語新聞語料庫
  • 24T-1080125

    中研院中文口語音節結構組合頻率表
  • 05T-1071206

    互動式對話編碼模型
分享至
share to facebook share to line share to email print
中文語音辨識系統

2024-09-04

中文語音辨識系統
本院覽號

05T-1110325

公告日期

2024-09-04

智財權狀態

know-how

摘要

本中文語音辨識系統採用Kaldi工具包開發,核心模組包括中文發音字典、語音模型、語言模型及辨識系統架構。系統包括即時語音辨識核心及離線語音辨識核心,前者可以應用在各種需要即時辨識輸入語音的應用系統,例如人機互動系統、智慧音箱等,後者可以應用於將錄音檔轉逐字稿、幫影片上字幕等。
 

技術優勢

  • 系統成熟:經過本團隊多年的努力,中文語音辨識技術已經相當成熟,所開發的中文語音辨識系統功能亦相當完整。
  • 操作簡單:辨識核心可輕易串連下游應用系統。
     

應用範圍

  • 各種需要即時辨識輸入語音的應用系統,例如人機互動系統、智慧音箱等
  • 錄音轉寫
  • 錄音資料查詢
     

圖1.中文語音辨識系統展示介面。目前提供四項功能:即時辨識、音檔上傳辨識、YouTube影片連結上傳辨識、呼叫API辨識。 \

圖1.中文語音辨識系統展示介面。目前提供四項功能:即時辨識、音檔上傳辨識、YouTube影片連結上傳辨識、呼叫API辨識。 \

創作人

王新民、高明達、曹昱

Sinica Logo

檔案下載

PDF-ICON中文語音辨識系統
::: 中央研究院 logo
  • 地址/Address

    11529 台北市南港區研究院路二段 128 號

  • 電話/Phone

    +886-2-2787-2554

  • Email

    ip@gate.sinica.edu.tw

最新消息
  • 本處消息
資訊公開
  • 資訊公告
  • 法規輯要
  • 技術推廣刊物
  • 統計資訊
  • 智財小常識
  • 徵才資訊
創作人
  • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
  • 研發成果智財保護
  • 與院外廠商進行共同研發
  • 研發成果技術移轉
  • 已專屬授權技術清單查詢
  • 制式文件
廠商
  • 廠商需求與諮詢
  • 材料移轉申請
  • 探索技術(多元搜尋)
  • 熱搜技術
  • 技術授權或共同研發
  • 制式契約
關於本處
  • 本處處長
  • 智財處介紹及業務窗口
  • 研管會介紹
  • © 2022 中央研究院智財技轉處 版權所有 通過AA無障礙網頁檢測