跳到主要內容區塊

中央研究院智財技轉處對外服務網

智財技轉對外服務網logo 智財技轉對外服務網logo
  • :::
  • 網站導覽
  • 中央研究院
  • English
  • 網站導覽
  • 中央研究院
  • 最新消息
    • 本處消息
  • 資訊公開
    • 資訊公告
    • 法規輯要
    • 技術推廣刊物
    • 統計資訊
    • 智財小常識
    • 徵才資訊
  • 創作人
    • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
    • 研發成果智財保護
    • 與院外廠商進行共同研發
    • 研發成果技術移轉
    • 已專屬授權技術清單查詢
    • 制式文件
  • 廠商
    • 廠商需求與諮詢
    • 材料移轉申請
    • 探索技術(多元搜尋)
    • 熱搜技術
    • 技術授權或共同研發
    • 制式契約
  • 關於本處
    • 本處處長
    • 智財處介紹及業務窗口
    • 研管會介紹
  • 事務所專區
    • 登入
EN
相關技術(依語言模型分析所得之相關性)
  • 28A-1020829

    未知序列之雙股線性核酸之全長增幅方法
  • 05T-1071206

    互動式對話編碼模型
  • 05A-1000519

    應用於電子聽診器的疾病診斷方法
  • 25T-1100602

    世界150餘國物權法的比較、經濟、實證分析
  • 12T-1120510

    智慧型臨床試驗數據收集與管理系統
  • 06A-1100423

    由多重組學,多疾病數據推論分子變異間階層式連結的邏輯步驟
  • 06T-1091224

    以丹齊格選擇器為基礎的兩步驟遞迴式超飽和高維實驗分析(DS2SHEAR)篩選器
  • 05A-1041113

    基於建築物資訊的室內定位系統
  • 28A-1060222

    儀器訊號峰值對齊整合法
分享至
share to facebook share to line share to email print
基於變分自編碼器的語音轉換技術

2021-01-10

基於變分自編碼器的語音轉換技術
本院覽號

05T-1100925

公告日期

2021-01-10

智財權狀態

know-how

摘要

語音轉換旨在不改變語言內容的情況下將語音從來源型式轉換為目標型式。最典型的任務是說話人語音轉換。大多數傳統方法需要平行訓練數據,即來源和目標說話者唸相同的轉錄本進行訓練。由於此類數據難以收集,非平行訓練長期以來一直是語音轉換的最終目標之一。透過變分自編碼器的自我督導訓練,可以實現非平行訓練。整合生成式對抗型網路和跨域特徵可以進一步提升輸出音質。

技術優勢

  • 使用變分自編碼器可利用大量語音對模型進行預訓練
  • 整合生成式對抗型網路可以提升輸出音質
  • 整合跨域特徵可以提升輸出音質

應用範圍

  • 一般性的人聲轉換
  • 受損語音轉換成正常語音
  • 角色扮演遊戲中的人聲轉換

圖1.基於變分自編碼器的語音轉換模型,x 為輸入特徵,X̂ 為輸出特徵, z 是潛在代碼,y 是說話者代碼。

圖1.基於變分自編碼器的語音轉換模型,x 為輸入特徵,X̂ 為輸出特徵, z 是潛在代碼,y 是說話者代碼。

創作人

王新民、曹昱

Sinica Logo

檔案下載

PDF-ICON基於變分自編碼器的語音轉換技術
::: 中央研究院 logo
  • 地址/Address

    11529 台北市南港區研究院路二段 128 號

  • 電話/Phone

    +886-2-2787-2554

  • Email

    ip@gate.sinica.edu.tw

最新消息
  • 本處消息
資訊公開
  • 資訊公告
  • 法規輯要
  • 技術推廣刊物
  • 統計資訊
  • 智財小常識
  • 徵才資訊
創作人
  • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
  • 研發成果智財保護
  • 與院外廠商進行共同研發
  • 研發成果技術移轉
  • 已專屬授權技術清單查詢
  • 制式文件
廠商
  • 廠商需求與諮詢
  • 材料移轉申請
  • 探索技術(多元搜尋)
  • 熱搜技術
  • 技術授權或共同研發
  • 制式契約
關於本處
  • 本處處長
  • 智財處介紹及業務窗口
  • 研管會介紹
  • © 2022 中央研究院智財技轉處 版權所有 通過AA無障礙網頁檢測