跳到主要內容區塊

中央研究院智財技轉處對外服務網

智財技轉對外服務網logo 智財技轉對外服務網logo
  • :::
  • 網站導覽
  • 中央研究院
  • English
  • 網站導覽
  • 中央研究院
  • 最新消息
    • 本處消息
  • 資訊公開
    • 資訊公告
    • 法規輯要
    • 技術推廣刊物
    • 統計資訊
    • 智財小常識
    • 徵才資訊
  • 創作人
    • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
    • 研發成果智財保護
    • 與院外廠商進行共同研發
    • 研發成果技術移轉
    • 已專屬授權技術清單查詢
    • 制式文件
  • 廠商
    • 廠商需求與諮詢
    • 材料移轉申請
    • 探索技術(多元搜尋)
    • 熱搜技術
    • 技術授權或共同研發
    • 制式契約
  • 關於本處
    • 本處處長
    • 智財處介紹及業務窗口
    • 研管會介紹
  • 事務所專區
    • 登入
EN
相關技術(依語言模型分析所得之相關性)
分享至
share to facebook share to line share to email print
自動化、細顆粒度音樂曲風辨識

自動化、細顆粒度音樂曲風辨識
Sinica Logo
摘要

曲風是最常被用來描述音樂的方式之一,許多MIR的工作皆是以曲風分類為目標之一。然而曲風的定義並不容易,可以定義的很細、也可以很大略。本技術中,我們採用了由西方主流音樂服務公司Pandora (http://www.pandora.com) 所制定的曲風類型(genre/style),將曲風分成140類之多,如表一所示,包含諸如“bebop,” “deathcore metal,” “flamenco,” “live,” “oldies,” “opera,” 和 “salsa” 等等的曲風或是音樂類型。我們使用了由美國加州大學聖地牙哥分校(UCSD)電腦聽覺實驗室蒐集的CAL10k資料庫做為我們的訓練資料 。該資料庫包含了77,99首歌曲,每種類別約有876首到21首歌曲(平均值為93首),每首歌曲我們從7digital(http://www.7digital.com/)取得了30秒的預覽(preview)並使用MIR Toolbox [3] 抽取177維的音樂特徵,包含音高、音色、能量、節奏、和聲等等的資訊。

我們根據UCSD對於訓練、測試集的定義,進行內部的準確率評估,訓練歌曲約有4,463首、測試歌曲為1,510首,我們的模型是用LIBSVM的RBF kernel,以area under the receiver operating characteristic curve(AUC)和mean average precision(MAP)評估準確率時,準確率分別達到80.22%和16.47%,與當前文獻中所達到的最佳準確率相當。

技術優勢

本技術係一自動分析數位音樂信號之內容,從中擷取相關之音樂特徵,並判別其音樂曲風之技術。其技術特點在於能夠分辨高達140種細緻的曲風(genre)或是亞曲風(sub-genre),且分類準確率能達到AUC (Area under Curve) 80%以上。

本院覽號

32T-1020819

公告日期

智財權狀態

know-how

應用範圍

影音分析軟體、系統

卡拉OK系統

創作人

楊奕軒

檔案下載

PDF-ICON自動化、細顆粒度音樂曲風辨識
::: 中央研究院 logo
  • 地址/Address

    11529 台北市南港區研究院路二段 128 號

  • 電話/Phone

    +886-2-2787-2554

  • Email

    ip@gate.sinica.edu.tw

最新消息
  • 本處消息
資訊公開
  • 資訊公告
  • 法規輯要
  • 技術推廣刊物
  • 統計資訊
  • 智財小常識
  • 徵才資訊
創作人
  • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
  • 研發成果智財保護
  • 與院外廠商進行共同研發
  • 研發成果技術移轉
  • 已專屬授權技術清單查詢
  • 制式文件
廠商
  • 廠商需求與諮詢
  • 材料移轉申請
  • 探索技術(多元搜尋)
  • 熱搜技術
  • 技術授權或共同研發
  • 制式契約
關於本處
  • 本處處長
  • 智財處介紹及業務窗口
  • 研管會介紹
  • © 2022 中央研究院智財技轉處 版權所有 通過AA無障礙網頁檢測