跳到主要內容區塊

中央研究院智財技轉處對外服務網

智財技轉對外服務網logo 智財技轉對外服務網logo
  • 網站導覽
  • 中央研究院
  • 網站導覽
  • 中央研究院
  • 最新消息
    • 本處消息
  • 資訊公開
    • 資訊公告
    • 法規輯要
    • 技術推廣刊物
    • 統計資訊
    • 智財小常識
    • 徵才資訊
  • 創作人
    • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
    • 研發成果智財保護
    • 與院外廠商進行共同研發
    • 研發成果技術移轉
    • 已專屬授權技術清單查詢
    • 制式文件
  • 廠商
    • 技術授權與產學合作諮詢
    • 材料移轉申請需求與諮詢
    • 探索技術(多元搜尋)
    • 熱搜技術
    • 技術授權或共同研發
    • 制式契約
  • 關於本處
    • 本處處長
    • 智財處介紹及業務窗口
    • 研管會介紹
  • 事務所專區
    • 登入
  • GlobeEN
    EN
    相關技術(依語言模型分析所得之相關性)
    • 05T-1091014

      以基因體為基礎的性狀檢測基因晶片探針的設計方法與結果分析流程
    • 05T-1070829

      InfoMap知識管理及推理系統
    • 05T-1070910

      中文新聞語料庫
    • 24T-1080124

      中研院中文口語詞頻表
    • 05T-1110325

      中文語音辨識系統
    • 05T-890901

      中文句結構樹資料庫
    • 05T-1081218

      結合斷詞、詞性標記、實體辨識的中文處理套件(CkipTagger)
    • 05T-1080409

      中文專有名詞辨識系統
    • 24T-1110609

      每日腦點心
    分享至
    share to facebook share to line share to email print
    Transformer 架構下的增強型中文語言模型與任務套件(CKIP Transformers)
    技術授權與產學合作諮詢

    2022-07-03

    Transformer 架構下的增強型中文語言模型與任務套件(CKIP Transformers)
    Sinica Logo
    摘要

    在許多人工智慧或資料處理的任務中,語言的處理常常是不可或缺的步驟之一,我們以 transformer 模型為基礎,進一步訓練了多個針對繁體中文的優化模型,包含語言理解用的 CKIP Albert 語言模型和 CKIP BERT 語言模型,以及語言生成用的 CKIP GPT2 語言模型等等。這些語言模型可以根據不同的語言處理任務進行再訓練,來滿足終端的各類實際需求。在這個套件當中,除了提供上述的語言模型之外, 我們也針對最普遍的任務需求,包含斷詞、詞性標記、專有名詞辨識(高達 18 類,包含:人名、團體、設施、組織、地理、地點、商品、事件、藝術品、法律、語言、 日期、時間、比例、錢、數量、序數、數詞。)等終端任務,提供多個再訓練過後的語言理解模型。系統以 Python 寫成,效能優異,且呼叫方式簡潔,易於整合。

    線上展示綱址為:https://ckip.iis.sinica.edu.tw/service/transformers/,歡迎實際測試。
     

     

    技術優勢

    • 以 transformer 模型為基礎,進一步訓練了多個針對繁體中文的優化模型
    • 斷詞表現大幅超越結巴系統,且提供結巴系統所沒有的實體辨識
    • 詞性標記的種類豐富: 共 61 種詞性 (https://github.com/ckiplab/ckiptagger/wiki/POS-Tags)
    • 實體辨識的種類豐富: 11 類一般領域專有名詞及 7 類數量詞(https://github.com/ckiplab/ckiptagger/wiki/Entity-Types)
    • 支援使用者自訂詞典。
    • 可以針對新的任務進行再訓練
       

    圖1.效能比較

    圖1.效能比較

    本院覽號

    05T-1110222

    公告日期

    2022-07-03

    智財權狀態

    know-how

    應用範圍

    • 大數據輿情分析
    • 語言理解
    • 智慧客服
    • 聊天機器人
    • 商品情赧分析系統
       

    創作人

    馬偉雲、楊慕

    檔案下載

    PDF-ICONTransformer 架構下的增強型中文語言模型與任務套件(CKIP Transformers)
    最新消息
    • 本處消息
    資訊公開
    • 資訊公告
    • 法規輯要
    • 技術推廣刊物
    • 統計資訊
    • 智財小常識
    • 徵才資訊
    創作人
    • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
    • 研發成果智財保護
    • 與院外廠商進行共同研發
    • 研發成果技術移轉
    • 已專屬授權技術清單查詢
    • 制式文件
    廠商
    • 技術授權與產學合作諮詢
    • 材料移轉申請需求與諮詢
    • 探索技術(多元搜尋)
    • 熱搜技術
    • 技術授權或共同研發
    • 制式契約
    關於本處
    • 本處處長
    • 智財處介紹及業務窗口
    • 研管會介紹
    聯絡地址

    11529 台北市南港區研究院路二段 128 號

    電話

    +886-2-2787-2554

    電子郵件

    ip@gate.sinica.edu.tw

    • 政府網站資料開放宣告 | 隱私權及安全政策
    • 網站導覽 版號:V.3.1.34
    • © 2022 中央研究院智財技轉處 版權所有 通過AA無障礙網頁檢測