跳到主要內容區塊

中央研究院智財技轉處對外服務網

智財技轉對外服務網logo 智財技轉對外服務網logo
  • 網站導覽
  • 中央研究院
  • 網站導覽
  • 中央研究院
  • 最新消息
    • 本處消息
  • 資訊公開
    • 資訊公告
    • 法規輯要
    • 技術推廣刊物
    • 統計資訊
    • 智財小常識
    • 徵才資訊
  • 創作人
    • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
    • 研發成果智財保護
    • 與院外廠商進行共同研發
    • 研發成果技術移轉
    • 已專屬授權技術清單查詢
    • 制式文件
  • 廠商
    • 技術授權與產學合作諮詢
    • 材料移轉申請需求與諮詢
    • 探索技術(多元搜尋)
    • 熱搜技術
    • 技術授權或共同研發
    • 制式契約
  • 關於本處
    • 本處處長
    • 智財處介紹及業務窗口
    • 研管會介紹
  • 事務所專區
    • 登入
  • GlobeEN
    EN
    相關技術(依語言模型分析所得之相關性)
    • 05T-1070910

      中文新聞語料庫
    • 05T-891002

      具有新詞辨識能力的中文斷詞系統
    • 24T-1110609

      每日腦點心
    • 05A-1100218

      MAMBA (以MITRE ATT&CK 框架為基礎的惡意行為分析系統)
    • 05T-1110222

      Transformer 架構下的增強型中文語言模型與任務套件(CKIP Transformers)
    • 05T-1080409

      中文專有名詞辨識系統
    分享至
    share to facebook share to line share to email print
    結合斷詞、詞性標記、實體辨識的中文處理套件(CkipTagger)
    技術授權與產學合作諮詢

    2020-07-02

    結合斷詞、詞性標記、實體辨識的中文處理套件(CkipTagger)
    Sinica Logo
    摘要

    在許多人工智慧或資料處理的任務中,語言的處理常常是不可或缺的步驟之一,根據我們自行設計的深度學習算法,我們完成了這個結合斷詞、詞性標記、實體辨識的一站式中文處理套件,系統以python寫成,效能優異,且呼叫方式簡潔,易於整合,系統取名為CkipTagger,除了斷詞與詞性標記外,專有名詞辨識,或稱實體辨識(Named Entity Recognition, NER)是非常實用的功能,其目標為在文字資料當中,能夠辨識出感興趣的專有名詞(包含原本資料庫不存在的新專有名詞),並自動標記正確的分類,如人名、地名、組織名等等,是人工智慧當中理解語言的重要步驟。目前我們所開發的中文專有名詞辨識系統能辨識11 類一般領域專有名詞及 7 類數量詞,包含:人名、團體、設施、組織、地理、地點、商品、事件、藝術品、法律、語言、日期、時間、比例、錢、數量、序數、數詞。

    線上展示網址為:https://ckip.iis.sinica.edu.tw/service/corenlp/,歡迎實際測試。

    技術優勢

    1. 斷詞表現大幅超越結巴系統,且提供結巴系統所沒有的實體辨識。
    2. 詞性標記的種類豐富: 共61種詞性 (https://github.com/ckiplab/ckiptagger/wiki/POS-Tags)
    3. 實體辨識的種類豐富: 11 類一般領域專有名詞及 7 類數量詞 (https://github.com/ckiplab/ckiptagger/wiki/Entity-Types)
    4. 支援使用者自訂詞典。
    5. 相關技術發表在著名的人工智慧國際會議 – AAAI 2020 (https://arxiv.org/abs/1908.11046)

    圖1.CkipTagger與結巴系統的效能比較

    圖1.CkipTagger與結巴系統的效能比較

    本院覽號

    05T-1081218

    公告日期

    2020-07-02

    智財權狀態

    know-how

    應用範圍

    1. 大數據輿情分析
    2. 語言理解
    3. 智慧客服
    4. 聊天機器人
    5. 商品情報分析系統

    創作人

    馬偉雲、李朋軒

    圖2.CkipTagger的使用範例

    圖2.CkipTagger的使用範例

    檔案下載

    PDF-ICON結合斷詞、詞性標記、實體辨識的中文處理套件(CkipTagger)
    最新消息
    • 本處消息
    資訊公開
    • 資訊公告
    • 法規輯要
    • 技術推廣刊物
    • 統計資訊
    • 智財小常識
    • 徵才資訊
    創作人
    • 智財技轉業務申辦暨查詢(僅限本院網域或VPN連線使用)
    • 研發成果智財保護
    • 與院外廠商進行共同研發
    • 研發成果技術移轉
    • 已專屬授權技術清單查詢
    • 制式文件
    廠商
    • 技術授權與產學合作諮詢
    • 材料移轉申請需求與諮詢
    • 探索技術(多元搜尋)
    • 熱搜技術
    • 技術授權或共同研發
    • 制式契約
    關於本處
    • 本處處長
    • 智財處介紹及業務窗口
    • 研管會介紹
    聯絡地址

    11529 台北市南港區研究院路二段 128 號

    電話

    +886-2-2787-2554

    電子郵件

    ip@gate.sinica.edu.tw

    • 政府網站資料開放宣告 | 隱私權及安全政策
    • 網站導覽 版號:V.3.1.34
    • © 2022 中央研究院智財技轉處 版權所有 通過AA無障礙網頁檢測