知識圖譜 - iT 邦幫忙

文章推薦指數: 80 %
投票人數:10人

當前世界範圍內已經有非常成熟且知名的高質量大規模開放知識圖譜,包括DBpedia、Yago、Wikidata、BabelNet、ConceptNet以及Microsoft Concept Graph。

其中DBpedia 是一個大 ... 2019iT邦幫忙鐵人賽 DAY 12 0 自我挑戰組 自然語言技術與AI/ML初探系列第 12篇 知識圖譜 2019鐵人賽 smichelle19 團隊InfoSecHoradrim 2018-10-2721:19:3810002瀏覽 知識圖譜(KnowledgeGraph/Vault,以下簡稱KG)本質上是語義網絡,是一種基於圖的數據結構,由節點(Point)和邊(Edge)組成。

通俗地講,知識圖譜就是把所有不同種類的信息(HeterogeneousInformation)連接在一起而得到的一個關係網絡。

知識圖譜提供了從“關係”的角度去分析問題的能力。

近年來,隨着人工智能的再次興起,知識圖譜又被廣泛的應用於聊天機器人和問答系統中,用於輔助深度理解人類的語言和支持推理,並提升人機問答的用户體驗等。

典型的如IBM的Watson,蘋果的Siri,GoogleAllo,AmazonEcho,百度度祕,公子小白等。

當前世界範圍內已經有非常成熟且知名的高質量大規模開放知識圖譜,包括DBpedia、Yago、Wikidata、BabelNet、ConceptNet以及MicrosoftConceptGraph。

其中DBpedia是一個大規模的多語言百科知識圖譜,可視為是維基百科的結構化版本。

Wikidata是一個可以自由協作編輯的多語言百科知識庫,它由維基媒體基金會發起,期望將維基百科、維基文庫、維基導遊等項目中結構化知識進行抽取、存儲、關聯。

BabelNet是目前世界範圍內最大的多語言百科同義詞典,它本身可被視為一個由概念、實體、關係構成的語義網絡(SemanticNetwork)。

中文目前可用的大規模開放知識圖譜有Zhishi.me、Zhishi.schema與XLore。

其中Zhishi.me是第一份構建中文鏈接數據的工作,與DBpedia類似,擁有約1000萬個實體與一億兩千萬個RDF三元組。

Zhishi.schema是一個大規模的中文模式(Schema)知識庫,其本質是一個語義網絡,其中包含三種概念間的關係,即equal、related與subClassOf關係。

Zhishi.schema抽取自社交站點的分類目錄(CategoryTaxonomy)及標籤雲(TagCloud),目前擁有約40萬的中文概念與150萬RDF三元組,正確率約為84%,並支持數據集的完全下載。

*知識圖譜的計算流程 知識獲取:對用户的非結構化數據提取正文。

知識融合(knowledgefusion):指的是將多個數據源抽取的知識進行融合。

知識融合的做法有:  屬性相似度計算  關鍵屬性對比(特別是數字,日期類的屬性,一般可以唯一確定)  關係連結對比(連結的關係實體名稱等是否一致)  摘要的文字相似性一般來說,摘要的文字jaccard也是一個比較方式  向量距離如後文會說的RL,如果向量空間距離接近,也可能是同一個實體 知識計算:主要是根據圖譜提供的信息得到更多隱含的知識,如通過本體或者規則推理技術可以獲取數據中存在的隱含知識。

鏈接預測:可預測實體間隱含的關係 *知識儲存和查詢 spo 是最簡單也是最靈活的一種儲存方式,其把圖譜的基本結構看做的三元組,所有的linking都通過這種kkv的形式完成。

rdf 簡單一點說,就是把spo表示成了一種資源描述符的方式,並且能方便靈活的通過網頁儲存,目前的圖儲存和查詢,大部分都是採用了這種方式。

owl 可以看做rdf的升級,在本體外封裝了一層語法,但是因為其需要更強的描述,目前大部分還是用的rdf *知識表示和推理 一階謂詞邏輯 公式化的表示了kg上的關係 表示學習(RL) 目標是能夠將KG中的entity和relation對映到一個低維的稠密embedding中,從而將知識推理轉換為該空間上的向量或矩陣的運算 *知識推理  PathRanking方法(PRA):來源於CMU對NELL的優化,其採用了圖上的randomwalk方法,結合一階謂詞邏輯,通過置信度傳播的方式,得到rank靠前的路徑,作為新的推理規則  基於RL的空間向量運算:將所有的知識都被對映到了一個向量空間,所有的知識推理可以通過向量運算完成  概率圖模型(PGM) 參考來源: 一文讀懂知識圖譜的商業應用進程及技術背景 https://hk.saowen.com/a/969a5532d1f637351fbd4171d6b7cc1f6975022232d6a47292ffa78ed6d6a2d5 【知識圖譜】介紹 https://codertw.com/%E7%A8%8B%E5%BC%8F%E8%AA%9E%E8%A8%80/632195/ 留言1 追蹤 檢舉 上一篇 XGboost 下一篇 LightGBM 系列文 自然語言技術與AI/ML初探 共30篇 目錄 RSS系列文 訂閱系列文 26人訂閱 26 Machinelearningincybersecurityfield 27 HowmachinelearningcanhelpdetectAPT 28 Fakenewsdetection 29 pythonformalwarestaticanalysis(1) 30 pythonformalwarestaticanalysis(2)-yara 完整目錄 1則留言 0 WenTingTseng iT邦新手5級‧ 2020-03-0720:34:44 請問您在文中有說spo是三元組形式是指entityrelationentity這種格式呈現的嗎 謝謝~ 回應 檢舉 登入發表回應 我要留言 立即登入留言 iT邦幫忙鐵人賽 參賽組數 1087組 團體組數 52組 累計文章數 20496篇 完賽人數 572人 鐵人賽最新文章 閒聊STM32CubeMX和STM32CubeIDE 建立第一個單元測試(golang)-1(Day20) Day38-在AWSLambda中使用YOLO推估(Inference) Day37-在AWSLambda建立OpenCVLayer Day36-使用Container建立AmazonSageMaker端點 Day35-AmazonSageMaker簡介 今天來瞄一眼龍與雀的科技:知覺共享技術Body-sharing 更新網格交易機器人 Day34-實作S3驅動Lambda函數進行YOLO物件辨識 建立第一個RESTfulapiserver(設定環境變數篇)-7(Day19) 前往鐵人賽 技術推廣專區 [Day2]抓取每日收盤價 [Day1]基本工具安裝 利用python取得永豐銀行API的Nonce 永豐金融API測試員 [Day03]tinyML開發板介紹 [Day01]在享受tinyML這道美食之前 [Day3]使用ta-lib製作指標 計算API所需要的參數:HashID [Day4]函數打包與買進持有報酬率試算 計算API所需要的參數:IV 前往鐵人賽 熱門問題 電信商說我透過Steam或是PS4下載遊戲是異常封包而斷我網路,怎麼辦? 有關新手SQL問題一問 有人知道怎麼解決gmail一直擋信的問題? Win10的系統還原 請推薦台中IT委外廠商 線上版文書處理除了Google雲端,365,還有其他選擇嗎? Server掛掉,Acronis的備份檔無法復原 傳說對決修改 YOLOV4環境建置 MSSQLUNION後進階排序問題請教 IT邦幫忙 站方公告 2021iThome鐵人賽精彩文章超過2萬篇,預計12月揭曉本屆獲勝鐵人 熱門tag 看更多 13th鐵人賽 12th鐵人賽 11th鐵人賽 鐵人賽 2019鐵人賽 2018鐵人賽 javascript 2017鐵人賽 windows php python windowsserver linux c# 程式設計 資訊安全 css vue.js sql 分享 熱門回答 有關新手SQL問題一問 TIPTOPmail 電信商說我透過Steam或是PS4下載遊戲是異常封包而斷我網路,怎麼辦? MSSQLUNION後進階排序問題請教 線上版文書處理除了Google雲端,365,還有其他選擇嗎? 如果想把現有NAS掛給ESXI6當VM備份儲存區.請問要如何做 新手程式提問 (已解決)Vue.jsv-for顯示問題 switch問題 C#為什麼預覽列印顯示地跟實際列印的不一樣?第一頁多了個有頁碼的空白頁 熱門文章 建立第一個RESTfulapiserver(設定環境變數篇)-7(Day19) 原來Arduino開發板的腳位與程式內數字的對應會隨著開發商不同而改變? Day48.下載個範例iosapp來試著build Day34-實作S3驅動Lambda函數進行YOLO物件辨識 【換機必學】將資料從Android轉移到iOS的兩種方法 EP32:TopStoreAppwith.NETMulti-platformAppUI(MAUI) 更新網格交易機器人 今天來瞄一眼龍與雀的科技:知覺共享技術Body-sharing 免費錄影!原來Windows10有内建的螢幕錄影工具 彰化--軟體開發C/C++JAVA多平台軟體設計開發及PHP網頁工程師 一週點數排行 更多點數排行 海綿寶寶(antijava) raytracy(raytracy) ccenjor(ccenjor) rogeryao(rogeryao) ㊣浩瀚星空㊣(yoching) 純真的人(jer5173) Samuel(kuanyu) huahualiu(ffang55tw) juck30808(juck30808) 淺水員(ren1244) × At 輸入對方的帳號或暱稱 Loading 找不到結果。

標記 {{result.label}} {{result.account}} 關閉



請為這篇文章評分?