知識圖譜 - iT 邦幫忙
文章推薦指數: 80 %
當前世界範圍內已經有非常成熟且知名的高質量大規模開放知識圖譜,包括DBpedia、Yago、Wikidata、BabelNet、ConceptNet以及Microsoft Concept Graph。
其中DBpedia 是一個大 ...
2019iT邦幫忙鐵人賽
DAY
12
0
自我挑戰組
自然語言技術與AI/ML初探系列第
12篇
知識圖譜
2019鐵人賽
smichelle19
團隊InfoSecHoradrim
2018-10-2721:19:3810002瀏覽
知識圖譜(KnowledgeGraph/Vault,以下簡稱KG)本質上是語義網絡,是一種基於圖的數據結構,由節點(Point)和邊(Edge)組成。
通俗地講,知識圖譜就是把所有不同種類的信息(HeterogeneousInformation)連接在一起而得到的一個關係網絡。
知識圖譜提供了從“關係”的角度去分析問題的能力。
近年來,隨着人工智能的再次興起,知識圖譜又被廣泛的應用於聊天機器人和問答系統中,用於輔助深度理解人類的語言和支持推理,並提升人機問答的用户體驗等。
典型的如IBM的Watson,蘋果的Siri,GoogleAllo,AmazonEcho,百度度祕,公子小白等。
當前世界範圍內已經有非常成熟且知名的高質量大規模開放知識圖譜,包括DBpedia、Yago、Wikidata、BabelNet、ConceptNet以及MicrosoftConceptGraph。
其中DBpedia是一個大規模的多語言百科知識圖譜,可視為是維基百科的結構化版本。
Wikidata是一個可以自由協作編輯的多語言百科知識庫,它由維基媒體基金會發起,期望將維基百科、維基文庫、維基導遊等項目中結構化知識進行抽取、存儲、關聯。
BabelNet是目前世界範圍內最大的多語言百科同義詞典,它本身可被視為一個由概念、實體、關係構成的語義網絡(SemanticNetwork)。
中文目前可用的大規模開放知識圖譜有Zhishi.me、Zhishi.schema與XLore。
其中Zhishi.me是第一份構建中文鏈接數據的工作,與DBpedia類似,擁有約1000萬個實體與一億兩千萬個RDF三元組。
Zhishi.schema是一個大規模的中文模式(Schema)知識庫,其本質是一個語義網絡,其中包含三種概念間的關係,即equal、related與subClassOf關係。
Zhishi.schema抽取自社交站點的分類目錄(CategoryTaxonomy)及標籤雲(TagCloud),目前擁有約40萬的中文概念與150萬RDF三元組,正確率約為84%,並支持數據集的完全下載。
*知識圖譜的計算流程
知識獲取:對用户的非結構化數據提取正文。
知識融合(knowledgefusion):指的是將多個數據源抽取的知識進行融合。
知識融合的做法有:
屬性相似度計算
關鍵屬性對比(特別是數字,日期類的屬性,一般可以唯一確定)
關係連結對比(連結的關係實體名稱等是否一致)
摘要的文字相似性一般來說,摘要的文字jaccard也是一個比較方式
向量距離如後文會說的RL,如果向量空間距離接近,也可能是同一個實體
知識計算:主要是根據圖譜提供的信息得到更多隱含的知識,如通過本體或者規則推理技術可以獲取數據中存在的隱含知識。
鏈接預測:可預測實體間隱含的關係
*知識儲存和查詢
spo
是最簡單也是最靈活的一種儲存方式,其把圖譜的基本結構看做的三元組,所有的linking都通過這種kkv的形式完成。
rdf
簡單一點說,就是把spo表示成了一種資源描述符的方式,並且能方便靈活的通過網頁儲存,目前的圖儲存和查詢,大部分都是採用了這種方式。
owl
可以看做rdf的升級,在本體外封裝了一層語法,但是因為其需要更強的描述,目前大部分還是用的rdf
*知識表示和推理
一階謂詞邏輯
公式化的表示了kg上的關係
表示學習(RL)
目標是能夠將KG中的entity和relation對映到一個低維的稠密embedding中,從而將知識推理轉換為該空間上的向量或矩陣的運算
*知識推理
PathRanking方法(PRA):來源於CMU對NELL的優化,其採用了圖上的randomwalk方法,結合一階謂詞邏輯,通過置信度傳播的方式,得到rank靠前的路徑,作為新的推理規則
基於RL的空間向量運算:將所有的知識都被對映到了一個向量空間,所有的知識推理可以通過向量運算完成
概率圖模型(PGM)
參考來源:
一文讀懂知識圖譜的商業應用進程及技術背景
https://hk.saowen.com/a/969a5532d1f637351fbd4171d6b7cc1f6975022232d6a47292ffa78ed6d6a2d5
【知識圖譜】介紹
https://codertw.com/%E7%A8%8B%E5%BC%8F%E8%AA%9E%E8%A8%80/632195/
留言1
追蹤
檢舉
上一篇
XGboost
下一篇
LightGBM
系列文
自然語言技術與AI/ML初探
共30篇
目錄
RSS系列文
訂閱系列文
26人訂閱
26
Machinelearningincybersecurityfield
27
HowmachinelearningcanhelpdetectAPT
28
Fakenewsdetection
29
pythonformalwarestaticanalysis(1)
30
pythonformalwarestaticanalysis(2)-yara
完整目錄
1則留言
0
WenTingTseng
iT邦新手5級‧
2020-03-0720:34:44
請問您在文中有說spo是三元組形式是指entityrelationentity這種格式呈現的嗎
謝謝~
回應
檢舉
登入發表回應
我要留言
立即登入留言
iT邦幫忙鐵人賽
參賽組數
1087組
團體組數
52組
累計文章數
20496篇
完賽人數
572人
鐵人賽最新文章
閒聊STM32CubeMX和STM32CubeIDE
建立第一個單元測試(golang)-1(Day20)
Day38-在AWSLambda中使用YOLO推估(Inference)
Day37-在AWSLambda建立OpenCVLayer
Day36-使用Container建立AmazonSageMaker端點
Day35-AmazonSageMaker簡介
今天來瞄一眼龍與雀的科技:知覺共享技術Body-sharing
更新網格交易機器人
Day34-實作S3驅動Lambda函數進行YOLO物件辨識
建立第一個RESTfulapiserver(設定環境變數篇)-7(Day19)
前往鐵人賽
技術推廣專區
[Day2]抓取每日收盤價
[Day1]基本工具安裝
利用python取得永豐銀行API的Nonce
永豐金融API測試員
[Day03]tinyML開發板介紹
[Day01]在享受tinyML這道美食之前
[Day3]使用ta-lib製作指標
計算API所需要的參數:HashID
[Day4]函數打包與買進持有報酬率試算
計算API所需要的參數:IV
前往鐵人賽
熱門問題
電信商說我透過Steam或是PS4下載遊戲是異常封包而斷我網路,怎麼辦?
有關新手SQL問題一問
有人知道怎麼解決gmail一直擋信的問題?
Win10的系統還原
請推薦台中IT委外廠商
線上版文書處理除了Google雲端,365,還有其他選擇嗎?
Server掛掉,Acronis的備份檔無法復原
傳說對決修改
YOLOV4環境建置
MSSQLUNION後進階排序問題請教
IT邦幫忙
站方公告
2021iThome鐵人賽精彩文章超過2萬篇,預計12月揭曉本屆獲勝鐵人
熱門tag
看更多
13th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
2018鐵人賽
javascript
2017鐵人賽
windows
php
python
windowsserver
linux
c#
程式設計
資訊安全
css
vue.js
sql
分享
熱門回答
有關新手SQL問題一問
TIPTOPmail
電信商說我透過Steam或是PS4下載遊戲是異常封包而斷我網路,怎麼辦?
MSSQLUNION後進階排序問題請教
線上版文書處理除了Google雲端,365,還有其他選擇嗎?
如果想把現有NAS掛給ESXI6當VM備份儲存區.請問要如何做
新手程式提問
(已解決)Vue.jsv-for顯示問題
switch問題
C#為什麼預覽列印顯示地跟實際列印的不一樣?第一頁多了個有頁碼的空白頁
熱門文章
建立第一個RESTfulapiserver(設定環境變數篇)-7(Day19)
原來Arduino開發板的腳位與程式內數字的對應會隨著開發商不同而改變?
Day48.下載個範例iosapp來試著build
Day34-實作S3驅動Lambda函數進行YOLO物件辨識
【換機必學】將資料從Android轉移到iOS的兩種方法
EP32:TopStoreAppwith.NETMulti-platformAppUI(MAUI)
更新網格交易機器人
今天來瞄一眼龍與雀的科技:知覺共享技術Body-sharing
免費錄影!原來Windows10有内建的螢幕錄影工具
彰化--軟體開發C/C++JAVA多平台軟體設計開發及PHP網頁工程師
一週點數排行
更多點數排行
海綿寶寶(antijava)
raytracy(raytracy)
ccenjor(ccenjor)
rogeryao(rogeryao)
㊣浩瀚星空㊣(yoching)
純真的人(jer5173)
Samuel(kuanyu)
huahualiu(ffang55tw)
juck30808(juck30808)
淺水員(ren1244)
×
At
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{result.label}}
{{result.account}}
關閉
延伸文章資訊
- 1万字长文,解读知识图谱在教育智能化中的应用 - 知乎专栏
当前的教学难以满足学生个性化学习的需求。当前大部分学校的教育还都是大班制,大锅饭式的教育。但是每个学生的接受能力和对不同的知识点 ...
- 2快速了解什麼是知識圖譜, 如何以Neo4j圖形資料庫實作知識 ...
Understand What is Knowledge Graph and how to implement it by Neo4j. 什麼是知識圖譜. 簡單的說就是透過給定的關係, 把不同種...
- 3知識圖譜與深度學習 - 天瓏網路書店
書名:知識圖譜與深度學習,ISBN:7302538522,作者:劉知遠韓旭孫茂松,出版社:清華大學, ... 主要兼職包括教育部教學信息化與教學方法創新指導委員會副主任委員,
- 4知識圖譜學習總結(持續更新)
知識圖譜 (Knowledge Graph)以結構化的形式描述客觀世界中概念、實體及其 ... 知識圖譜與大數據和深度學習一起,成爲推動網際網路和人工智慧發展的 ...
- 5知識圖譜 - iT 邦幫忙
當前世界範圍內已經有非常成熟且知名的高質量大規模開放知識圖譜,包括DBpedia、Yago、Wikidata、BabelNet、ConceptNet以及Microsoft Concept Gra...