知識圖譜技術(shù)作為一門新興的技術(shù),是人工智能技術(shù)的重要組成部分,其建立的具有語義處理能力與開放互聯(lián)能力的知識庫,可在智能搜索、智能問答、個性化推薦等智能信息服務(wù)中產(chǎn)生應(yīng)用價值。就覆蓋范圍而言,知識圖譜也可分為通用知識圖譜和行業(yè)知識圖譜。通用知識圖譜注重廣度,強調(diào)融合更多的實體,較行業(yè)知識圖譜而言,其準(zhǔn)確度不夠高,并且受概念范圍的影響,很難借助本體 庫對公理、規(guī)則以及約束條件的支持能力規(guī)范其實體、屬性、實體間的關(guān)系等。通用知識圖譜主要應(yīng)用于智能搜索等領(lǐng)域。行業(yè)知識圖譜通常需要依靠特定行業(yè)的數(shù)據(jù)來構(gòu)建,具有特定的行業(yè)意義。行業(yè)知識圖譜中,實體的屬性與數(shù)據(jù)模式往往比較豐富,需要考慮到不同的業(yè)務(wù)場景與使用人員。我國對于中文知識圖譜的研究已經(jīng)起步,并取 得了許多有價值的研究成果。
知識圖譜在于對各對象實體關(guān)系、屬性的鏈接,在互聯(lián)網(wǎng)時代,幾乎任何實體都能通過一系列的關(guān)系屬性去連接到一起,那么我們就能通過知識圖譜的搭建,去尋找之間的關(guān)系,進(jìn)行一系列的推理,去預(yù)測某些知識。因此,在現(xiàn)代社會中, 知識圖譜在許多領(lǐng)域都能很好地發(fā)揮作用,近年來吸引了大量的研究。例如北京理工大學(xué)大數(shù)據(jù)實驗室張華平教授研發(fā)的KGB知識圖譜引擎,采用語義智能分析技術(shù)從結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)中抽取各類知識,并實現(xiàn)知識關(guān)聯(lián),推理并實現(xiàn)核查檢驗。
教育領(lǐng)域
在教育行業(yè)中,知識圖譜可以通過實體間的關(guān)系,來對學(xué)習(xí)路徑做一個很好的規(guī)劃。我們經(jīng)常談?wù)搨€性化教育、因材施教的理念。其核心在于理解學(xué)生當(dāng)前的知識體系,而且這種知識體系依賴于我們所獲取到的數(shù)據(jù)比如交互數(shù)據(jù)、評測數(shù)據(jù)、互動數(shù)據(jù)等等。為了分析學(xué)習(xí)路徑以及知識結(jié)構(gòu),我們則需要針對于一個領(lǐng)域的概念知識圖譜,簡單來講就是概念拓?fù)浣Y(jié)構(gòu)。比如為了學(xué)習(xí)邏輯回歸則需要先理解線性回歸;為了學(xué)習(xí)CNN,得對神經(jīng)網(wǎng)絡(luò)有所理解等等。所有對學(xué)生的評測、互動分析都離不開概念圖譜這個底層的數(shù)據(jù)。
證券領(lǐng)域
在證券領(lǐng)域,我們經(jīng)常會關(guān)心比如“一個事件發(fā)生了,對哪些公司產(chǎn)生什么樣的影響?” 比如有一個負(fù)面消息是關(guān)于公司1的高管,而且我們知道公司1和公司2有種很密切的合作關(guān)系,公司2有個主營產(chǎn)品是由公司3提供的原料基礎(chǔ)上做出來的。其實有了這樣的一個知識圖譜,我們很容易回答哪些公司有可能會被這次的負(fù)面事件所影響。當(dāng)然,僅僅是“有可能”,具體會不會有強相關(guān)性必須由數(shù)據(jù)來驗證。所以在這里,知識圖譜的好處就是把我們所需要關(guān)注的范圍很快給我們?nèi)Χ?。接下來的問題會更復(fù)雜一些,比如既然我們知道公司3有可能被這次事件所影響,那具體影響程度有多大? 對于這個問題,光靠知識圖譜是很難回答的,必須要有一個影響模型、以及需要一些歷史數(shù)據(jù)才能在知識圖譜中做進(jìn)一步推理以及計算。
領(lǐng)域知識圖譜目前在很多行業(yè)中已經(jīng)發(fā)揮越來越重要的作用,技術(shù)上的挑戰(zhàn)也有不斷的進(jìn)展,未來還會有更多的領(lǐng)域知識圖譜落地,幫助推動行業(yè)應(yīng)用的智能化。
更多內(nèi)容可以搜索靈玖軟件-KGB知識圖譜引擎
KGB知識圖譜引擎(Knowledge Graph Builder)是基于自然語言理解、漢語詞法分析,采用KGB語法從結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化文檔中抽取各類知識,大數(shù)據(jù)語義智能分析與知識推理,深度挖掘知識關(guān)聯(lián),實時高效構(gòu)建知識圖譜。
KGB知識圖譜引擎核心技術(shù)與特色包括KGB知識抽取、語義智能分析、語義精準(zhǔn)搜索等技術(shù),基于漢語詞法分析的基礎(chǔ)上,采用KGB語法實現(xiàn)了實時高效的知識生成,可以從非結(jié)構(gòu)化文本中抽取各類知識,并實現(xiàn)了從表格中抽取指定的內(nèi)容等。