隨著網(wǎng)絡(luò)信息化時(shí)代的日益普遍,移動(dòng)互聯(lián)、社交網(wǎng)絡(luò)、電子商務(wù)大大拓展了互聯(lián)網(wǎng)的疆界和應(yīng)用領(lǐng)域,我們正處在一個(gè)數(shù)據(jù)爆炸性增長(zhǎng)的“大數(shù)據(jù)”時(shí)代,大數(shù)據(jù)時(shí)代的到來(lái)也影響著各行業(yè)高層領(lǐng)導(dǎo)的決策,使得決策結(jié)果逐漸趨于數(shù)據(jù)和分析而做出。
在大數(shù)據(jù)時(shí)代里,大數(shù)據(jù)技術(shù)正推動(dòng)著教育領(lǐng)域發(fā)生更深層次的創(chuàng)新與變革,大數(shù)據(jù)是需要在新處理模式上才具有更強(qiáng)決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。在大數(shù)據(jù)理念面前,所有傳統(tǒng)教育數(shù)據(jù)的實(shí)證研究將被打破,過(guò)去無(wú)法收集與分析的數(shù)據(jù)都被新的技術(shù)手段賦予了新的能力、新的度量和新的思維方式,大數(shù)據(jù)的技術(shù)優(yōu)勢(shì)必將在教育領(lǐng)域?qū)崿F(xiàn)全新的、更多樣化的、更具影響力的變革。
當(dāng)前,教育信息化的發(fā)展正在向著深度和廣度延伸。隨著教育信息化的發(fā)展,教育教學(xué)和管理正在積累海量的數(shù)據(jù)。這些教育的“大數(shù)據(jù)”有著豐富的內(nèi)涵和極高的價(jià)值。教育大數(shù)據(jù)的挖掘和分析,對(duì)未來(lái)教育的發(fā)展具有重要意義。
我國(guó)傳統(tǒng)模式教育大量信息的獲取和傳播方式是相對(duì)單一和簡(jiǎn)單的,在學(xué)習(xí)效率和資源利用上存在一定的浪費(fèi)與相對(duì)不足的矛盾,信息的真實(shí)性有待進(jìn)一步挖潛;在教學(xué)效果上不能滿(mǎn)足不同層次的學(xué)生需求,教學(xué)的差異化、個(gè)性化和多樣性等方面大打折扣。大數(shù)據(jù)時(shí)代的來(lái)臨,為傳統(tǒng)教育轉(zhuǎn)型帶來(lái)了新的契機(jī)與挑戰(zhàn)。
教育領(lǐng)域中的大數(shù)據(jù)分析最終目的是為了改善學(xué)生的學(xué)習(xí)成績(jī)。成績(jī)優(yōu)異的學(xué)生對(duì)學(xué)校、對(duì)社會(huì)、以及對(duì)國(guó)家來(lái)說(shuō)都是好事。學(xué)生的作業(yè)和考試中有一系列重要的信?息往往被我們常規(guī)的研究所忽視。而通過(guò)分析大數(shù)據(jù),我們就能發(fā)現(xiàn)這些重要信息,并利用它們?yōu)楦纳茖W(xué)生的成績(jī)提供個(gè)性化的服務(wù)。與此同時(shí),它還能改善學(xué)生期?末考試的成績(jī)、平時(shí)的 出勤率、輟學(xué)率、升學(xué)率等。
北京理工大學(xué)大數(shù)據(jù)搜索與挖掘?qū)嶒?yàn)室張華平主任研發(fā)的NLPIR大數(shù)據(jù)語(yǔ)義智能分析技術(shù)是對(duì)語(yǔ)法、詞法和語(yǔ)義的綜合應(yīng)用。NLPIR大數(shù)據(jù)語(yǔ)義智能分析平臺(tái)是根據(jù)中文數(shù)據(jù)挖掘的綜合需求,融合了網(wǎng)絡(luò)精準(zhǔn)采集、自然語(yǔ)言理解、文本挖掘和語(yǔ)義搜索的研究成果,并針對(duì)互聯(lián)網(wǎng)內(nèi)容處理的全技術(shù)鏈條的共享開(kāi)發(fā)平臺(tái)。
其中KGB(Knowledge Graph Builder)知識(shí)圖譜引擎是我們自主研發(fā)的知識(shí)圖譜構(gòu)建與推理引擎,基于漢語(yǔ)詞法分析的基礎(chǔ)上,采用KGB語(yǔ)法實(shí)現(xiàn)了實(shí)時(shí)高效的知識(shí)生成,可以從非結(jié)構(gòu)化文本中抽取各類(lèi)知識(shí),并實(shí)現(xiàn)了從表格中抽取指定的內(nèi)容等。KGB同時(shí)可以定義不同的動(dòng)作,如抽取動(dòng)作,并能自定義各類(lèi)后處理程序。利用KGB知識(shí)圖譜引擎可以抽取到產(chǎn)品的詳細(xì)報(bào)價(jià)信息,方便進(jìn)行下一步的數(shù)據(jù)挖掘與圖譜構(gòu)建。
數(shù)據(jù)挖掘技術(shù)及其應(yīng)用是目前國(guó)際上的一個(gè)研究熱點(diǎn),并在許多行業(yè)中得到了很好的應(yīng)用,尤其是在市場(chǎng)營(yíng)銷(xiāo)中獲得了成功,初步體現(xiàn)了其優(yōu)越性和發(fā)展?jié)摿?。在信息管理領(lǐng)域,綜合應(yīng)用數(shù)據(jù)挖掘技術(shù)和人工智能技術(shù),獲取用戶(hù)知識(shí)、文獻(xiàn)知識(shí)等各類(lèi)知識(shí),將是實(shí)現(xiàn)知識(shí)檢索和知識(shí)管理發(fā)展的必經(jīng)之路。