立即參團(tuán)
原價(jià)¥899.00
50人以上 ¥499.00
100人以上 ¥399.00
《知識(shí)圖譜》第一期
課程簡(jiǎn)介:
本次的知識(shí)圖譜課程主要包括三大部分:
1)知識(shí)圖譜的工程方法論。指導(dǎo)學(xué)員了解并掌握知識(shí)圖譜的基本概念和發(fā)展歷史,梳理清知識(shí)圖譜的技術(shù)體系,掌握知識(shí)圖譜的核心技術(shù)原理,建立知識(shí)圖譜工程的方法論思維。
2)知識(shí)圖譜的實(shí)戰(zhàn)技術(shù)。從實(shí)戰(zhàn)出發(fā),圍繞知識(shí)表示、知識(shí)抽取、語(yǔ)義搜索、知識(shí)問(wèn)答、知識(shí)推理、知識(shí)融合等系統(tǒng)性介紹知識(shí)圖譜相關(guān)的實(shí)戰(zhàn)技術(shù),使得學(xué)員具備研發(fā)知識(shí)圖譜相關(guān)應(yīng)用的基礎(chǔ)能力。
3)知識(shí)圖譜的典型應(yīng)用。結(jié)合醫(yī)療、金融、電商等實(shí)際應(yīng)用場(chǎng)景,介紹知識(shí)圖譜各個(gè)技術(shù)點(diǎn)的實(shí)際應(yīng)用落地方式,使得學(xué)員具備結(jié)合自身背景開(kāi)展知識(shí)圖譜技術(shù)實(shí)踐的應(yīng)用能力。
主講老師:
王昊奮著名知識(shí)圖譜專家
博士畢業(yè)于上海交通大學(xué),CCF術(shù)語(yǔ)專委會(huì)執(zhí)委,中文信息學(xué)會(huì)語(yǔ)言與知識(shí)計(jì)算委員會(huì)副秘書長(zhǎng),共發(fā)表75余篇高水平論文。中文知識(shí)圖譜zhishi.me創(chuàng)始人,OpenKG聯(lián)盟發(fā)起人之一,其帶隊(duì)構(gòu)建的語(yǔ)義搜索系統(tǒng)在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競(jìng)賽OAEI的實(shí)體匹配任務(wù)中斬獲得全球第1名。曾主持并參與多項(xiàng)國(guó)家自然科學(xué)基金、863重大專項(xiàng)和國(guó)家科技支撐項(xiàng)目,以學(xué)術(shù)負(fù)責(zé)人身份參與Paypal、Google、Intel、IBM、百度等企業(yè)的合作項(xiàng)目。
開(kāi)課時(shí)間:2017年10月24日
學(xué)習(xí)方式:
在線直播,共11次
每周2次(周二、四晚上20:00-22:00)
直播后提供錄制回放視頻,在線反復(fù)觀看,有效期1年
課程大綱
第一課: 知識(shí)圖譜概論
1. 知識(shí)圖譜的起源和歷史
2. 典型知識(shí)庫(kù)項(xiàng)目簡(jiǎn)介
3. 知識(shí)圖譜應(yīng)用簡(jiǎn)介
4. 本次課程覆蓋的主要范圍:知識(shí)表示與建模、知識(shí)抽取與挖掘、知識(shí)存儲(chǔ)、知識(shí)融合、知識(shí)推理、語(yǔ)義搜索、知識(shí)問(wèn)答和行業(yè)知識(shí)圖譜應(yīng)用剖析等內(nèi)容。
第二課: 知識(shí)表示與知識(shí)建模
1. 早期知識(shí)表示簡(jiǎn)介
2. 基于語(yǔ)義網(wǎng)的知識(shí)表示框架
a. RDF和RDFS
b. OWL和OWL2 Fragments
c. SPARQL查詢語(yǔ)言
d. Json-LD、RDFa、HTML5 MicroData等新型知識(shí)表示
3. 典型知識(shí)庫(kù)項(xiàng)目的知識(shí)表示
4. 基于本體工具(Protege)的知識(shí)建模最佳實(shí)踐
第三課: 知識(shí)抽取與挖掘I
1. 知識(shí)抽取任務(wù)定義和相關(guān)比賽:實(shí)體識(shí)別、關(guān)系抽取和事件抽取
2. 面向結(jié)構(gòu)化數(shù)據(jù)(關(guān)系數(shù)據(jù)庫(kù))的知識(shí)抽取,包括D2RQ和R2RML等轉(zhuǎn)換與映射規(guī)范與技術(shù)介紹
3. 面向半結(jié)構(gòu)化數(shù)據(jù)(Web tables, 百科站點(diǎn)等)的知識(shí)抽取
a. 基于正則表達(dá)式的方法
b. Bootstrapping和Wrapper Induction介紹
4. 實(shí)踐展示:基于百科數(shù)據(jù)的知識(shí)抽取
第四課: 知識(shí)抽取與挖掘II
1. 面向非結(jié)構(gòu)化數(shù)據(jù)(文本)的知識(shí)抽取
a. 基于本體的知識(shí)抽取,包括NELL和DeepDive系統(tǒng)介紹
b. 開(kāi)放知識(shí)抽取,包括TextRunner、Reverb和OLLIE等系統(tǒng)介紹
2. 知識(shí)挖掘
a. 知識(shí)內(nèi)容挖掘:實(shí)體消歧與鏈接
b. 知識(shí)結(jié)構(gòu)挖掘:關(guān)聯(lián)規(guī)則挖掘與社區(qū)發(fā)現(xiàn)
c. 知識(shí)表示學(xué)習(xí)與鏈接預(yù)測(cè),包括TransE和PRA等算法介紹
第五課: 知識(shí)存儲(chǔ)
1. 基于關(guān)系數(shù)據(jù)庫(kù)的存儲(chǔ)設(shè)計(jì),包括各種表設(shè)計(jì)和索引建立策略
2. 基于RDF的圖數(shù)據(jù)庫(kù)介紹
a. 開(kāi)源數(shù)據(jù)庫(kù)介紹:Apache Jena、Sesame、gStore、RDF-3X等
b. 商業(yè)數(shù)據(jù)庫(kù)介紹:Virtuoso、AllegroGraph、BlazeGraph等
3. 原生圖數(shù)據(jù)庫(kù)介紹,包括Neo4j、OrientDB、Titan和Cayley等
4. 實(shí)踐展示:使用Apache Jena存儲(chǔ)百科知識(shí),并使用Fuseki構(gòu)建圖譜查詢服務(wù)
第六課: 知識(shí)融合
1. 知識(shí)融合任務(wù)定義和相關(guān)競(jìng)賽:本體對(duì)齊和實(shí)體匹配
2. 本體對(duì)齊基本流程和常用方法
a. 基于Linguistic的匹配
b. 基于圖結(jié)構(gòu)的匹配
c. 基于外部知識(shí)庫(kù)的匹配
3. 實(shí)體匹配基本流程和常用方法
a. 基于分塊的多階段匹配
b. 基于規(guī)則(配置或通過(guò)學(xué)習(xí))的實(shí)體匹配
4. 知識(shí)融合工具介紹:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
5. 實(shí)踐展示:使用Falcon-AO融合百度百科與維基百科中的知識(shí)
第七課: 知識(shí)推理
1. 本體知識(shí)推理簡(jiǎn)介與任務(wù)分類,包括概念可滿足性、概念包含、實(shí)例分類和一致性檢測(cè)等
2. 本體推理方法與工具介紹
a. 基于Tableaux運(yùn)算的方法:Fact++、Racer、Pellet和Hermit等
b. 基于一階查詢重寫的方法:Ontology-based Data Access的Ontop等
c. 基于產(chǎn)生式規(guī)則的方法(如Rete):Jena、Sesame和OWLIM等
d. 基于邏輯編程(如Datalog)改寫的方法:KAON2和RDFox等
3. 實(shí)踐展示:使用Jena完成百科知識(shí)上的上下位推理、缺失類別補(bǔ)全和一致性檢測(cè)等
第八課: 語(yǔ)義搜索
1. 語(yǔ)義搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
2. 基于語(yǔ)義標(biāo)注的網(wǎng)頁(yè)搜索
a. Web Data Commons項(xiàng)目介紹
b. 排序算法介紹,擴(kuò)展BM25
3. 基于圖譜的知識(shí)搜索
a. 本體搜索(ontology lookup)
b. 探索式知識(shí)檢索,包括查詢構(gòu)造、結(jié)果排序和分面(facets)推薦
4. 知識(shí)可視化,包括本體、查詢、結(jié)果等的展現(xiàn)方式和可視化分析
5. 實(shí)踐展示:使用ElasticSearch實(shí)現(xiàn)百科數(shù)據(jù)的語(yǔ)義搜索
第九課: 知識(shí)問(wèn)答I
1. 知識(shí)問(wèn)答概述和相關(guān)數(shù)據(jù)集(QALD和WebQuestions)
2. 知識(shí)問(wèn)答基本流程
3. 知識(shí)問(wèn)答主流方法介紹
a. 基于模板的方法,包括模板定義、模板生成和模板匹配等步驟
b. 基于語(yǔ)義解析的方法,包括資源映射,邏輯表達(dá)式候選生成與排序等
c. 基于深度學(xué)習(xí)的方法
第十課: 知識(shí)問(wèn)答II
1. IBM Watson問(wèn)答系統(tǒng)及核心組件詳細(xì)解讀
a. 問(wèn)句理解
b. 候選答案生成
c. 基于證據(jù)的答案排序
2. 實(shí)踐展示:面向百科知識(shí)的問(wèn)答baseline實(shí)現(xiàn)
第十一課: 行業(yè)知識(shí)圖譜應(yīng)用
1. 行業(yè)知識(shí)圖譜特點(diǎn)
2. 行業(yè)知識(shí)圖譜應(yīng)用,包括金融、醫(yī)療、數(shù)字圖書館等領(lǐng)域應(yīng)用
3. 行業(yè)知識(shí)圖譜構(gòu)建與應(yīng)用的挑戰(zhàn)
4. 行業(yè)知識(shí)圖譜生命周期定義和關(guān)鍵組件
常見(jiàn)問(wèn)題:
Q:參加本門課程有什么要求?
A: 有一定Python編程能力,有基本大學(xué)數(shù)學(xué)基礎(chǔ)。
Q: 有課外學(xué)習(xí)資料嗎?
A: 有,老師會(huì)根據(jù)情況提供講義,并給出進(jìn)階學(xué)習(xí)資源與項(xiàng)目的建議。
參團(tuán)!咨詢!查看課程!
就點(diǎn)這里!
評(píng)論列表