立即參團
原價¥899.00
50人以上 ¥499.00
100人以上 ¥399.00
《知識圖譜》第一期
課程簡介:
本次的知識圖譜課程主要包括三大部分:
1)知識圖譜的工程方法論。指導(dǎo)學(xué)員了解并掌握知識圖譜的基本概念和發(fā)展歷史,梳理清知識圖譜的技術(shù)體系,掌握知識圖譜的核心技術(shù)原理,建立知識圖譜工程的方法論思維。
2)知識圖譜的實戰(zhàn)技術(shù)。從實戰(zhàn)出發(fā),圍繞知識表示、知識抽取、語義搜索、知識問答、知識推理、知識融合等系統(tǒng)性介紹知識圖譜相關(guān)的實戰(zhàn)技術(shù),使得學(xué)員具備研發(fā)知識圖譜相關(guān)應(yīng)用的基礎(chǔ)能力。
3)知識圖譜的典型應(yīng)用。結(jié)合醫(yī)療、金融、電商等實際應(yīng)用場景,介紹知識圖譜各個技術(shù)點的實際應(yīng)用落地方式,使得學(xué)員具備結(jié)合自身背景開展知識圖譜技術(shù)實踐的應(yīng)用能力。
主講老師:
王昊奮著名知識圖譜專家
博士畢業(yè)于上海交通大學(xué),CCF術(shù)語專委會執(zhí)委,中文信息學(xué)會語言與知識計算委員會副秘書長,共發(fā)表75余篇高水平論文。中文知識圖譜zhishi.me創(chuàng)始人,OpenKG聯(lián)盟發(fā)起人之一,其帶隊構(gòu)建的語義搜索系統(tǒng)在Billion Triple Challenge中榮獲全球第2名;在著名的本體匹配競賽OAEI的實體匹配任務(wù)中斬獲得全球第1名。曾主持并參與多項國家自然科學(xué)基金、863重大專項和國家科技支撐項目,以學(xué)術(shù)負責人身份參與Paypal、Google、Intel、IBM、百度等企業(yè)的合作項目。
開課時間:2017年10月24日
學(xué)習方式:
在線直播,共11次
每周2次(周二、四晚上20:00-22:00)
直播后提供錄制回放視頻,在線反復(fù)觀看,有效期1年
課程大綱
第一課: 知識圖譜概論
1. 知識圖譜的起源和歷史
2. 典型知識庫項目簡介
3. 知識圖譜應(yīng)用簡介
4. 本次課程覆蓋的主要范圍:知識表示與建模、知識抽取與挖掘、知識存儲、知識融合、知識推理、語義搜索、知識問答和行業(yè)知識圖譜應(yīng)用剖析等內(nèi)容。
第二課: 知識表示與知識建模
1. 早期知識表示簡介
2. 基于語義網(wǎng)的知識表示框架
a. RDF和RDFS
b. OWL和OWL2 Fragments
c. SPARQL查詢語言
d. Json-LD、RDFa、HTML5 MicroData等新型知識表示
3. 典型知識庫項目的知識表示
4. 基于本體工具(Protege)的知識建模最佳實踐
第三課: 知識抽取與挖掘I
1. 知識抽取任務(wù)定義和相關(guān)比賽:實體識別、關(guān)系抽取和事件抽取
2. 面向結(jié)構(gòu)化數(shù)據(jù)(關(guān)系數(shù)據(jù)庫)的知識抽取,包括D2RQ和R2RML等轉(zhuǎn)換與映射規(guī)范與技術(shù)介紹
3. 面向半結(jié)構(gòu)化數(shù)據(jù)(Web tables, 百科站點等)的知識抽取
a. 基于正則表達式的方法
b. Bootstrapping和Wrapper Induction介紹
4. 實踐展示:基于百科數(shù)據(jù)的知識抽取
第四課: 知識抽取與挖掘II
1. 面向非結(jié)構(gòu)化數(shù)據(jù)(文本)的知識抽取
a. 基于本體的知識抽取,包括NELL和DeepDive系統(tǒng)介紹
b. 開放知識抽取,包括TextRunner、Reverb和OLLIE等系統(tǒng)介紹
2. 知識挖掘
a. 知識內(nèi)容挖掘:實體消歧與鏈接
b. 知識結(jié)構(gòu)挖掘:關(guān)聯(lián)規(guī)則挖掘與社區(qū)發(fā)現(xiàn)
c. 知識表示學(xué)習與鏈接預(yù)測,包括TransE和PRA等算法介紹
第五課: 知識存儲
1. 基于關(guān)系數(shù)據(jù)庫的存儲設(shè)計,包括各種表設(shè)計和索引建立策略
2. 基于RDF的圖數(shù)據(jù)庫介紹
a. 開源數(shù)據(jù)庫介紹:Apache Jena、Sesame、gStore、RDF-3X等
b. 商業(yè)數(shù)據(jù)庫介紹:Virtuoso、AllegroGraph、BlazeGraph等
3. 原生圖數(shù)據(jù)庫介紹,包括Neo4j、OrientDB、Titan和Cayley等
4. 實踐展示:使用Apache Jena存儲百科知識,并使用Fuseki構(gòu)建圖譜查詢服務(wù)
第六課: 知識融合
1. 知識融合任務(wù)定義和相關(guān)競賽:本體對齊和實體匹配
2. 本體對齊基本流程和常用方法
a. 基于Linguistic的匹配
b. 基于圖結(jié)構(gòu)的匹配
c. 基于外部知識庫的匹配
3. 實體匹配基本流程和常用方法
a. 基于分塊的多階段匹配
b. 基于規(guī)則(配置或通過學(xué)習)的實體匹配
4. 知識融合工具介紹:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
5. 實踐展示:使用Falcon-AO融合百度百科與維基百科中的知識
第七課: 知識推理
1. 本體知識推理簡介與任務(wù)分類,包括概念可滿足性、概念包含、實例分類和一致性檢測等
2. 本體推理方法與工具介紹
a. 基于Tableaux運算的方法:Fact++、Racer、Pellet和Hermit等
b. 基于一階查詢重寫的方法:Ontology-based Data Access的Ontop等
c. 基于產(chǎn)生式規(guī)則的方法(如Rete):Jena、Sesame和OWLIM等
d. 基于邏輯編程(如Datalog)改寫的方法:KAON2和RDFox等
3. 實踐展示:使用Jena完成百科知識上的上下位推理、缺失類別補全和一致性檢測等
第八課: 語義搜索
1. 語義搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
2. 基于語義標注的網(wǎng)頁搜索
a. Web Data Commons項目介紹
b. 排序算法介紹,擴展BM25
3. 基于圖譜的知識搜索
a. 本體搜索(ontology lookup)
b. 探索式知識檢索,包括查詢構(gòu)造、結(jié)果排序和分面(facets)推薦
4. 知識可視化,包括本體、查詢、結(jié)果等的展現(xiàn)方式和可視化分析
5. 實踐展示:使用ElasticSearch實現(xiàn)百科數(shù)據(jù)的語義搜索
第九課: 知識問答I
1. 知識問答概述和相關(guān)數(shù)據(jù)集(QALD和WebQuestions)
2. 知識問答基本流程
3. 知識問答主流方法介紹
a. 基于模板的方法,包括模板定義、模板生成和模板匹配等步驟
b. 基于語義解析的方法,包括資源映射,邏輯表達式候選生成與排序等
c. 基于深度學(xué)習的方法
第十課: 知識問答II
1. IBM Watson問答系統(tǒng)及核心組件詳細解讀
a. 問句理解
b. 候選答案生成
c. 基于證據(jù)的答案排序
2. 實踐展示:面向百科知識的問答baseline實現(xiàn)
第十一課: 行業(yè)知識圖譜應(yīng)用
1. 行業(yè)知識圖譜特點
2. 行業(yè)知識圖譜應(yīng)用,包括金融、醫(yī)療、數(shù)字圖書館等領(lǐng)域應(yīng)用
3. 行業(yè)知識圖譜構(gòu)建與應(yīng)用的挑戰(zhàn)
4. 行業(yè)知識圖譜生命周期定義和關(guān)鍵組件
常見問題:
Q:參加本門課程有什么要求?
A: 有一定Python編程能力,有基本大學(xué)數(shù)學(xué)基礎(chǔ)。
Q: 有課外學(xué)習資料嗎?
A: 有,老師會根據(jù)情況提供講義,并給出進階學(xué)習資源與項目的建議。
參團!咨詢!查看課程!
就點這里!
評論列表