课程培训
基于AI和大数据的知识图谱培训与咨询

 

培训目标:

 

通过本课程的学习,学员将会收获:
  • 帮助学员系统性的掌握知识图谱的核心技术原理,结合近期研究成果,学习从基本概念到各个先进算法和技术的转化思路
  • 了解国内外典型的开源知识库数据及技术资源
  • 实践与理论结合,培养学员面对工程及学术问题的思考解决能力
  • 基于百科知识进行各项核心技术的实例训练,并结合医疗、金融、电商等行业应用帮助学员快速积累知识图谱工程项目经验
  • 对有志于从事知识问答工作或学术研究的学员,提供IBM Watson系统实现原理的讲解与指导
  •  
  • 模块1:知识图谱概论 1. 知识图谱的起源和历史
    2. 典型知识库项目简介
    3. 知识图谱应用简介
    4. 本课程覆盖的主要范围:知识表示与建模、知识抽取与挖掘、知识存储、知识融合、知识推理、语义搜索、知识问答和行业知识图谱应用剖析等内容。
    模块2:知识表示与知识建模 1. 早期知识表示简介
    2. 基于语义网的知识表示框架
    • RDF和RDFS
    • OWL和OWL2 Fragments
    • SPARQL查询语言
    • Json-LD、RDFa、HTML5 MicroData等新型知识表示
    3. 典型知识库项目的知识表示
    4. 基于本体工具(Protege)的知识建模最佳实践
    模块3:知识抽取与挖掘I 1. 知识抽取任务定义和相关比赛:实体识别、关系抽取和事件抽取
    2. 面向结构化数据(关系数据库)的知识抽取,包括D2RQ和R2RML等转换与映射规范与技术介绍
    3. 面向半结构化数据(Web tables, 百科站点等)的知识抽取
    • 基于正则表达式的方法
    • Bootstrapping和Wrapper Induction介绍
    4. 实践展示:基于百科数据的知识抽取
     
    模块4:知识抽取与挖掘II 1. 面向非结构化数据(文本)的知识抽取
      a. 基于本体的知识抽取,包括NELL和DeepDive系统介绍
      b. 开放知识抽取,包括TextRunner、Reverb和OLLIE等系统介绍
    2. 知识挖掘
    • 知识内容挖掘:实体消歧与链接
    • 知识结构挖掘:关联规则挖掘与社区发现
    • 知识表示学习与链接预测,包括TransE和PRA等算法介绍
    模块5:知识存储 1. 基于关系数据库的存储设计,包括各种表设计和索引建立策略
    2. 基于RDF的图数据库介绍
    • 开源数据库:Apache Jena、Sesame、gStore、RDF-3X等
    • 商业数据库:Virtuoso、AllegroGraph、BlazeGraph等
    3. 原生图数据库介绍,包括Neo4j、OrientDB、Titan和Cayley等
    4. 实践展示:使用Apache Jena存储百科知识,并使用Fuseki构建图谱查询服务
    模块6:知识融合 1. 知识融合任务定义和相关竞赛:本体对齐和实体匹配
    2. 本体对齐基本流程和常用方法
    • 基于Linguistic的匹配
    • 基于图结构的匹配
    • 基于外部知识库的匹配
    3. 实体匹配基本流程和常用方法
    • 基于分块的多阶段匹配
    • 基于规则(配置或通过学习)的实体匹配
    4. 知识融合工具介绍:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
    5. 实践展示:使用Falcon-AO融合百度百科与维基百科中的知识
    模块7:知识推理 1. 本体知识推理简介与任务分类,包括概念可满足性、概念包含、实例分类和一致性检测等
    2. 本体推理方法与工具介绍
    • 基于Tableaux运算的方法:Fact++、Racer、Pellet和Hermit等
    • 基于一阶查询重写的方法:Ontology-based Data Access的Ontop等
    • 基于产生式规则的方法(如Rete):Jena、Sesame和OWLIM等
    • 基于逻辑编程(如Datalog)改写的方法:KAON2和RDFox等
    3. 实践展示:使用Jena完成百科知识上的上下位推理、缺失类别补全和一致性检测等
    模块8:语义搜索 1.语义搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
    2. 基于语义标注的网页搜索
    • Web Data Commons项目介绍
    • 排序算法介绍,扩展BM25
    3. 基于图谱的知识搜索
    • 本体搜索(ontology lookup)
    • 探索式知识检索,包括查询构造、结果排序和分面(facets)推荐
    4. 知识可视化,包括本体、查询、结果等的展现方式和可视化分析
    5. 实践展示:使用ElasticSearch实现百科数据的语义搜索
    模块9:知识问答I 1. 知识问答概述和相关数据集(QALD和WebQuestions)
    2. 知识问答基本流程
    3. 知识问答主流方法介绍
    • 基于模板的方法,包括模板定义、模板生成和模板匹配等步骤
    • 基于语义解析的方法,包括资源映射,逻辑表达式候选生成与排序等
    • 基于深度学习的方法
    模块10:知识问答II 1. IBM Watson问答系统及核心组件详细解读
    • 问句理解
    • 候选答案生成
    • 基于证据的答案排序
    2. 实践展示:面向百科知识的问答baseline实现
    模块11:行业知识图谱应用 1. 行业知识图谱特点
    2. 行业知识图谱应用,包括金融、医疗、数字图书馆等领域应用
    3. 行业知识图谱构建与应用的挑战
    4. 行业知识图谱生命周期定义和关键组件
     
     



如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表下载请点击

服务优势:
丰富专家资源,精准匹配相关行业,相关项目技术精英,面向用户实际需求,针对性培训或咨询,互动式交流,案例教学,精品小班,实际工程项目经验分享,快捷高效,节省时间与金钱,少走弯路与错路。

专家力量:
中国科学院相关研究所高级研究人员
西门子,TI,vmware,MSC,Ansys,MDI,Mentor, candence,Altium,Atmel 、Freescale,达索,华为等
大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关学历背景专业,理论素养高
多年实际项目实践,大型复杂项目实战案例分享,热情,乐于技术分享
针对客户实际需要,真实案例演示,互动式沟通,学有所值
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

微信号.jpg

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>