图谱技术综述

目录

  • 期望的预备知识、技能

  1. 图谱简介
    1.1 起源,发展脉络,公开图谱,业内状况
    1.2 图谱涉及的理论、技术
  2. 图谱冷启动(初始化)
    2.1 获取数据
    2.2 数据存储
    2.3 数据清洗
    2.4 实体分类
  3. 实体抽取(NRE)
    3.1 序列标注——规范,数据集,工具
    3.2 序列标注——HMM,MEMM,CRF
    3.3 序列标注——LSTM,Transformer,Bert
  4. 属性抽取(非结构化)
    4.1 基于模板的方法——触发词、依存句法
    4.2 监督学习——深度学习、PCNN
    4.3 半监督学习——远程监督、Bootstrapping
  5. 实体链接-合并
  6. 图谱应用
    6.1 检索
    6.2 对话
    6.3 推荐
  7. 小结和面试私货
  • 期望的预备知识、技能
  • python,ml&nlp,algorithm
  • linux,neo4j,scrapy
  • docker,elasticsearch
  • shameless && curiosity

第一部分 【图谱简介、图谱启动、实体抽取】

  1. 图谱简介
    1.1 起源,发展脉络,公开图谱,业内状况
    1.2 图谱涉及的理论、技术
  2. 图谱冷启动(初始化)
    2.1 [x]获取数据
    2.2 [x]数据存储
    2.3 [x]数据清洗
    2.4 [x]实体分类
  3. 实体抽取(NRE)
    3.1 序列标注——规范,数据集,工具
    3.2 [x]序列标注——HMM,MEMM,CRF
    3.3 [x]序列标注——LSTM,Transformer,Bert
    3.4 小结

第二部分 【属性抽取、实体链接-合并、图谱应用】

  1. 属性抽取(非结构化)
    4.1 [x]基于模板的方法——触发词、依存句法
    4.2 [x]监督学习——深度学习、PCNN
    4.3 [x]半监督学习——远程监督、Bootstrapping
  2. 实体链接-合并
    5.1 属性合并
    5.2 实体合并
  3. 图谱应用
    6.1 NLP增强
    6.2 检索
    6.3 [x]对话
    6.4 推荐

  4. 小结和面试私货