1、实体抽取:也就是命名实体识别,包括实体的检测(find)和分类(classify)。
2、关系抽取:通常我们说的三元组(triple)抽取,一个谓词(predicate)带2个形参(argument),如Founding-location(IBM,New York)。
3、事件抽取:相当于一种多元关系的抽取。
主要应用:
1、命名实体作为索引和超链接。
2、情感分析的准备步骤,在情感分析的文本中需要识别公司和产品,才能进一步为情感词归类。
3、关系抽取(Relation Extraction)的准备步骤。
4、QA系统,大多数答案都是命名实体。