如何用一种级联的并解决嵌套的实体的三元组抽取模型?

描述

前言

关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。这些任务也都可看成三元组抽取,即(subject,predicate,object)。常见的抽取范式包含:

基于pipeline的分布抽取方式,在已知两个实体subject和object,去预测predicate。

联合抽取方式,一个模型同时将subject,predicate和object抽取出来。

「现实的场景中还存在重叠关系情况,那么针对这种情况该如何解决呢?」,ACL2020有一篇论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction[1]介绍了如何一种级联的并解决嵌套的实体的三元组(文中介绍的是关系抽取)抽取模型。下面我们来看看这篇论文介绍的内容。

背景

早期基于pipeline的方法首先识别出语句中的所有实体,然后在对所有的实体对分类。这种方式的一个缺点是:实体识别过程中的误差会被引入到关系抽取的环节中,如下图中的Normal情况。

现有的联合抽取模型中不能够有效地解决:一个句子包含多个相互重叠的关系三元组。如下图中的EPO和SEO。

前言

关系抽取是自然语言处理中一个比较基础的任务,除了关系抽取之外还有类似的任务如:属性抽取等。这些任务也都可看成三元组抽取,即(subject,predicate,object)。常见的抽取范式包含:

基于pipeline的分布抽取方式,在已知两个实体subject和object,去预测predicate。

联合抽取方式,一个模型同时将subject,predicate和object抽取出来。

「现实的场景中还存在重叠关系情况,那么针对这种情况该如何解决呢?」,ACL2020有一篇论文:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction[1]介绍了如何一种级联的并解决嵌套的实体的三元组(文中介绍的是关系抽取)抽取模型。下面我们来看看这篇论文介绍的内容。

背景

早期基于pipeline的方法首先识别出语句中的所有实体,然后在对所有的实体对分类。这种方式的一个缺点是:实体识别过程中的误差会被引入到关系抽取的环节中,如下图中的Normal情况。

现有的联合抽取模型中不能够有效地解决:一个句子包含多个相互重叠的关系三元组。如下图中的EPO和SEO。

SEO
 

EPO(Entity Pair Overlap)实体对的重叠,换句话说一个实体对包含多种关系,文中的例子就是一个人同时担任一部电影中的导演和演员的角色。

SEO(Single Entity Overlap)单个实体的重叠,就是有多个关系共享一个实体。

在2020年,预训练模型大行其道的时期下,文中也是结合了Bert模型完成文本的特征抽取工作。文中的模型在当时也达到了sota水平,下面我们看看模型的具体内容。

模型结构

关系三元组提取的目标是识别句子中所有可能的三元组(主语、关系、宾语),其中一些三元组可能与主语或宾语共享相同的实体。数学表达如下:
SEO
SEO
SEO

具体如下:

BERT Encoder

在编码器模块中,使用预训练Bert模型提取语句  的特征为 ,作为接下来的tagging模块的输入。

Cascade Decoder

该模块主要分为两个部分,首先从输入的语句中监测出subjects,即Subject Tagger。接着对候选的subject,检查其可能的所有关系类型,即Relation-Specific Object Taggers。

Subject Tagger

在这个模块中主要去识别输入语句中可能存在的subjects。每一个token会输出两个结果:start和end,通过为每个token分配一个二进制标记(0/1)来分别检测subject的开始和结束位置,该标记指示当前标记是否对应于subject的开始或结束位置。subject标记器对每个token的详细操作如下:

其中:

SEO
SEO
SEO

总结

实验效果如下图:
SEO




审核编辑:刘清

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分