0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

超详细EMNLP2020 因果推断

深度学习自然语言处理 来源:复旦DISC 作者:何啸风 2021-05-19 15:59 次阅读

引言

X,Y之间的因果性被定义为操作X,会使得Y发生改变。在很多领域如药物效果预测、推荐算法有效性,因果性都有着重要作用。然而现实数据中,变量之间还会存在其他的相关关系(confounding)。如何从观察获得的数据中发现不同因素之间的因果关系则是统计学、机器学习人工智能领域具有挑战性的重要研究问题---统计推断。

本次Fudan DISC实验室将分享EMNLP 2020中有关因果推断的3篇论文,介绍在不同任务下因果推断方法的应用。

文章概览

基于因果推理的逻辑相关多任务学习研究

Exploring Logically Dependent Multi-task Learning with Causal Inference

论文地址:

https://www.aclweb.org/anthology/2020.emnlp-main.173

该篇文章从因果推理的角度出发,使用mediation assumption对逻辑依赖的MTL进行了研究。具体模型使用label transfer利用之前的低级逻辑依赖的任务label,以及Gumbel sampling方法来处理级联错误。

脚本知识的因果推理

Causal Inference of Script Knowledge

论文地址:

https://www.aclweb.org/anthology/2020.emnlp-main.612

该篇文章从概念和实践的角度论证了纯粹基于相关性的方法对于脚本知识归纳是不够的,并提出了一种基于事件干预评估因果效应的脚本归纳方法。

使用因果关系消除偏见的法院意见生成

De-Biased Court’s View Generation with Causality

论文地址:

https://www.aclweb.org/anthology/2020.emnlp-main.56

本文提出了一种新的基于注意力和反事实的自然语言生成方法(AC-NLG),该方法由一个注意力编码器和一对反事实译码器组成。注意力编码器利用原告的索赔和事实描述来学习索赔感知的编码表示。反事实译码器被用来消除数据中的混淆偏差,并与协同的判决预测模型结合来生成法院意见。

论文细节

1

bdeb7606-b4a6-11eb-bf61-12bb97331649.png

论文动机

以往的研究表明,分层多任务学习(MTL)可以通过堆叠编码器和输出形式的民主MTL来利用任务依赖性。然而,在逻辑相关的任务中,堆叠编码器只考虑特征表示的依赖性,而忽略了标签的依赖性。MLT的三种结构如下图所示

be267f08-b4a6-11eb-bf61-12bb97331649.png

从因果关系的角度来看,前两个方案假设ym和yn是条件独立的,而第三个方案假设ym对yn有因果关系。在这篇文章中,作者认为因果关系对于逻辑相关的任务是重要的,并提出了一种称为标签转移(label transfer,LT)的机制,使得一个任务可以利用其所有较低级别任务的标签。

当使用前任务的标签时,会引入训练和测试的分歧问题。也就是说该策略在训练中使用低水平任务的标注标签,在测试中则需要使用预测的标签,这样会导致任务之间的级联错误。本文使用Gumbel抽样(GS)来解决这个问题。具体来说,模型从每个任务的预测概率分布中抽取一个标签,并将其提供给更高级别的任务。抽样可以看作是一个反事实推理过程,可以估计不同任务标签之间的因果关系。如果因果效应存在,反向传播的梯度将惩罚错误的预测。

方法

1. Basic Causal Assumptions

be52d904-b4a6-11eb-bf61-12bb97331649.png

如上图MTL有两种可能的因果假设:confounding 和 mediation。confounding假设是,Ym和Yn是条件独立的,仅由H决定。然而,对于逻辑相关的任务,文章使用mediation假设,即Ym对Yn有因果关系。具体来说,此假设包括Ym和Yn之间的两条因果路径。通过媒体H(实线),称为间接效应。另一个直接链接Ym到Yn(虚线),称为直接效果。一条是通过metiator H(实线)把Ym和Yn联系起来的,称为间接效应。另一个直接连接Ym到Yn(虚线),称为直接效应。

2. Full Causal Graphs

c18c38fe-b4a6-11eb-bf61-12bb97331649.png

CMTL通过两条路径将任务间因果性结合起来。它首先创建一个中间变量传达之前所有任务的标签信息。然后该模型考虑了路径→→的间接因果效应,还包括路径→的直接因果效应。

3. Model Details

完整模型结构下图所示。

c1ecabf8-b4a6-11eb-bf61-12bb97331649.png

Label Transfer LT使用RNN-LSTM的结构来编码:

**Encoders ** 然后将被送入编码器。如图所示,Encoder^(k) 的输入包括三个部分:词嵌入、转移标签和k-1层的输出。输出可表示为:

¥4f对于JERE和ABSA任务编码器使用Bi-LSTM。对于LJP任务,先使用CNN编码句子,随后使用LSTM编码标签嵌入。

Gumbel Sampling GS使用重参数技巧来估计多项抽样:

其中g符合Gumbel(0,1),是温度参数。在训练过程中将使用来代替标注标签。这样低水平的任务将有一定的概率抽样一个反事实的值,如果因果关系确实存在,会从高水平的任务得到反馈。

4. 因果解释

估计任务tm的标签对任务tn的标签的因果效应:

除了估计标签的因果效应外,还可以检验X中n-grams元素的影响。对原始序列进行干预,得到另一个文本序列,其中n-gram 被屏蔽。由于n-gram可能非常稀疏,因此仅对单个因果效应进行了估计:

实验结果

1. 主要结果

c22d5068-b4a6-11eb-bf61-12bb97331649.png

在三个任务上模型都有所提升。

c288489c-b4a6-11eb-bf61-12bb97331649.png

如图所示,GS和LT对模型都是有影响的,特别是对于高水平的任务。例如,消除GS导致RE的F1得分下降2.24分,消除这两种机制导致显著下降4.47分。此外,文章保留了CMTL的间接因果路径或直接因果路径,分别记为CMTL(间接)和CMTL(直接)模型。两种相关模型的性能都略差于CMTL。

2. 案例分析

c2cb48a4-b4a6-11eb-bf61-12bb97331649.png

3. 因果效应估计

c31fd82e-b4a6-11eb-bf61-12bb97331649.png

c34be496-b4a6-11eb-bf61-12bb97331649.png

2

c417b594-b4a6-11eb-bf61-12bb97331649.png

论文动机

长期以来典型事件序列所定义的日常情景的常识性知识,一直被认为在文本理解和理解中起着重要作用。通过数据驱动的方法从文本语料库中学习这样的知识需要确定定量度量标准。虽然观察到的事件之间存在相关性,但相关性并不是决定事件是否形成有意义脚本的唯一因素。这篇文章则提出基于因果关系的方法,用于提取脚本知识。

方法

Step 1: Define a Causal Model

c43be91e-b4a6-11eb-bf61-12bb97331649.png

世界,U:生成数据的起点是真实世界,由未测量的变量U显式表示。这个变量是不可知的,通常是不可测量的:我们不知道它是如何分布的,甚至不知道它是什么类型的变量。这个变量由图2中的六边形节点表示。

Text,T:下一种类型的变量是文本。将文本分割成块T1,…,TN,其中N是文本中事件数。因此,变量Ti是与文本中提到的第i个事件相对应的文本块。

事件推断,e:读取一段文本,并推断文本中提到的事件类型。这个类型在模型中由变量 表示,其中E是一组可能的原子事件类型。文本直接因果影响推断的时间类型,所以文本有指向事件的单向箭头。

语篇表征,D:变量ei表示Ti中部分语义内容的高层次抽象。而文本中发生过事件以及它们之间的因果关系是人类阅读时的核心部分,这种信息会显著影响读者基于事件的推理。因此,引入一个话语表征变量,它本身就是两个子变量和的组合。

Step 2: Establishing Identifiability

由后门准则知道:

使用蒙特卡洛估计上述期望。

Step 3: Estimation

通过机器学习方法上述中的

Extracting Script Knowledge

令,则脚本相容分数(因果分数)为。

实验结果

使用人工分别对事件对和事件链评分的结果如下:

c46e8504-b4a6-11eb-bf61-12bb97331649.png

c4954432-b4a6-11eb-bf61-12bb97331649.png

结果表明因果模型的分数更高。

3

c4b28a24-b4a6-11eb-bf61-12bb97331649.png

论文动机

法院意见生成是法律人工智能的一项新颖而重要的任务,旨在提高判决预测结果的可解释性,实现法律文书的自动生成。虽然先前的文本到文本的自然语言生成(NLG)方法可以用来解决这个问题,但是他们都忽略了数据生成机制中的混淆偏差,这样会限制模型的性能,影响学习结果。主要挑战有:1. 民事法律制度中的“无诉不审”原则,使得判决需要回应原告的索赔;2. 民事案件中判决的不平衡,由于原告只会在有很大把握的前提下提起诉讼,也就导致大部分的判决都是支持的,这样就形成了数据分布不均。

c4e09f2c-b4a6-11eb-bf61-12bb97331649.png

如上因果图角度看,判决的不平衡揭示了数据生成机制导致的混淆偏见。这种不平衡的数据将导致输入(索赔和公认事实)和输出(法院观点)的学习表示倾向于支持,导致输入和输出之间的混淆偏差,并影响传统NLG模型的训练。

针对这些问题,文章提出了一种基于注意力和反事实的自然语言生成(AC-NLG)方法,通过联合优化一个索赔感知编码器、一对反事实解码器来生成判决分辨性法院意见和一个协同判决预测模型。

方法

Backdoor Adjustment

对于一般的生成任务,我们需要计算:如果 ,则 退化为 , 将会忽略 时的表示。后门调整是因果推理中的一个消除混淆的技术。后门调整对进行操作,将后验概率从被动观察提升到主动干预。后门调整通过计算介入后验P(V | do(I))和控制混杂因子来解决混杂偏差:。后门调整切断了和之间的依赖。

Backdoor In Implementation

实现过程中,使用一对反事实解码器估计,使用判据预测模型估计。

Model Architecture

Claim-aware Encoder:原告的权利要求c和事实描述f是句子形式。因此,编码器首先将单词转换为嵌入词。然后将嵌入序列反馈给Bi-LSTM,产生两个隐藏状态序列hc、hf,分别对应于原告的请求和事实描述。之后,我们使用Claim-aware attention来融合hc和hf。对于hf中的每个隐藏状态,是其对的注意权重,注意分布计算如下:

随后产生新的事实描述表示:

经过Bi-LSTM层,得到最终表是。

Judgment Predictor:使用全连接层由h生成判决的概率预测:

Counterfactual Decoder:为了消除数据偏差的影响,使用一对反事实解码器,其中包含两个解码器,一个用于支持的情况,另一个用于不支持的情况。这两种译码器的结构相同,但目的是产生不同判决的法院观点。运用了注意机制:在每个步骤t,给定编码器的输出和解码状态,注意力分布的计算方法与相同,但参数不同。上下文向量是h的加权和:

。上下文向量与解码状态相连接并送到线性层以产生词汇分布:

实验结果

c5371758-b4a6-11eb-bf61-12bb97331649.png

上图显示了法院意见生成的一些评估指标:ROUGE, BLEU, 和 BERT SCORE分数。可以得出:

(1)S2S倾向于重复单词,这使得其BLEU得分较高,而BERT得分较低

(2) 过采样策略对模型没有好处,因此,它不能解决混淆偏差

(3) 与基准相比,AC-NLG具有索赔感知编码器和后门反事实解码器,在法庭视图生成方面取得了更好的性能

(4) AC NLGw/oCA和AC-NLG之间的性能差距证明了索赔感知编码器的有效性,AC NLGw/oBA和AC-NLG之间的差距说明了反事实解码器的优越性。

c5762ede-b4a6-11eb-bf61-12bb97331649.png

上图显示了判决预测准确率以及人类评估结果:

判据预测结果:

(1) 模型中反事实译码器可以显著地消除混淆偏差,从而在不支持的情况下获得显著的改进,例如将f1从49.8%提高到76.9%

(2) 提出的索赔感知编码器是为提高生成质量而设计的,对判决预测的影响有限。

(3) 过采样并不能给模型带来任何改进。

人类评估结果:

(1) 由于数据中的混杂偏差,PGN中的判决生成在无支持案例中的表现较差,支持案例和无支持案例之间的表现差距很大(1.56)

(2) 通过使用后门反事实解码器,AC-NLG大大提高了判决生成的性能,特别是对于不支持的情况,并且在支持和不支持的情况之间实现了较小的性能差距(只有0.28)

(3) AC-NLG使用了一个支持索赔的编码器,在理性和流畅性方面也取得了更好的性能

c5b6be18-b4a6-11eb-bf61-12bb97331649.png

上图展示了不同模型产生的法院观点。

总结

此次 Fudan DISC 解读的三篇论文围绕因果推断的应用。对于多任务学习,可以考虑任务标签之间的因果性。对于抽取任务,可以考虑使用因果性评估来筛选想要的抽取内容。对于数据集有偏差的文本生成任务,因果推断可以帮助消除混淆偏差。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 编码器
    +关注

    关注

    45

    文章

    3641

    浏览量

    134496
  • 译码器
    +关注

    关注

    4

    文章

    310

    浏览量

    50331
  • 自然语言
    +关注

    关注

    1

    文章

    288

    浏览量

    13348

原文标题:EMNLP2020 因果推断

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    六类线用几类水晶头好

    对于六类线最理想的选择是使用Cat6A水晶头,也就是六类水晶头。以下是关于六类线使用几类水晶头的详细解答:
    的头像 发表于 12-19 17:51 221次阅读

    一种基于因果路径的层次图卷积注意力网络

    机电系统中的故障检测对其可维护性和安全性至关重要。然而,系统监测变量往往具有复杂的联系,很难表征它们的关系并提取有效的特征。本文开发了一种基于因果路径的层次图卷积注意力网络(HGCAN),以提高复杂
    的头像 发表于 11-12 09:52 274次阅读
    一种基于<b class='flag-5'>因果</b>路径的层次图卷积注意力网络

    鉴源实验室·测试设计方法-因果

    上篇文章(ISO 26262中测试用例的得出方法-边界值分析)我们介绍了等价类方法和边界值方法,这两种方法广泛应用并适用于各种类型测试的设计中,本章开始我们介绍黑盒测试常用的其他方法,先从因果图法
    的头像 发表于 11-05 15:17 206次阅读
    鉴源实验室·测试设计方法-<b class='flag-5'>因果</b>图

    经纬恒润功能安全AI 智能体论文成功入选EMNLP 2024!

    :AnAdvancedLLM-BasedMulti-AgentforIntelligentFunctionalSafetyEngineering》成功入选EMNLP2024产业应用分会(IndustryTrack)。EMNLP作为自然语言处理领域的高规格会议,汇聚了全球前
    的头像 发表于 10-18 08:00 347次阅读
    经纬恒润功能安全AI 智能体论文成功入选<b class='flag-5'>EMNLP</b> 2024!

    AT指令速通FTP:合宙Air780EP模块详细教程

    合宙Air780EP低功耗4G模组AT开发接入FTP详细示例!
    的头像 发表于 08-20 17:40 2524次阅读
    AT指令速通FTP:合宙Air780EP模块<b class='flag-5'>超</b><b class='flag-5'>详细</b>教程

    第19.1 章-星瞳科技 OpenMV视觉循迹功能 详细OpenMV与STM32单片机通信

    第19.1 章-[星瞳科技]OpenMV视觉循迹功能 详细OpenMV与STM32单片机通信 (有完整版源码) 【星曈科技】OpenMv笔记——利用OpenMV与STM32进行串口通信
    的头像 发表于 08-20 11:41 981次阅读
    第19.1 章-星瞳科技 OpenMV视觉循迹功能 <b class='flag-5'>超</b><b class='flag-5'>详细</b>OpenMV与STM32单片机通信

    当系统闹脾气:用「因果推断」哄稳技术的心

    背景 系统稳定性问题往往涉及复杂的因果关系。例如,一个系统的崩溃可能由多个因素引起,包括硬件故障、软件bug、业务配置、外部攻击或其他操作不当等。理解这些因素之间的因果关系对于系统稳定性建设至关重要
    的头像 发表于 08-14 10:42 277次阅读
    当系统闹脾气:用「<b class='flag-5'>因果</b><b class='flag-5'>推断</b>」哄稳技术的心

    透镜的设计与分析

    **摘要 ** 透镜是一种透射光学装置,通过改变光的相位使光聚焦或散焦。与传统透镜不同,透镜的优点是能够在非常薄的层中实现所需的相位变化,使用的结构尺寸在波长量级及以下,而不需要复杂和体积庞大
    发表于 08-06 13:48

    什么是透镜?透镜的制造及其应用

      1.什么是透镜? 透镜利用介电表面上的亚波长“原子”图案来控制入射光。具体而言,原子图案会改变入射光束的相位分布,从而导致光束弯曲(重定向)。
    的头像 发表于 07-16 06:26 431次阅读

    融合架构解决方案

    随着信息技术的发展,企业对数据中心的依赖日益增强,对存储、计算和网络资源的需求也在不断增长。融合架构作为一种新兴的IT基础设施解决方案,正逐渐成为企业数据中心建设的首选。本文将详细介绍融合架构
    的头像 发表于 04-10 14:57 637次阅读

    充时代,认识

    2024年被誉为中国超级充电桩(以下简称“充”)发展的元年。 在国家大力支持基础充电设施建设的同时,各地方政府也在积极推动充的建设。广州于2022年提出要建设“充之都”,海南于2023年3月
    的头像 发表于 03-04 17:30 919次阅读

    COMSOL Multiphysics在材料与表面仿真中的应用

    的透射反射分析。此外,COMSOL Multiphysics还提供了丰富的物理场求解器,可以对表面的光学性能进行详细分析。 周期性表面的透射反射分析 配图说明:图3展示了周期性
    发表于 02-20 09:20

    《新能源车维修技术自学,链接汇总AI智能分类》4000案例

    收藏栏链接共享-新能源车维修自学-4000案例 -html文件 详细见附件 [*附件:收藏栏链接共享-新能源车维修自学-4000案例.zip] (注:可导入浏览器,在浏览器的收藏栏里方便查看)
    发表于 02-18 03:30

    融合和虚拟化的区别

    融合和虚拟化是当今IT领域非常热门的两个概念,它们都是为了提高数据中心的效能和灵活性,但在实现方式和功能上存在一些区别。本文将详细讨论融合和虚拟化的定义、原理、特点、优缺点以及它们的应用场
    的头像 发表于 01-15 10:36 4248次阅读

    ChatGPT是一个好的因果推理器吗?

    因果推理能力对于许多自然语言处理(NLP)应用至关重要。最近的因果推理系统主要基于经过微调的预训练语言模型(PLMs),如BERT [1] 和RoBERTa [2]。
    的头像 发表于 01-03 09:55 849次阅读
    ChatGPT是一个好的<b class='flag-5'>因果</b>推理器吗?