Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > Java基础相关 >

基于深度学习的事件因果关系抽取综述 PDF 下载


分享到:
时间:2021-05-30 09:46来源:http://www.java1234.com 作者:转载  侵权举报
基于深度学习的事件因果关系抽取综述 PDF 下载
失效链接处理
基于深度学习的事件因果关系抽取综述 PDF 下载


本站整理下载:
提取码:iawa 
 
 
相关截图:
 
主要内容:


0 引言
人们的社会活动以事件为驱动,事件是社会活动的载体。
在自然语言处理中,事件作为一种信息表示形式显得十分重
要,受到越来越多的重视。事件中包含了大量的内部组成结
构(如参与者、时间、地点等)和外部关联(如因果、共指、时序
等语义关系)。对包含大量事件的文本进行因果关系的抽取
可以实现对文本的更加深层次的理解。在航空安全[1]、医学[2]
等众多领域中,因果关系抽取也发挥着重要的作用。图灵奖
获得者 Bengio 表示将因果关系集成到人工智能(Artificial
Intelligence,AI)中是一件大事,了解因果关系可以使得现有
的人工智能更加智能高效。Pearl等[3]
讲到如果没有因果推理
的能力,人工智能将从根本上受到限制。
因果关系一般可以组织为事理图谱。事理图谱是表示事
件之间的顺承、因果关系的有向图[4]。图中每个节点表示事
件,而边用来表示事件之间的因果关系。事理图谱找出了事
件的演化逻辑,从而形成大型的常识事理知识库用来直接刻
画人类行为活动。很多的学者在因果关系抽取上得到了理想
的结果[5-7]。
深度学习是机器学习领域如今最热门的研究方向之一,
它能够模仿人类大脑的活动,使得模式识别很难解决的问题
得到了合理的解决,使得自然语言处理(Natural Language
Processing,NLP)相关技术取得了很大进步。近年来基于深度
神经网络的因果关系抽取方法比较多,主要分为两大类:一类
是基于流水线方式;另一类是基于联合抽取的方式。前者将
抽取任务看作是实体识别和关系分类两个子任务,后者则是
利用联合模型将因果关系三元组直接抽取出来。两者各有利
弊,但是目前还缺乏对整个领域开展深入的梳理和总结。本
文对现有的基于深度学习的因果关系抽取方法进行了总结:
首先,分别对因果关系抽取的基本概念和方法演变进行了简
要介绍,并对常用数据集进行了介绍;接着,对现有的基于深
度学习的两种主要框架分别进行了详细介绍;最后,提出了未
来的研究方向。
文章编号:1001-9081(2021)05-1247-09 DOI:10. 11772/j. issn. 1001-9081. 2020071080
收稿日期:2020⁃07⁃23;修回日期:2020⁃11⁃09;录用日期:2020⁃11⁃17。
基金项目:国家自然科学基金资助项目(61872313);国家重点研发计划重点专项(2017YFB1002300,2018YFC1700302)。
作者简介:王朱君(1996—),男,江苏东台人,硕士研究生,主要研究方向:自然语言处理; 王石(1981—),男,山东博兴人,副研究员,博士,
主要研究方向:语义分析、知识图谱; 李雪晴(1995—),女,江苏泰州人,博士研究生,主要研究方向:自然语言处理; 朱俊武(1972—),男,江
苏江都人,教授,博士,CCF高级会员,主要研究方向:知识工程、本体论。
第 41 卷 计算机应用
1 因果关系抽取简介
因果关系抽取是关系抽取中的一类任务。根据原因事件
和结果事件是否在文本中同时出现,将因果关系分为了隐式
因果(文本中只出现了原因事件或结果事件)和显式因果(文
本中原因事件和结果事件同时出现)。隐式因果关系抽取任
务中缺失的原因事件或结果事件需要根据文本中的知识进行
推理判断。对于显式因果关系,又可以根据原因事件和结果
事件的对应关系,分为一对一(一件原因事件对应一件结果事
件)、一对多(一件原因事件对应多件结果事件)、多对一(多件
原因事件对应一件结果事件)、多对多(多件原因事件对应多
件结果事件)[8]。 1. 1 因果关系抽取的基本概念
因果关系表示客观事件间存在的一种普遍联系。事件的
因果关系主要由原因事件和结果事件两个部分构成。因果关
系抽取任务从描述事件信息的文本中抽取出原因事件和结果
事件,并以结构化的形式将其呈现出来。一般可以将因果关
系抽取分为两个子任务:候选事件对的抽取和因果关系分类。
候选事件对抽取需要对文本中的事件触发词和相关论元进行
定位抽取;关系分类需要对候选事件对进行过滤,找出属于因
果关系的事件对,并确定原因事件和结果事件。
例如,文本“突然地降温使得小明感冒,昨晚去医院了”,
事件检测发现句子中有 3 个事件分别为“降温”“感冒”和“去
医院”,那么形成因果对(降温,感冒)、(感冒,去医院)和(降 温,去医院);接着判断事件对间是否存在因果关系,因此排除
(降温,去医院),抽取出了(降温,感冒)和(感冒,去医院)的因
果关系。 1. 2 因果关系抽取的方法演变
与传统关系分类[9]
不同的是,因果关系抽取的方法主要
分为三种:基于模式匹配的方法、基于模式匹配与机器学习组
合的方法和基于深度学习的方法。 1. 2. 1 基于模式匹配的方法
基于模式的方法利用语义特征、词汇符号特征和自构约
束通过模式匹配进行因果关系的提取。Khoo 等[10]
利用语言
线索和模式匹配从华尔街日报中提取因果知识;Khoo等[11]在
医学领域使用图形模式从医疗数据库中提取因果知识;Girju
等[12]
使用句法模式提取因果关系,然后使用语义约束将候选
对分类为因果对或非因果对;Ittoo等[13]
提出一种基于词性、句
法分析和因果模板的因果对提取方法。完全依赖于模式匹配
规则的方法通常跨域适应性差,在解决特定领域的问题时可
能需要广泛的领域知识。 1. 2. 2 基于模式和机器学习相结合的方法
基于模式和机器学习技术相结合的方法主要以流水线的
方式解决因果关系的抽取任务,将因果关系抽取分为两个子
任务,候选因果对提取和关系分类。首先根据模板或一些线
索词提取可能具有因果关系的候选事件对,然后根据语义特
征和语法特征对候选因果对进行分类筛选出因果对。Girju
等[14]
使用基于因果关系的约束触发词来提取英语文本中的因
果关系;Luo 等[15]
从大规模网络文本语料库中提取因果关系
术语,然后基于点态相互信息的统计度量使用因果线索来度
量网络文本语料之间的因果强度。 1. 2. 3 基于深度学习的方法
由于深度神经网络具有强大的表征学习能力,可以强有
力地捕捉隐含的和模棱两可的因果关系,因此近年来采用深
度学习技术提取因果关系已成为一种流行选择。De Silva
等[16]
使用卷积神经网络(Convolution Neural Network,CNN)对
文本中的因果关系进行分类;Kruengkrai 等[17]
选择使用 CNN
从嘈杂的文本中提取背景知识来分类常识性的因果关系;Li
等[18]
提出了一种面向知识的 CNN,它结合了词汇知识库中的
先验知识进行因果关系分类;Dasgupta 等[19]
还通过基于长短
期记忆(Long Short-Term Memory,LSTM)网络的深层模型,从
语言的角度确定了文本中因果关系的语言表达。 1. 3 常用数据集
基于深度学习的因果关系抽取所使用的数据集有 ACE
2005数据集[20]、SemEval 2010 task 8数据集[21]等。
ACE 由美国国家标准和技术学会(National Institute of
Standards and Technology,NIST)、中 央 情 报 局(Central
Intelligence Agency,CIA)和 国 家 安 全 局(National Security
Agency,NSA)主管,该会议的主要关注点并非是会议本身而
是信息与关系抽取的评测。随着会议影响力的不断提升,语
料数据得到了丰富的扩展。该会议提供已经标注好的多种类
型实体、关系和事件的语料数据集,主要用于事件和关系的抽
取任务中。SemEval 2010 task 8数据集[21]
共包含8 000条训练
数据和 2 717 条测试数据。共有如下 10 种关系:实体-起源
(Entity-Origin)、实体-目的地(Entity-Destination)、原因-结果
(Cause-Effect)、成员-集合(Member-Collection)、信息-主题
(Message-Topic)、产品-生产者(Product-Producer)、部分-整体
(Component-Whole)、仪器-代理商(Instrument-Agency)、内容-
容器(Content-Container)和其他(Other),其中训练集和测试集
中包含的因果关系文本分别占比12. 54%和12. 07%。 2 基于深度学习的因果关系抽取模型
因果关系抽取是自然语言处理(NLP)的重要任务,当前
主要有两类框架来完成此任务:一种是流水线方法,一种是联
合抽取方法。流水线方法中,因果关系抽取任务被划分为两
个步骤:确定句子中的事件触发词及相关论元,根据触发词构
造候选事件对并进行因果关系判别。这两个步骤分别定义为
两个相关的任务:事件检测(Event Detection,ED)和关系分类
(Relation Classification,RC)。如果只需要对已标注事件对进
行分类,则因果关系抽取可以简化为因果关系分类,联合抽取
模型则是将两个子任务统一构建成一个模型,在建模时进一
步利用两个任务间的潜在关联,缓解错误传播问题。 2. 1 基于流水线的因果关系抽取
事件检测任务是自然语言处理中信息获取的一个常见任
务,从非结构化的信息中抽取出事件触发词和相关角色的触
发词论元;关系分类任务则是依据标注好的语料进行事件对
间的相关类型判别。下面是对当前主流的事件检测任务和关
系分类任务模型的详细介绍。 2. 1. 1 基于神经网络的事

 

------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐