近日,云从科技和上海交通大学在自然语言处理领域取得重大突破,在卡内基-梅隆大学发起的大型深层阅读理解任务数据集race数据集上夺得魁首,并成为超过人类排名的模型。
云从科技与上海交通大学开创了一种阅读信息匹配机制——dcmn模型,使机器的正确率达到72.1%,较之前结果(67.9%)提高了4.2个百分点,并在高中测试题部分超越人类69.4%的成绩。
有种题型叫“阅读理解”
不管是中文、英语还是任意其他语言,阅读理解都算得上是难的题型之一,需要信息收集、知识储备、逻辑推理、甚至还要融会贯通的主观作答。
微软创始人比尔·盖茨曾经表示,“语言理解是人工智能领域皇冠上的明珠”。
机器阅读理解,是指机器通过阅读和理解大量文字,有效整理和总结出人类所需要的信息。
按照人工智能技术发展路径,在机器视觉、语音识别等智能感知技术在性能上趋于饱和之后,下一个人工智能的突破就是自然语言处理等认知决策技术。技术上形成从智能感知到认知决策的闭环,在机器上体现为会理解、会思考、会分析决策,人机交互方式更加便捷,将对各行各业将产生颠覆式创新。
例如为证券投资提供各种分析数据,进行金融风险分析、欺诈识别;在社交软件、搜索引擎辅助文字审阅和信息查找;还可以帮助医生检索和分析医学资料、辅助诊断等等。
race数据集
race数据集(reading comprehension dataset collected from english examinations)是一个来源于中学考试题目的大规模阅读理解数据集,包含了大约28000个文章以及近100000个问题。
它的形式类似于英语考试中的阅读理解(选择题),给定一篇文章,通过阅读并理解文章(passage),针对提出的问题(question)从选项中选择正确的答案(answers)。
race数据集的难点在于,该题型的正确答案并不一定直接体现在文章中,只能从语义层面深入理解文章,通过分析文中线索并基于上下文推理,选出正确答案。
相对以往的抽取类阅读理解,算法要求更高,被认为是“深度阅读理解”。
dcmn模型
针对这种“深度阅读理解”,云从科技与上海交通大学开创了一种p、q、与a之间的匹配机制,称为dual co-matching network(简称dcmn),并基于这种机制探索性的研究了p、q、与a的各种组合下的匹配策略。
1、dcmn匹配机制
以p与q之间的匹配为例:
本图为p与q之间的dcmn匹配框架
云从科技和上海交大使用目前nlp新的研究成果bert分别为p和q中的每一个token进行编码。基于bert的编码,可以得到的编码是一个包含了p和q中各自上下文信息的编码,而不是一个固定的静态编码,如上图中hp与hq;
其次,通过attention的方式,实现p和q的匹配。具体来讲,是构建p中的每一个token在q中的attendances,即question-aware的passage,如上图中mp。这样得到的每一个p的token编码,包含了与question的匹配信息;
为了充分利用bert带来的上下文信息,以及p与q匹配后的信息,将p中每个token的bert编码hp,与p中每个token与q匹配后的编码mp进行融合, 对hp和mp进行了元素减法及乘法操作,通过一个激活函数,得到了p与q的终融合表示,图中表示为spq;
后通过maxpooling操作得到cpq,l维向量,用于后的loss计算。
2、各种匹配策略研究
除了p与q之间的匹配之外,还可以有q与a、p与a之间的匹配,以及不同匹配得到的匹配向量间的组合,这些不同的匹配与组合构成了不同的匹配策略。对七种不同的匹配策略分别进行了试验,以找到更加合适的匹配策略,分别是:
[p_q; p_a; q_a], [p_q; p_a], [p_q; q_a], [p_a; q_a], [pq_a], [p_qa], [pa_q]
“pa”表示先将p和a连接为一个序列,再参与匹配,“pq”与“qa”同理。符号“[ ; ]”表示将多种匹配的结果组合在一起。
[p_q; p_a; q_a]模式下的模型架构
7种不同策略经试验后,得出采用pq_a的匹配策略,即先将p与q连接,然后与a匹配,无论是在初中题目(race-m)、高中题目(race-h)还是整体(race),都得到了更优的结果。
虽然目前机器在一些阅读理解数据集上的水平已经超过了人类,但这并不能表明“机器打败了人类”,对于自然语言处理、对于人工智能,我们仍有一大步需要前进。
如何开五金店,开五金店需注意哪些风险
信百诺告诉您何为加速寿命试验
EGE接近开关IGMF系列产品性能特点介绍
防爆电子秤的栏栅断开怎么处理?
IFM易福门电磁阀AC5271常见故障排除方法
机器阅读理解超越人类 云从刷新自然语言处理新纪录
防爆软管厂家的品质与服务哪个重要?
电动调节阀的六大作用你知道几个?
试验机的应用范围及维修保养
原来这就是固定源voc在线监测系统的检测对象啊!
桥梁护栏焊接要点及注意事项
沥青防水卷材拉伸性能试验要求
衬里截止阀的工作原理及用途
土壤水分对土壤的影响
锥形过滤器特点与规范
扬尘在线监测系统的重要的组成部分介绍
罗茨鼓风机隔音罩
颗粒料螺旋加料输送机
久用的日本SMC电磁阀,如何进行研磨以确保良好的密封性
超临界流体色谱利用超临界流体作为移动相进行样品分离