【论文笔记】Read + Verify: Machine Reading Comprehension with Unanswerable Questions

概述

针对前人没有验证所抽取的答案是否合理，本篇论文提出了Read + Verify的结构，首先利用无答案阅读器提取候选答案并检测该问题是否无法回答。然后，它利用答案验证器进一步检查预测答案的合法性。一共分为两步：

一个用于提取候选答案和验证无法回答问题的无答案阅读器
一个用于决定提取的候选答案是否合法的答案验证器

细节

无答案阅读器：将有无答案和答案跨度抽取作为同一个任务进行训练，将答案跨度的打分和没有答案的概率进行softmax标准化，计算联合无答案的损失。同时，若无答案的概率超过某个阈值，我们就认为其无答案。（Z是无答案的打分，阿尔法和贝塔是候选答案开始和结束位置的打分）
【论文笔记】Read + Verify: Machine Reading Comprehension with Unanswerable Questions

三种验证结构：
【论文笔记】Read + Verify: Machine Reading Comprehension with Unanswerable Questions

两个辅助损失函数：

独立跨度损失：
将所有问题都当作有答案，计算其跨度的损失函数。（无答案的数据将其plausible_answers作为标准答案）
独立无答案损失
前一个无答案阅读器得到的无答案概率是经过归一化的，有可能被弱化或加强，相对来说不够准确。针对此，通过引入独立的无答案损失增加了对无答案检测的专门预测。

最终的损失是：
【论文笔记】Read + Verify: Machine Reading Comprehension with Unanswerable Questions

参考：
Read + Verify: Machine Reading Comprehension with Unanswerable Questions 论文阅读笔记
 Read + Verify: Machine Reading Comprehension with Unanswerable Questions翻译