概述
针对前人没有验证所抽取的答案是否合理,本篇论文提出了Read + Verify的结构,首先利用无答案阅读器提取候选答案并检测该问题是否无法回答。然后,它利用答案验证器进一步检查预测答案的合法性。一共分为两步:
- 一个用于提取候选答案和验证无法回答问题的无答案阅读器
- 一个用于决定提取的候选答案是否合法的答案验证器
细节
无答案阅读器:将有无答案和答案跨度抽取作为同一个任务进行训练,将答案跨度的打分和没有答案的概率进行softmax标准化,计算联合无答案的损失。同时,若无答案的概率超过某个阈值,我们就认为其无答案。(Z是无答案的打分,阿尔法和贝塔是候选答案开始和结束位置的打分)
三种验证结构:
两个辅助损失函数:
- 独立跨度损失:
将所有问题都当作有答案,计算其跨度的损失函数。(无答案的数据将其plausible_answers作为标准答案) - 独立无答案损失
前一个无答案阅读器得到的无答案概率是经过归一化的,有可能被弱化或加强,相对来说不够准确。针对此,通过引入独立的无答案损失增加了对无答案检测的专门预测。
最终的损失是:
参考:
Read + Verify: Machine Reading Comprehension with Unanswerable Questions 论文阅读笔记
Read + Verify: Machine Reading Comprehension with Unanswerable Questions翻译