NEWSQA: A MACHINE COMPREHENSION DATASET

NEWSQA: A MACHINE COMPREHENSION DATASET

一个新的阅读理解数据集,呵呵呵 昨天刚刚出来一个微软的,这立马又出来了一个

blob.png

blob.png

可以看到这个和昨天那个微软的MACRO如出一辙


文章都是来源于CNN,而且数据量比较大,具体的东西,可以参照他们的网站 datasets.maluuba.com/NewsQA


这里主要要介绍两点

1)他们提出问题和回答问题的是两套人,而且提出问题的人是只能看到CNN的一个标题或者summary的东西

2)回答问题的是另一套人,所以我们可以看到这个提问题的人反正不是他回答,所以提出的问题会很难

几个数据的统计

blob.png

对于问句的难度,作者也把他分成了几类

blob.png

可以看到第4个就是多句子的推理

blob.png

---------------------------------------------

实验:

最后发现其实这个模型还是很大的,以前我的模型都比较小,这个可能会有点问题。


blob.png

留下您的评论

回复列表:

By王炳宁 on Nov. 30, 2016 | 类别 MC

关于本站