NEWSQA: A MACHINE COMPREHENSION DATASET
一个新的阅读理解数据集,呵呵呵 昨天刚刚出来一个微软的,这立马又出来了一个
可以看到这个和昨天那个微软的MACRO如出一辙
文章都是来源于CNN,而且数据量比较大,具体的东西,可以参照他们的网站 datasets.maluuba.com/NewsQA
这里主要要介绍两点
1)他们提出问题和回答问题的是两套人,而且提出问题的人是只能看到CNN的一个标题或者summary的东西
2)回答问题的是另一套人,所以我们可以看到这个提问题的人反正不是他回答,所以提出的问题会很难
几个数据的统计
对于问句的难度,作者也把他分成了几类
可以看到第4个就是多句子的推理
---------------------------------------------
实验:
最后发现其实这个模型还是很大的,以前我的模型都比较小,这个可能会有点问题。
回复列表: