Semi-Supervised QA with Generative Domain-Adaptive Nets 然后我们看看这个生成式的模型是什么但是这样训练出来的有一个问题,然后在用这个G产生的样本来训练,也就是这个样本是生成的也就是这样的产生的一个样本,注意那里的label 子啊第一个里面是d_true 在第二个里面是d_gen 也就是D知道这个样本是来自生成出来的,最后再训练这个生成式模型,但是这样产生的一个样本,是真正的(Squad)还是模型产生的(翻译出来的),利用了很大的外部资源-主要是利用了外 By 王炳宁 on Feb. 11, 2017, 7:56 p.m.
GATED-ATTENTION READERS FOR TEXT COMPREHENSION 蓝色的是document的GRU,两个是不同的下图是参数最后实验里面K=3, , By 王炳宁 on Dec. 20, 2016, 3:23 p.m.
NEWSQA: A MACHINE COMPREHENSION DATASET 而且提出问题的人是只能看到CNN的一个标题或者summary的东西2)回答问题的是另一套人,所以提出的问题会很难几个数据的统计,这立马又出来了一个可以看到这个和昨天那个微软的MACRO如出一辙文章都是来源于CNN,所以我们可以看到这个提问题的人反正不是他回答,可以参照他们的网站datasets.maluuba.com/NewsQA这里主要要介绍两点1)他们提出问题和回答问题的是两套人,而且数据量比 By 王炳宁 on Nov. 30, 2016, 12:23 p.m.
MS MARCO: A Human Generated MAchine Reading COmprehension Dataset 现在只有10w这个文章发在NIPS2016 但是到现在数据都没放出,现有的阅读理解的一些问题1)One characteristic in most,this dataset is unique in the sense that (a) all questions are real user queries,也可能是不可以回答的,但是实际上我们需要好几句话才能回答一个问题,of the exis By 王炳宁 on Nov. 29, 2016, 10:21 a.m.