Bert几个数据集的概念Cola、MRPC、XNLI、MNLI等

一直在几个数据集之间犯晕,
【关于 Bert 源码解析III 之 微调 篇 】 那些的你不知道的事-技术圈
GLUE部分基准数据集介绍:RTE、MRPC、SST-2、QNLI、MNLI、QQP_skysys的研究小屋 -CSDN博客
GLUE共有九个任务,分别是CoLA、SST-2、MRPC、STS-B、QQP、MNLI、QNLI、RTE、WNLI。如下图图2所示,可以分为三类,分别是单句任务,相似性和释义任务
其中做了详细说明,我提取一下概念:
一、 句子对分类任务
1、Xnli :2个句子的关系推理,可以判断为一句话和另外一个话的关系;
目标:读取两句话,并判定两者间的关系是否为“蕴含”(Entailment)、“矛盾”(Contradict)或“中性”(Neutral)
return label()
2、RTE:推理的2分类任务
RTE(The Recognizing Textual Entailment datasets,识别文本蕴含数据集)
3、MRPC(The Microsoft Research Paraphrase Corpus,微软研究院释义语料库),相似性和释义任务,是一个判断0、1的任务,也可以理解为二分类,但是这个是2句话是否类似或者一致。以说明句子对中的句子在语义上是否等效。
4、MNLIMNLI(The Multi-Genre Natural Language Inference Corpus, 多类型自然语言推理数据库),自然语言推断任务,3分类任务,有先后句子关系;任务:句子对,一个前提,一个是假设。前提和假设的关系有三种情况:蕴含(entailment),矛盾(contradiction),中立(neutral)。句子对三分类问题。bert作者希望用SNLI作为辅助训练
5、QQP(The Quora Question Pairs, Quora问题对数集),相似性和释义任务,是社区问答网站Quora中问题对的集合。任务是确定一对问题在语义上是否等效,2分类任务;句子对,等效、不等效两种情况。
6、STS-B语义文本相似性基准(The Semantic Textual Similarity Benchmark)是从新闻头条和其他来源提取的句子对的集合。它们用1到5的分数来标注,表示这两个句子在语义上有多相似。任务是2个句子的相似度1-5
二、单句子分类任务
7、SST-2(The Stanford Sentiment Treebank,斯坦福情感树库),单句子分类任务,包含电影评论中的句子和它们情感的人类注释。也是一个2分类任务,0,1
8、Cola :二分类,比如单条文章的情感分析
return ["0", "1"]
三、问答任务
9、SQuAD v1.1 ,V2.0 斯坦福问答数据集(Stanford Question Answering Dataset)是10万个问题/答案对的集合。给定一个问题以及Wikipedia中包含答案的段落,任务是预测段落中的答案文本范围(start,end)
- 简单问题:对答案的简单匹配和抽取(SUQAD1.0)
- 复杂问题:加入推理(SQUAD2.0的部分)
10、QNLI(Qusetion-answering NLI,问答自然语言推断),自然语言推断任务,2个语句的2分类任务,判断问题(question)和句子(sentence,维基百科段落中的一句)是否蕴含,蕴含和不蕴含,二分类
四、单句子标注任务
单句子标注任务也叫命名实体识别任务(Named Entity Recognition),简称NER
NLP的四大类任务
(1)序列标注:分词、实体识别、语义标注……
(2)分类任务:文本分类、情感计算……
(3)句子关系判断:entailment、QA、自然语言推理
(4)生成式任务:机器翻译、文本摘
Bert主要模型:
MNLI:蕴含关系推断
QQP:问题对是否等价
QNLI:句子是都回答问句
SST-2:情感分析
CoLA:句子语言性判断
STS-B:语义相似
MRPC:句子对是都语义等价
RTE:蕴含关系推断
WNLI:蕴含关系推断




更多推荐
所有评论(0)