模型库 / google-t5/t5-base

t5-base

google-t5 translation transformers en fr ro
google-t5/t5-base
2,535,852
下载量
774
收藏数
11
浏览量
apache-2.0
许可

简介

1. 模型详情 2. 用途 3. 偏见、风险与局限性 4. 训练详情 5. 评估 6. 环境影响 7. 引用 8. 模型卡片作者 9. 如何开始使用该模型

模型卡片

许可协议 apache-2.0
语言
en fr ro de
任务 translation
数据集
c4
summarization translation

模型配置

模型类型 t5
架构 T5ForConditionalGeneration

模型详情

已翻译

T5 Base 模型卡片

模型图片

目录

  1. 模型详情
  2. 用途
  3. 偏见、风险与局限性
  4. 训练详情
  5. 评估
  6. 环境影响
  7. 引用
  8. 模型卡片作者
  9. 如何开始使用该模型

模型详情

模型描述

Text-To-Text Transfer Transformer (T5) 的开发者在博客中写道:

通过 T5,我们提出将所有 NLP 任务重新定义为统一的 text-to-text 格式,其中输入和输出始终是文本字符串,这与 BERT 风格的模型(只能输出类标签或输入中的某个片段)形成对比。我们的 text-to-text 框架使我们能够在任何 NLP 任务上使用相同的模型、损失函数和超参数。

T5-Base 是一个拥有 2.2 亿参数的 checkpoint。

用途

直接使用与下游使用

开发者在博客文章中写道,该模型:

我们的 text-to-text 框架使我们能够在任何 NLP 任务上使用相同的模型、损失函数和超参数,包括机器翻译、文档摘要、问答和分类任务(例如情感分析)。我们甚至可以通过训练 T5 预测数字的字符串表示(而非数字本身),将其应用于回归任务。

详见博客文章研究论文

超出范围的使用

需要更多信息。

偏见、风险与局限性

需要更多信息。

建议

需要更多信息。

训练详情

训练数据

该模型在 Colossal Clean Crawled Corpus (C4) 上进行预训练,该数据集与 T5 在同一篇研究论文中开发和发布。

该模型在无监督任务(1.)和有监督任务(2.)的多任务混合上进行预训练。
其中,以下数据集被用于(1.)和(2.):

  1. 用于无监督去噪目标的数据集:

  2. C4

  3. Wiki-DPR

  4. 用于有监督 text-to-text 语言建模目标的数据集

  5. 句子可接受性判断

  6. CoLA Warstadt 等人,2018
  7. 情感分析
  8. SST-2 Socher 等人,2013
  9. 释义/句子相似度
  10. MRPC Dolan 和 Brockett,2005
  11. STS-B Cer 等人,2017
  12. QQP Iyer 等人,2017
  13. 自然语言推理
  14. MNLI Williams 等人,2017
  15. QNLI Rajpurkar 等人,2016
  16. RTE Dagan 等人,2005
  17. CB De Marneff 等人,2019
  18. 句子补全
  19. COPA Roemmele 等人,2011
  20. 词义消歧
  21. WIC Pilehvar 和 Camacho-Collados,2018
  22. 问答
  23. MultiRC Khashabi 等人,2018
  24. ReCoRD [Zhang 等人,2018](https://ar

标签

tf jax rust t5 text2text-generation summarization en fr

操作


详细信息

厂商
google-t5
任务
translation
框架
transformers
模型类型
t5
许可(HF)
apache-2.0
语言
en, fr, ro, de