模型库 / google/gemma-4-E2B-it

gemma-4-E2B-it

google any-to-any transformers
google/gemma-4-E2B-it
3,396,902
下载量
597
收藏数
10
浏览量
apache-2.0
许可

简介

Hugging Face | GitHub | Launch Blog | Documentation License: Apache 2.0 | Authors: Google DeepMind

模型卡片

许可协议 apache-2.0
框架 transformers
任务 any-to-any

模型配置

模型类型 gemma4
架构 Gemma4ForConditionalGeneration

模型详情

已翻译
Hugging Face |
GitHub |
发布博客 |
文档

许可证: Apache 2.0 | 作者: Google DeepMind

Gemma 是由 Google DeepMind 构建的一系列开放模型。Gemma 4 模型是多模态的,支持文本和图像输入(小型模型支持音频),并生成文本输出。本次发布包括预训练和指令微调两种变体的开放权重模型。Gemma 4 拥有高达 256K token 的上下文窗口,并保持对超过 140 种语言的多语言支持。

Gemma 4 兼具 Dense 和 Mixture-of-Experts (MoE) 架构,非常适合文本生成、编码和推理等任务。该系列模型提供四种不同的尺寸:E2BE4B26B A4B31B。其多样化的尺寸使其能够部署在从高端手机到笔记本电脑和服务器的各种环境中,从而普及最先进 AI 的访问。

Gemma 4 引入了关键的能力和架构进步

  • 推理 – 该系列中的所有模型都被设计为高能力的推理器,具有可配置的思考模式。

  • 扩展的多模态能力 – 处理文本、支持可变宽高比和分辨率的图像(所有模型)、视频和音频(E2B 和 E4B 模型原生支持)。

  • 多样且高效的架构 – 提供不同尺寸的 Dense 和 Mixture-of-Experts (MoE) 变体,以实现可扩展的部署。

  • 针对端侧设备优化 – 较小的模型专为在笔记本电脑和移动设备上高效本地执行而设计。

  • 更大的上下文窗口 – 小型模型拥有 128K 上下文窗口,而中型模型支持 256K。

  • 增强的编码与智能体能力 – 在编码基准测试中取得显著改进,同时支持原生函数调用,赋能高度能力的自主智能体。

  • 原生系统提示支持 – Gemma 4 引入了对 system 角色的原生支持,实现更结构化、更可控的对话。

模型概览

Gemma 4 模型旨在每个尺寸下提供前沿性能,针对从移动和边缘设备(E2B、E4B)到消费级 GPU 和工作站(26B A4B、31B)的部署场景。它们非常适合推理、智能体工作流、编码和多模态理解。

这些模型采用混合注意力机制,将局部滑动窗口注意力与全局注意力交错排列,确保最后一层始终是全局的。这种混合设计提供了轻量级模型的处理速度和低内存占用,同时不牺牲复杂长上下文任务所需的深度感知能力。为了优化长上下文的内存,全局层采用统一的 Keys 和 Values,并应用 Proportional RoPE (p-RoPE)。

Dense 模型

属性 E2B E4B 31B Dense
总参数量 23亿有效参数(含 embedding 为51亿) 45亿有效参数(含 embedding 为80亿) 307亿
层数 35 42 60
滑动窗口 512 tokens 512 tokens 1024 tokens
上下文长度 128K tokens 128K tokens 256K tokens
词表大小 262K 262K 262K
支持的模态 文本、图像、音频 文本、图像、音频 文本、图像
视觉编码器参数量 约1.5亿 约1.5亿 约5.5亿
音频编码器参数量 约3亿 约3亿 无音频

E2B 和 E4B 中的 "E" 代表 "有效" 参数。较小的模型采用逐层嵌入 (PLE) 以最大化端侧部署中的参数效率。PLE 并非向模型添加更多层或参数,而是为每个解码器层提供其自身针对每个 token 的小型 embedding。这些 embedding 表很大,但仅用于快速查找,这就是有效参数量远小于总参数量的原因。

Mixture-of-Experts (MoE) 模型

属性 26B A4B MoE
总参数量 252亿
激活参数量 38亿
层数 30
滑动窗口 1024 tokens
上下文长度 256K tokens
词表大小 262K
专家数量 8 个激活 / 128 个总计及 1 个共享
支持的模态 文本、图像
视觉编码器参数量 约5.5亿

26B A4B 中的 "A" 代表 "激活参数",与模型包含的总参数形成对比。

标签

gemma4 image-text-to-text base_model:google/gemma-4-E2B base_model:finetune:google/gemma-4-E2B license:apache-2.0 eval-results endpoints_compatible deploy:azure

操作


详细信息

厂商
google
任务
any-to-any
框架
transformers
模型类型
gemma4
许可(HF)
apache-2.0