Foresight News 消息,谷歌发布多模态模型 Gemma 4。Gemma 4 可用于处理文本和图片输入(小型模型支持音频输入)以及生成文本输出。此版本包含预训练和指令调优的开放权重模型。Gemma 4 的上下文窗口最多可容纳 25.6 万个 token,并支持 140 多种语言。Gemma 4 同时采用密集型架构和混合专家(MoE)架构,适合文本生成、编码和推理等任务。这些模型有四种不同的规模:E2B、E4B、26B A4B 和 31B,可部署在从手机到笔记本电脑和服务器的各种环境中。

