谷歌最强开源大模型 · 手机到桌面全覆盖
🔥 Apache 2.0 开源 · 4亿+下载Gemma 4 是 Google DeepMind 基于 Gemini 3 研究和技术打造的最新开源模型家族,旨在最大化每参数智能表现。它提供 4 种规格(E2B、E4B、26B MoE、31B Dense),从手机到桌面设备全覆盖,支持 140+ 语言和多模态(文本/图片/视频/音频),采用 Apache 2.0 开源协议。
访问 aistudio.google.com,登录你的 Google 账号。
在模型选择器中选择 gemma-4-31b-it(31B)或 gemma-4-26b-it(26B MoE),即可开始对话。
访问 ollama.com 下载安装 Ollama(支持 macOS / Windows / Linux)。
打开终端,运行以下命令即可开始对话:
# 运行 26B MoE(推荐,速度快)
ollama run gemma4:26b
# 运行 31B Dense(质量最高)
ollama run gemma4:31b
# 运行 E4B(轻量级,适合低配设备)
ollama run gemma4:e4b
模型下载完成后自动启动交互式对话,支持中文、英文等 140+ 语言。也可通过 API 方式调用:http://localhost:11434/api/chat
从 Hugging Face、Kaggle 或 LM Studio 下载 Gemma 4 模型权重,使用你喜欢的推理框架加载运行。
E2B:手机/IoT 设备,离线运行;E4B:手机/平板,更强推理;26B MoE:笔记本/台式机,3.8B 激活参数极速推理(推荐);31B Dense:台式机/服务器,输出质量最高。
E2B/E4B 可在手机上直接运行;26B MoE 推荐 16GB+ 内存/显存;31B Dense 推荐 24GB+ 显存或使用量化版本(如 Q4_K_M)在 16GB 显卡上运行。
可以!Gemma 4 采用 Apache 2.0 开源协议,允许个人和商业用途,无需付费。
原生支持 140+ 语言,包括中文、英文、日文、韩文、西班牙语、法语等主流语言,能理解文化语境而非简单翻译。