Gemma 模型家族在 Google I/O 上揭晓：从移动设备到手语翻译

Gemma 模型家族在 Google I/O 上揭示重大升级

在 2025 年的 Google I/O 开发者大会上，谷歌推出了轻量级多模态模型 Gemma3n，标志着 Gemma 模型家族的重大扩展，新增了针对医疗和无障碍场景的 MedGemma 和 SignGemma。Gemma3n 旨在为智能手机、笔记本电脑和平板电脑等低功耗设备提供服务，能够高效处理文本、音频、图像和视频。谷歌报告称，该模型可以在内存少于 2GB 的设备上顺畅运行，展示了其高效的架构。

Gemma3n 现已开放开发者预览，并与 Gemini Nano 共享其底层架构。谷歌强调，Gemma3n 的轻量级和隐私中心特性使其成为离线 AI 应用的理想选择。与依赖云基础设施的大型模型不同，像 Gemma3n 这样的本地 AI 模型提供更快的响应时间、更低的成本以及增强的数据保护，特别是在隐私敏感的环境中。

在医疗领域，谷歌通过其健康 AI 开发者基金会推出了 MedGemma。这套开放模型专注于健康相关的文本和图像分析，使开发者能够创建更准确的医疗图像识别和医疗记录处理的 AI 工具。此外，谷歌还宣布即将推出的 SignGemma 模型，专门设计用于手语识别，将美国手语（ASL）翻译成英语文本。该模型旨在帮助开发者创建更易于沟通的工具，以服务于聋人和听力受损社区，谷歌声称这是“迄今为止最强大的手语理解模型”。

尽管一些开发者对商业使用的非标准许可条款表示担忧，Gemma 模型系列仍然获得了开发者社区的热烈支持，下载量超过数千万。随着 Gemma 模型家族的不断壮大，谷歌正在推动开放 AI 模型在本地隐私保护、医疗和无障碍领域的应用，为更广泛的采用铺平道路。

通过探索我们的每日 AI 新闻部分，保持对 AI 最新动态的关注，我们提供行业趋势和创新 AI 产品应用的见解。

, 查看来源