Gemma模型家族在Google I/O上揭晓：从移动设备到手语翻译

Gemma模型家族在Google I/O上揭示重大升级

在2025年Google I/O开发者大会上，谷歌推出了轻量级多模态模型Gemma3n，标志着Gemma模型家族的重大扩展，新增了针对医疗和无障碍场景的MedGemma和SignGemma。Gemma3n专为智能手机、笔记本电脑和平板电脑等低功耗设备设计，能够高效处理文本、音频、图像和视频。谷歌报告称，该模型可以在内存少于2GB的设备上顺畅运行，展示了其高效的架构。

Gemma3n现已开放开发者预览，并与Gemini Nano共享其底层架构。谷歌强调，Gemma3n的轻量级和隐私中心特性使其成为离线AI应用的理想选择。与依赖云基础设施的大型模型不同，像Gemma3n这样的本地AI模型提供更快的响应时间、更低的成本和增强的数据保护，特别是在隐私敏感的环境中。

在医疗领域，谷歌通过其健康AI开发者基金会推出了MedGemma。这套开放模型专注于健康相关的文本和图像分析，使开发者能够创建更准确的医疗图像识别和医疗记录处理的AI工具。此外，谷歌还宣布即将推出的SignGemma模型，专门用于手语识别，将美国手语（ASL）翻译成英文文本。该模型旨在帮助开发者创建更易于聋人和听力障碍者沟通的工具，谷歌声称这是“迄今为止最强大的手语理解模型”。

尽管一些开发者对商业使用的非标准许可条款表示担忧，但Gemma模型系列仍获得了开发者社区的热烈支持，下载量已超过数千万。随着Gemma模型家族的不断壮大，谷歌正在推动开放AI模型在本地隐私保护、医疗和无障碍方面的应用，为更广泛的采用铺平道路。

通过探索我们的每日AI新闻部分，保持对AI最新动态的关注，我们提供行业趋势和创新AI产品应用的见解。

, 查看来源