Gemma 模型家族在 Google I/O 上揭晓:从移动设备到手语翻译
Gemma 模型家族在 Google I/O 上揭示重大升级
在 2025 年的 Google I/O 开发者大会上,谷歌推出了轻量级多模态模型 Gemma3n,标志着 Gemma 模型家族的重大扩展,新增了针对医疗和无障碍场景的 MedGemma 和 SignGemma。Gemma3n 旨在为智能手机、笔记本电脑和平板电脑等低功耗设备提供服务,能够高效处理文本、音频、图像和视频。谷歌报告称,该模型可以在内存少于 2GB 的设备上顺畅运行,展示了其高效的架构。
Gemma3n 现已开放开发者预览,并与 Gemini Nano 共享其底层架构。谷歌强调,Gemma3n 的轻量级和隐私中心特性使其成为离线 AI 应用的理想选择。与依赖云基础设施的大型模型不同,像 Gemma3n 这样的本地 AI 模型提供更快的响应时间、更低的成本以及增强的数据保护,特别是在隐私敏感的环境中。
在医疗领域,谷歌通过其健康 AI 开发者基金会推出了 MedGemma。这套开放模型专注于健康相关的文本和图像分析,使开发者能够创建更准确的医疗图像识别和医疗记录处理的 AI 工具。此外,谷歌还宣布即将推出的 SignGemma 模型,专门设计用于手语识别,将美国手语(ASL)翻译成英语文本。该模型旨在帮助开发者创建更易于沟通的工具,以服务于聋人和听力受损社区,谷歌声称这是“迄今为止最强大的手语理解模型”。
尽管一些开发者对商业使用的非标准许可条款表示担忧,Gemma 模型系列仍然获得了开发者社区的热烈支持,下载量超过数千万。随着 Gemma 模型家族的不断壮大,谷歌正在推动开放 AI 模型在本地隐私保护、医疗和无障碍领域的应用,为更广泛的采用铺平道路。
通过探索我们的每日 AI 新闻部分,保持对 AI 最新动态的关注,我们提供行业趋势和创新 AI 产品应用的见解。
, 查看来源
发现最新的技术创新,提升您的生产力,使用尖端解决方案了解更多,并探索为用户构建的 AI 工具,在我们的 AI 工具目录 中,您可以探索智能搜索和 AI 助手等功能,以找到适合您的完美工具。






