Gemma模型家族在Google I/O上揭晓:从移动设备到手语翻译
Gemma模型家族在Google I/O上揭示重大升级
在2025年Google I/O开发者大会上,谷歌推出了轻量级多模态模型Gemma3n,标志着Gemma模型家族的重大扩展,新增了针对医疗和无障碍场景的MedGemma和SignGemma。Gemma3n专为智能手机、笔记本电脑和平板电脑等低功耗设备设计,能够高效处理文本、音频、图像和视频。谷歌报告称,该模型可以在内存少于2GB的设备上顺畅运行,展示了其高效的架构。
Gemma3n现已开放开发者预览,并与Gemini Nano共享其底层架构。谷歌强调,Gemma3n的轻量级和隐私中心特性使其成为离线AI应用的理想选择。与依赖云基础设施的大型模型不同,像Gemma3n这样的本地AI模型提供更快的响应时间、更低的成本和增强的数据保护,特别是在隐私敏感的环境中。
在医疗领域,谷歌通过其健康AI开发者基金会推出了MedGemma。这套开放模型专注于健康相关的文本和图像分析,使开发者能够创建更准确的医疗图像识别和医疗记录处理的AI工具。此外,谷歌还宣布即将推出的SignGemma模型,专门用于手语识别,将美国手语(ASL)翻译成英文文本。该模型旨在帮助开发者创建更易于聋人和听力障碍者沟通的工具,谷歌声称这是“迄今为止最强大的手语理解模型”。
尽管一些开发者对商业使用的非标准许可条款表示担忧,但Gemma模型系列仍获得了开发者社区的热烈支持,下载量已超过数千万。随着Gemma模型家族的不断壮大,谷歌正在推动开放AI模型在本地隐私保护、医疗和无障碍方面的应用,为更广泛的采用铺平道路。
通过探索我们的每日AI新闻部分,保持对AI最新动态的关注,我们提供行业趋势和创新AI产品应用的见解。
, 查看来源
发现最新的技术创新,利用尖端解决方案提升您的生产力。了解更多并探索为用户构建的AI工具,访问我们的AI工具目录,在这里您可以探索智能搜索和AI助手等功能,以找到适合您的完美工具。






