Famille de modèles Gemma dévoilée lors de Google I/O : de la traduction mobile à la langue des signes
La famille de modèles Gemma dévoile des mises à jour majeures lors de Google I/O
Lors de la conférence des développeurs Google I/O 2025, Google a présenté le modèle multimodal léger, Gemma3n, marquant une expansion significative de la famille de modèles Gemma avec l'ajout de MedGemma et SignGemma, adaptés aux scénarios de santé et d'accessibilité. Conçu pour des appareils à faible consommation d'énergie tels que les smartphones, les ordinateurs portables et les tablettes, Gemma3n est capable de traiter efficacement du texte, de l'audio, des images et de la vidéo. Google rapporte que ce modèle peut fonctionner sans problème sur des appareils disposant de moins de 2 Go de RAM, mettant en avant son architecture efficace.
Gemma3n est désormais disponible en aperçu pour les développeurs et partage son architecture sous-jacente avec Gemini Nano. Google souligne que les caractéristiques légères et axées sur la confidentialité de Gemma3n en font un choix idéal pour les applications d'IA hors ligne. Contrairement aux modèles plus grands qui dépendent de l'infrastructure cloud, les modèles d'IA locaux comme Gemma3n offrent des temps de réponse plus rapides, des coûts réduits et une meilleure protection des données, en particulier dans des contextes sensibles à la vie privée.
Dans le secteur de la santé, Google a lancé MedGemma via sa Health AI Developer Foundation. Cette suite de modèles ouverts se concentre sur l'analyse de texte et d'images liées à la santé, permettant aux développeurs de créer des outils d'IA plus précis pour la reconnaissance d'images médicales et le traitement des dossiers médicaux. De plus, Google a annoncé le modèle SignGemma à venir, spécifiquement conçu pour la reconnaissance de la langue des signes, qui traduit la langue des signes américaine (ASL) en texte anglais. Ce modèle vise à aider les développeurs à créer des outils de communication plus accessibles pour la communauté des sourds et malentendants, et Google affirme qu'il s'agit du "modèle de compréhension de la langue des signes le plus puissant à ce jour."
Malgré certaines préoccupations parmi les développeurs concernant l'utilisation commerciale en raison de conditions de licence non standard, la série de modèles Gemma a reçu un soutien enthousiaste de la part de la communauté des développeurs, avec des téléchargements dépassant les dizaines de millions. Alors que la famille de modèles Gemma continue de croître, Google fait progresser l'application des modèles d'IA ouverts dans la protection de la vie privée locale, la santé et l'accessibilité, ouvrant la voie à une adoption plus large.
Restez informé des dernières actualités en IA en explorant notre section quotidienne d'actualités sur l'IA, où nous fournissons des informations sur les tendances de l'industrie et les applications innovantes de produits d'IA.
Découvrez les dernières innovations technologiques et améliorez votre productivité avec des solutions à la pointe de la technologie. En savoir plus et explorer les outils d'IA conçus pour les utilisateurs dans notre Répertoire d'outils IA, où vous pouvez explorer des fonctionnalités telles que la recherche intelligente et les assistants IA pour trouver l'outil parfait pour vous.





