Skip to main content
Enrollment open until November 15 for the 5th edition of the Master's in AI for Healthcare Professionals5th Edition · 60 ECTS · UCAM · Starts October 15 · Enroll by November 15Enrollment open until November 15 for the 5th edition of the Master's in AI for Healthcare Professionals5th Edition · 60 ECTS · UCAM · Starts October 15 · Enroll by November 15Enrollment open until November 15 for the 5th edition of the Master's in AI for Healthcare Professionals5th Edition · 60 ECTS · UCAM · Starts October 15 · Enroll by November 15Enrollment open until November 15 for the 5th edition of the Master's in AI for Healthcare Professionals5th Edition · 60 ECTS · UCAM · Starts October 15 · Enroll by November 15
IAcademia
Noticias

Gemma 4 12B, la IA multimodal de Google que corre en tu portátil

Federico Juárez
Federico JuárezDirector de Tecnología

Google DeepMind presentó el 3 de junio de 2026 Gemma 4 12B, un modelo abierto de unos 12.000 millones de parámetros que entiende texto, imagen, audio y vídeo. Lo llamativo no es solo lo que hace, sino dónde lo hace. Corre entero en local en un portátil con 16GB de RAM, sin pasar por la nube.

Qué ha presentado Google

Gemma 4 12B estrena una arquitectura unificada "encoder-free". En vez de usar codificadores separados para imagen y sonido, el audio crudo y los fragmentos de imagen entran directos al modelo. Eso reduce la latencia y la memoria que necesita.

Es el primer modelo de tamaño medio que procesa audio de forma nativa. Puede transcribir una grabación y hacer diarización, es decir, distinguir quién habla en cada momento, sin necesidad de una herramienta externa de reconocimiento de voz.

Las cifras que comparte Google ayudan a situarlo:

  • Tamaño y memoria: unos 12.000 millones de parámetros que funcionan en 16GB de RAM, y en torno a 8GB con cuantización a 4 bits.
  • Rendimiento: según Google, se acerca al de su modelo 26B con aproximadamente la mitad de memoria. En la prueba MMLU Pro marca un 77,2%, por encima del 67,6% de Gemma 3 27B.
  • Licencia Apache 2.0: uso, modificación y despliegue comercial libres.
  • Acceso: disponible en Hugging Face, Kaggle, LM Studio, Ollama y Google Cloud.

Puedes leer el anuncio completo en el blog oficial de Google y consultar el model card en Hugging Face.

Por qué un modelo "en local" importa en sanidad

Para un profesional de la salud, la noticia no es el modelo, es dónde se ejecuta. Cuando la IA corre en el propio equipo, el dato clínico no sale de la consulta. No viaja a un servidor externo, no se sube a la nube de un tercero.

Eso encaja de lleno con el RGPD y la confidencialidad del dato de salud. Tareas como transcribir una consulta, ordenar las notas de una sesión o leer un informe podrían hacerse en el portátil de la clínica, sin compartir voz ni texto del paciente con nadie.

La licencia Apache 2.0 añade otra capa. Permite integrar el modelo dentro de software médico propio sin restricciones de uso. Y el requisito de 16GB de RAM pone esta capacidad al alcance de un centro pequeño, no solo de un gran hospital con presupuesto de nube.

Conviene marcar el límite. Gemma 4 12B no es un producto sanitario certificado ni sustituye el criterio clínico. Es una pieza de infraestructura que cambia lo que una clínica puede permitirse hacer con IA sin comprometer la privacidad de sus pacientes. Esa frontera, la de mover la IA al sitio donde están los datos en vez de mover los datos a la IA, es la que conviene seguir de cerca.

IAal día

Your weekly dose of artificial intelligence applied to healthcare. News, tools and real cases directly in your inbox.

+3,000 healthcare professionals
AI in diagnosticsToolsClinical casesRegulationDigital health

Subscribe for free

Every week in your email. No spam.