✨︎ Resumen (TL;DR):
- Google estrena Nano Banana 2 Lite para generar imágenes de 1K en cuatro segundos a un costo de 0.034 dólares.
- Gemini Omni Flash llega a desarrolladores para generar y editar video con audio nativo por 0.10 dólares por segundo.
- Empresas como Adobe, Figma y WPP ya integran estos nuevos modelos en sus herramientas creativas.
Este 30 de junio de 2026, Google sacudió el sector de la inteligencia artificial al presentar Nano Banana 2 Lite, un generador de imágenes de alta velocidad, y habilitar el acceso de desarrolladores a Gemini Omni Flash para la creación y edición de video. Con esta doble propuesta, la compañía busca liderar la producción de contenido visual a gran escala frente a rivales como OpenAI y Microsoft.
Nano Banana 2 Lite es un modelo de generación de imágenes que produce archivos en resolución 1K en solo cuatro segundos. Identificado en código como gemini-3.1-flash-lite-image, este motor ofrece un costo de 0.034 dólares por imagen y llega para reemplazar de manera directa al modelo Nano Banana de la generación anterior.
La herramienta ya está disponible a través de Google AI Studio, la API de Gemini y Gemini Enterprise Agent Platform. Próximamente, Google llevará esta tecnología a usuarios generales mediante Google Fotos, Google Ads, Stitch, Google Flow y el Buscador.
Además, NotebookLM usará este modelo para crear Short Video Overviews. Estos serán resúmenes en formato vertical de 60 segundos con voz y animaciones que enriquecerán las herramientas de investigación en las semanas siguientes.

El reto frente a OpenAI y Microsoft
Aunque Google prioriza la velocidad y la eficiencia de costos con este lanzamiento, las evaluaciones de rendimiento muestran un panorama competitivo complejo. En las pruebas de laboratorio de Google basadas en el puntaje Elo, Nano Banana 2 Lite sumó 1251 puntos en generación de texto a imagen, superando los 1151 de la versión previa.
Sin embargo, el ranking independiente de Arena coloca a Nano Banana 2 Lite en la quinta posición. El liderazgo actual de este sector pertenece a GPT-Image-2 de OpenAI, que encabeza la tabla con 1388 puntos, mientras que MAI-Image-2.5 de Microsoft retiene el cuarto lugar de la clasificación.
La oferta de generación visual de Google ahora se divide en cuatro opciones bien definidas para los desarrolladores:
- Nano Banana 2 Lite: Diseñado para flujos de trabajo masivos que requieren respuestas veloces.
- Nano Banana 2: El balance estándar entre calidad de imagen y costo operativo.
- Nano Banana Pro: Dirigido a profesionales con altas necesidades de control y detalle.
- Nano Banana: El modelo heredado que la empresa sugiere retirar de producción.
Gemini Omni Flash: video controlado por texto
Por su parte, Gemini Omni Flash es un modelo de video que permite generar y editar clips con audio nativo mediante instrucciones de lenguaje natural. Este desarrollo entra en fase de vista previa pública en la API de Gemini por 0.10 dólares por segundo de video, la misma tarifa que tiene el sistema Veo 3.1 Fast.
Los desarrolladores pueden usar texto, audio y video como referencias conjuntas para estructurar las tomas de hasta 10 segundos. No obstante, el sistema presenta limitaciones en su fase actual, pues admite referencias de video de máximo 3 segundos que aún no se procesan de forma óptima, y la consistencia visual decae durante movimientos bruscos de cámara.
Para sortear estas barreras técnicas, la Interactions API de Google permite encadenar ambos modelos. Un creador puede diseñar un gráfico base con Nano Banana 2 Lite y usarlo como referencia en Gemini Omni Flash para animar la toma.
Adopción empresarial inmediata
Empresas de software y publicidad ya comenzaron a integrar ambas herramientas en sus plataformas de producción digital. Adobe sumará estos modelos a Firefly, mientras que el grupo publicitario WPP los incorporó a su ecosistema WPP Open para automatizar campañas visuales.
La plataforma de diseño Figma también adoptó el nuevo generador de imágenes para acelerar el desarrollo de layouts en su espacio de trabajo interactivo. Idan Yonas, director de contenido en Artlist, señaló que con estos avances “…la generación ahora es más rápida que la propia idea, lo que permite a los creadores quedarse ‘dentro de la idea’ en lugar de esperar una barra de progreso”.
Por su parte, Michael Gerstenhaber, vicepresidente de gestión de producto en Google Cloud, remarcó que el nuevo modelo domina mejor la consistencia de personajes para crear storyboards. Ambas herramientas cuentan con protección de marca de agua SynthID y credenciales de contenido C2PA para garantizar su transparencia.
