Seedance 2.0 API — Coming SoonGet early access

Nanoplátano API

El modelo de imagen Flash Gemini 2.5 de Google está diseñado para generar y editar imágenes rápidamente. Úselo para combinar múltiples referencias, mantener la coherencia de los personajes y aplicar transformaciones de lenguaje natural para fotografías de productos, creatividades sociales y narraciones de marcas.

A cute cat wearing sunglasses

Parameters
size
auto
Estimated Cost
1.6 Credits
Sample Result

No sample available

0 (suggested: 2,000)

Upload up to 5 images (max 10MB each)

Click to upload or drag and drop

Supported formats: JPEG, JPG, PNG, WEBP
Maximum file size: 10MB; Maximum files: 5

Click Generate to see preview

Historial

Máx. 20 elementos

0 ejecutando · 0 completado

Tu historial de generación aparecerá aquí

Nano Banana: generación y edición rápida de imágenes

Combine entradas de texto e imágenes para guiar la composición y luego refine con ediciones y variaciones específicas. El modelo mantiene la latencia baja para que los equipos puedan iterar rápidamente.

Muestra de marketing de la función 1 de generación de imágenes

Pricing

Popular
Nano Banana
Image Generation (Gemini 2.5 Flash)
Price:
$0.0222/ image
(1.6 Credits)

If it's down, we automatically use the next cheapest available—ensuring 99.9% uptime at the best possible price.

¿Qué puede crear Nano Banana?

Imágenes de producto y marca.

Nano Banana combina un resumen breve con de una a tres imágenes de referencia para producir fotografías limpias, pancartas de héroes y escenas de estilo de vida. Combina estilo, iluminación y diseño para que un producto o mascota se mantenga consistente en todas las variantes, lo cual es útil para actualizaciones de catálogos, páginas de lanzamiento y pruebas A/B de anuncios. Mantenga las referencias enfocadas y especifique el tema principal para mejorar la fidelidad y reducir la repetición del trabajo.

Muestra comercial de la función 2 de generación de imágenes

Texto legible en imagen

Cree carteles, menús, etiquetas e infografías donde el texto debe permanecer legible. Un flujo de trabajo práctico consiste en redactar primero la copia exacta y luego renderizar la imagen con ese texto para que el diseño permanezca estable. Si necesita imágenes en lugar de resultados de solo texto, dígalo claramente en el mensaje. Este flujo ayuda a que las campañas multilingües envíen activos consistentes con menos superposiciones manuales.

Muestra de tipografía de la función de generación de imágenes 3

Ediciones y variaciones guiadas.

Utilice Nano Banana para transformaciones específicas: intercambie fondos, ajuste la iluminación o reemplace objetos sin reiniciar el concepto. Está optimizado para ediciones rápidas y refinamiento iterativo, de modo que los equipos puedan crear múltiples opciones rápidamente manteniendo el mismo carácter o identidad del producto. Esto acelera los ciclos de aprobación de creatividades sociales, guiones gráficos y variantes de marketing que necesitan resultados rápidos.

Muestra de edición de la función de generación de imágenes 4

Por qué los equipos eligen Nano Banana

Este modelo combina velocidad con control práctico, para que los equipos puedan pasar de una creatividad breve a una creatividad utilizable en minutos en lugar de días.

Representación de texto más clara

Mejora la legibilidad de etiquetas y titulares dentro de la imagen.

Flujo de trabajo de menor latencia

La generación rápida hace que las pruebas y revisiones A/B sean mucho más fluidas.

Señales de procedencia

Las imágenes incluyen marcas de agua SynthID para respaldar la transparencia.

Cómo utilizar Nanoplátano

Tres sencillos pasos para generar, editar y entregar imágenes con EvoLink.

1

Paso 1: agregar indicaciones y referencias

Escriba un mensaje claro, agregue notas de estilo e incluya una o más imágenes de referencia para guiar la composición.

2

Paso 2: edite con lenguaje natural

Solicite cambios específicos en lenguaje sencillo y luego repita el color, el diseño y el texto hasta que coincida con el resumen.

3

Paso 3: exportar y reutilizar

Elija la mejor variación, expórtela y reutilice el mismo personaje o configuración de producto para campañas coherentes.

Capacidades clave

Diseñado para un trabajo creativo rápido y controlable.

Aporte

Comprensión multimodal

El modelo acepta tanto texto como imágenes, por lo que puedes describir el objetivo mientras muestra referencias. Esto hace que sea más fácil combinar el estilo de la marca, los detalles del producto o la composición de la escena sin indicaciones demasiado largas.

Flujo de trabajo

Refinamiento conversacional

Puede mantener la conversación con breves instrucciones de seguimiento. Solicite un cambio de color, un ángulo de cámara diferente o un fondo nuevo y el modelo actualizará la imagen en lugar de empezar desde cero.

Control

Consistencia del carácter

Cuando necesita una serie de imágenes con el mismo personaje u objeto, ayuda a preservar la identidad entre variaciones. Esto admite guiones gráficos, secuencias de campañas y tutoriales de varios pasos donde la continuidad es importante.

Edición

Transformaciones dirigidas

Utilice ediciones en lenguaje natural para reemplazar objetos, ampliar un lienzo o ajustar la iluminación. El modelo está diseñado tanto para edición como para generación, por lo que puede realizar cambios precisos con menos renderizaciones.

Calidad

Señales de conocimiento del mundo real

Se beneficia del razonamiento y el conocimiento del mundo real de Gemini, lo que le ayuda a seguir una lógica visual común y evitar detalles incómodos en escenas cotidianas.

Confianza

Marca de agua SynthID

Las imágenes generadas en Gemini incluyen una marca de agua SynthID invisible, que proporciona una señal de procedencia de que el contenido es generado por IA. Esto respalda el intercambio responsable y los flujos de trabajo de revisión de la plataforma.

Preguntas frecuentes

Everything you need to know about the product and billing.

Es el apodo público de Gemini 2.5 Flash Image, el modelo de generación y edición de imágenes de Google creado para baja latencia. El modelo crea imágenes a partir de texto o entradas combinadas de texto e imagen y admite ediciones iterativas. Los equipos lo utilizan para imágenes de productos, creatividades sociales y guiones gráficos porque equilibra la calidad con la velocidad. En EvoLink, el modelo se puede enrutar a través de un API unificado para que pueda probarlo manteniendo el mismo flujo de trabajo en todos los proveedores.
Google utiliza el apodo para Gemini 2.5 Flash Image en documentos de producto y materiales de lanzamiento. El nombre oficial del modelo sigue siendo Gemini 2.5 Flash Image y el apodo se refiere al mismo modelo en lugar de a un producto independiente. Es posible que también vea "Nano Banana Pro" en la documentación para la vista previa de la imagen de Gemini 3 Pro. EvoLink mantiene el apodo en la interfaz de usuario para mayor claridad mientras usa nombres de modelos oficiales para el enrutamiento.
Sí. El modelo puede combinar múltiples imágenes de entrada en una sola salida, lo que le permite transferir estilo, diseño o detalles del tema en una escena coherente. Por ejemplo, puede cargar una foto de producto y un moodboard de marca y luego pedirle que produzca una imagen principal que coincida con ambos. Esto es especialmente útil para mantener la coherencia de la marca en todas las campañas. Para obtener mejores resultados, mantenga las entradas enfocadas y limite la cantidad de imágenes de referencia.
El modelo admite la edición de imágenes mediante transformaciones de lenguaje natural. Puede solicitar cambios como un nuevo fondo, un ajuste de iluminación o un objeto diferente sin tener que volver a escribir todo el mensaje. Debido a que está diseñado tanto para generación como para edición, el ciclo de iteración es corto, lo que ayuda a los equipos a trabajar más rápido. Comience con una imagen base limpia, luego aplique pequeñas ediciones específicas paso a paso para que el modelo pueda conservar el tema y el estilo principales.
Mantenga el texto breve, evite párrafos largos y especifique la jerarquía (título, subtítulo, letra pequeña). El modelo funciona mejor cuando el diseño es simple, como carteles, menús y etiquetas. Proporcione la redacción exacta y solicite un espacio limpio entre líneas si necesita varios idiomas. También puedes solicitar un fondo liso para mejorar la legibilidad. Itere con pequeños ajustes en lugar de cambiar toda la escena.
Las imágenes generadas en Gemini incluyen una marca de agua SynthID invisible, que proporciona una señal de procedencia de que el contenido es generado por IA. Esto ayuda a respaldar el intercambio responsable y la confianza de los revisores. En los flujos de trabajo de producción, aún debe documentar internamente las solicitudes, referencias y aprobaciones. El modelo encaja bien en los procesos de cumplimiento al combinar la señal SynthID con sus propios pasos de revisión y seguimiento de activos.
Google pone Gemini 2.5 Flash Image a disposición de los desarrolladores a través de Gemini API, Google AI Studio y Vertex AI. EvoLink proporciona una capa API unificada para que pueda enrutar el modelo junto con otros modelos sin cambiar su integración. La disponibilidad, las cuotas y las regiones dependen de su cuenta de proveedor, así que consulte la consola correspondiente para conocer el acceso actual. Para el gobierno empresarial, Vertex AI suele ser la opción a revisar.
Sí. El modelo está optimizado para la velocidad, lo que lo hace práctico para equipos que necesitan muchas iteraciones y aprobaciones. Los diseñadores pueden probar múltiples conceptos rápidamente, mientras que los equipos de marketing pueden ejecutar variaciones creativas A/B. Almacene imágenes de referencia en una biblioteca compartida y reutilice instrucciones coherentes para que la apariencia de la marca se mantenga estable. Cuando lleguen comentarios, utilice el flujo de edición para realizar cambios incrementales en lugar de generarlos desde cero.
POST
/v1/images/generations

Generate Image

Create an image generation task using text prompts or reference images. Supports text-to-image, image-to-image, and image editing modes.

Asynchronous processing mode, use the returned task ID to .

Generated image links are valid for 24 hours, please save them promptly.

Request Parameters

modelstringRequiredDefault: gemini-2.5-flash-image

Image generation model name.

Examplegemini-2.5-flash-image
promptstringRequired

Prompt describing the image to be generated or how to edit the input image.

Notes
  • Limited to 2000 tokens
ExampleA cat playing in the grass
sizestringOptionalDefault: auto

Aspect ratio of the generated image.

ValueDescription
autoAuto detect
1:1Square (1:1)
2:3Portrait (2:3)
3:2Landscape (3:2)
4:3Landscape (4:3)
3:4Portrait (3:4)
16:9Horizontal (16:9)
9:16Vertical (9:16)
Example'16:9'
image_urlsarrayOptional

Reference image URL list for image-to-image and image editing functions.

Notes
  • Max 5 images per request
  • Max size: 10MB per image
  • Formats: .jpeg, .jpg, .png, .webp
  • URLs must be directly accessible by the server
Examplehttps://example.com/image1.png
callback_urlstringOptional

HTTPS callback address after task completion.

Notes
  • Triggered on completion, failure, or cancellation
  • Sent after billing confirmation
  • HTTPS only, no internal IPs
  • Max length: 2048 chars
  • Timeout: 10s, Max 3 retries
Examplehttps://your-domain.com/webhooks/image-task-completed

Request Example

{
  "model": "gemini-2.5-flash-image",
  "prompt": "A cat playing on the grass",
  "size": "16:9"
}

Response Example

{
  "created": 1757165031,
  "id": "task-unified-1757165031-uyujaw3d",
  "model": "gemini-2.5-flash-image",
  "object": "image.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 45
  },
  "type": "image",
  "usage": {
    "billing_rule": "per_call",
    "credits_reserved": 1.6,
    "user_group": "default"
  }
}