Volver al BlogInteligencia Artificial

La fórmula de 6 partes que uso para que Nano Banana acierte al primer intento

3 de junio de 20266 min de lectura

La fórmula que uso para que Nano Banana acierte al primer intento: sujeto, acción, escena, iluminación, estilo y restricciones. Con ejemplo completo del antes y después.

Cuando alguien me dice "no me sale bien Nano Banana", el 95% de las veces el problema no es el modelo: es el prompt. Está escrito como una frase suelta, sin estructura, esperando que la IA rellene los huecos por inspiración divina. La IA no inspira: ejecuta lo que escribiste.

Después de meses generando portadas, mockups, avatares y materiales para clientes, mi prompt sigue una fórmula fija de seis partes. No la cambio. Funciona en el 80% de los casos al primer intento, y eso me ahorra docenas de regeneraciones a la semana. Te la cuento entera.

Por qué la mayoría de prompts fallan en la primera generación

Tres causas explican casi todos los desastres. Primera, prompts genéricos: "una mujer trabajando en su laptop". Eso es 10.000 imágenes posibles, ninguna específica. Segunda, prompts ambiguos: "un fondo bonito", "una luz agradable". La IA elige por defecto algo seguro, casi siempre aburrido. Tercera, prompts sin contexto de iluminación: el factor más subestimado, y por eso le dedico una sección entera.

La fórmula que comparto a continuación es un antídoto contra esos tres problemas. Es larga al principio (vas a escribir prompts de 5 a 8 líneas), pero rinde tanto que vas a dejar de quejarte de "los créditos que gasté en vano".

Parte 1: Sujeto concreto y específico

El sujeto es lo que va en primer plano. Tiene que ser específico hasta el punto de que cualquier persona que lea el prompt pueda dibujarlo aproximadamente con palabras.

Mal: una mujer profesional. Bien: a 35 year old Latina woman with shoulder length curly brown hair, wearing a cream linen blazer over a white t-shirt. La regla es: edad aproximada, rasgos físicos visibles, vestuario en al menos dos prendas con color y material.

Parte 2: Acción o pose clara

Aquí casi todo el mundo usa verbos copulativos: "ser", "estar". Eso es estático y aburrido. Usa verbos de acción concretos, aunque la imagen final sea quieta.

Mal: está en un café. Bien: holding a ceramic mug with both hands, leaning slightly forward over the wooden table. La acción da postura, dirección y emoción a la imagen. Sin acción específica, la IA por defecto pone al sujeto rígido mirando a cámara.

Parte 3: Escena y entorno

No escribas "fondo de oficina". Eso le permite a la IA elegir entre mil oficinas distintas y te va a salir la más genérica de stock. Describe entre 3 y 5 elementos visibles concretos, y di si están enfocados o desenfocados.

Mal: en una oficina moderna. Bien: in a small wooden home office with a leather chair, two stacks of books on the desk, and a large window on the right with green plants in front of it, all slightly out of focus. La profundidad de campo (qué está enfocado y qué no) es lo que separa una foto de un render plano.

Parte 4: Iluminación (el factor más subestimado)

Si me dieran a elegir entre dejar fuera el sujeto o dejar fuera la iluminación, dejaría fuera el sujeto. La luz es la diferencia entre una imagen creíble y una imagen plástica. Tres atributos que tienes que especificar siempre:

  • Dirección: desde dónde llega la luz. "From the upper left", "front lit", "backlit", "from the window on the right".
  • Calidad: dura o suave. "Soft window light" vs "hard flash lighting" producen mundos opuestos.
  • Color: temperatura. "Warm golden hour light", "cool blue afternoon light", "neutral midday daylight".

Ejemplo aplicado: soft afternoon window light coming from the upper left, warm golden tone, gentle shadow falling on the right side of the face. Esa sola frase ya hace que tu generación se vea editorial y no de stock genérico.

Parte 5: Estilo visual

Aquí declaras de qué medio quieres que parezca venir la imagen. Foto realista, ilustración editorial, render 3D, collage, dibujo a lápiz. Esto cambia todo el tratamiento.

Para foto: especifica lente y cámara. "Shot on 50mm at f1.8" da un look distinto a "shot on 24mm at f8". Para ilustración: especifica referencia estética. "Editorial style of The New Yorker", "minimalist flat illustration", "watercolor with rough paper texture". La IA reconoce muchas referencias y las traduce sorprendentemente bien.

Parte 6: Restricciones y negativos

Lo último que escribo siempre es lo que NO quiero. Esto evita errores frecuentes que Nano Banana Pro todavía comete ocasionalmente.

  • No text or watermarks (a menos que quieras texto específico).
  • No distorted hands or extra fingers.
  • No glossy plastic skin.
  • No symmetrical lighting.
  • No stock photo feel.

No abuses: 3 o 4 negativos bastan. Si pones 15, el modelo se pierde y empieza a meter elementos raros para "evitar" lo que pediste.

Ejemplo completo: del prompt vago al prompt ganador

Te muestro la transformación con un caso real. Necesitaba la portada de un artículo sobre productividad para creadores hispanos.

Prompt vago (lo que la mayoría escribe):

Una mujer latina trabajando productivamente en su laptop en una oficina moderna.

Resultado: imagen genérica de stock, mujer sonriendo a cámara con dientes blancos perfectos, oficina blanca aburrida, luz plana. Inservible.

Prompt ganador (fórmula de 6 partes):

A 34 year old Latina woman with curly shoulder length brown hair, wearing a heather gray sweater over a white t-shirt, typing on a silver laptop with both hands while looking thoughtfully at the screen, seated at a warm wooden desk with a ceramic mug of coffee, a small notebook and a single plant slightly out of focus in the background, soft afternoon window light coming from the upper left in a warm golden tone, gentle shadow falling on the right side of her face, shot on 50mm at f2.0 with shallow depth of field, photorealistic editorial style, no text, no watermarks, no glossy plastic skin, no symmetrical lighting.

Resultado: imagen que parece sacada de una revista, con luz cálida, profundidad real, expresión natural y atmósfera. Salió al primer intento. La diferencia entre las dos no es talento del modelo: es 7 líneas más de descripción concreta.


Aplica la fórmula durante una semana. Lleva un archivo de texto con tus mejores prompts y vas a ver cómo en pocos días dejas de regenerar 10 veces para conseguir lo que quieres. La IA no es magia, es ejecución literal de lo que pides. Pide mejor y recibe mejor.

WH

Wilmer Hurtado

Consultor de Marketing & IA · Miami, FL

Más de 30 años de experiencia en Marketing, de los cuales 23 años en el mercado de los Estados Unidos. Ayudo a emprendedores, profesionales y empresas a crecer usando marketing digital e inteligencia artificial. Growth Hacker, Paid Media specialist y Productor Multimedia.

Próximo Taller

Taller de 6 horas de Claude Cowork

Taller en vivo de 6 horas (2 sesiones × 3h en Zoom). Aprende a usar Claude Cowork para producir contenido, reportes, contenido y automatizaciones reales. Sin saber programar.

Ver detalles del taller →