Volver al BlogInteligencia Artificial

Cómo mantener la consistencia de un personaje en varias imágenes con Nano Banana

6 de junio de 20266 min de lectura

Cómo mantener al mismo personaje en cinco, diez o veinte imágenes distintas con Nano Banana Pro: la descripción ancla de 6 atributos y casos prácticos reales.

Hace dos meses una clienta me pidió una serie de 8 imágenes para una historia visual en Instagram. La protagonista tenía que ser la misma mujer en 8 escenarios distintos: oficina, café, viaje, casa, gimnasio. La parte difícil no era generar las imágenes; era que se viera la misma persona en todas. Con generaciones de imagen tradicionales, eso era casi imposible.

Con Nano Banana Pro pasó algo distinto. La consistencia de personaje funciona de verdad, siempre que sepas cómo guiarla. No es automático: tú haces gran parte del trabajo desde el prompt. Te cuento cómo lo hago.

Por qué un personaje consistente es difícil en IA de imagen

Cada generación es una reinterpretación. El modelo no tiene memoria persistente entre imágenes; cada vez que escribes un prompt, vuelve a "imaginar" cómo se ve el personaje basado en las palabras. Si tu descripción es vaga, la cara va a cambiar. Si dices "una mujer joven", el modelo crea una nueva mujer joven cada vez. Igualito que si le pides a 10 dibujantes que dibujen "una mujer joven" sin más contexto.

Antes, la única solución medio decente era entrenar un modelo custom (LoRA, embeddings) con fotos de la persona. Ahora con Nano Banana Pro tienes dos caminos más simples: el feature nativo de character consistency, y una descripción ancla bien construida. Idealmente, los dos juntos.

El feature clave de Nano Banana Pro: character consistency

En Nano Banana Pro puedes subir una imagen de referencia del personaje (una foto real o una imagen generada previamente que te gustó) y pedirle al modelo que mantenga esa cara, ese cuerpo y ese vestuario base en las próximas generaciones. La activas indicando "use this character as reference" o el flujo equivalente en la interfaz.

Funciona muy bien para rasgos faciales generales: estructura, color de piel, color y forma de ojos, corte y color de pelo. Funciona regular para vestuario muy específico (a veces lo reinventa). Y todavía falla cuando el ángulo de cámara cambia mucho entre la referencia y lo que pides (de frontal a perfil extremo, por ejemplo). Eso lo compensas con la descripción ancla.

La descripción ancla: los 6 atributos que repites siempre

La descripción ancla es un bloque fijo que copias y pegas en cada prompt nuevo, sin importar la escena. Son seis atributos del personaje que NUNCA cambian. La escena, la pose, la luz, el lugar pueden cambiar. La ancla, no.

  • Edad: "a 34 year old".
  • Rasgos faciales: "with high cheekbones and a small nose".
  • Color y corte de pelo: "shoulder length curly dark brown hair".
  • Ojos: "warm hazel eyes".
  • Vestuario base: "wearing a cream linen blazer over a white t-shirt".
  • Expresión característica: "with a soft thoughtful expression, mouth slightly closed".

Cuando juntas las seis tienes algo así:

A 34 year old Latina woman with high cheekbones and a small nose, shoulder length curly dark brown hair, warm hazel eyes, wearing a cream linen blazer over a white t-shirt, with a soft thoughtful expression and mouth slightly closed.

Esa cadena la guardas como snippet y la pegas en cada prompt nuevo de la serie. La consistencia visual mejora muchísimo, incluso sin imagen de referencia.

Cómo cambiar escena sin perder al personaje

La regla mental que uso: solo escena cambia, ancla queda igual. Cuando preparo una serie de 5 imágenes, escribo primero la descripción ancla. Luego escribo 5 prompts donde la única parte que muta es el entorno y la acción.

Ejemplo aplicado para tres escenas de una misma persona:

Prompt escena 1 — Oficina:

A 34 year old Latina woman with high cheekbones and a small nose, shoulder length curly dark brown hair, warm hazel eyes, wearing a cream linen blazer over a white t-shirt, with a soft thoughtful expression and mouth slightly closed, seated at a warm wooden desk in a sunlit home office with bookshelves slightly out of focus behind her, soft afternoon window light from the upper left, shot on 50mm at f2.0, photorealistic, no text.

Prompt escena 2 — Café:

A 34 year old Latina woman with high cheekbones and a small nose, shoulder length curly dark brown hair, warm hazel eyes, wearing a cream linen blazer over a white t-shirt, with a soft thoughtful expression and mouth slightly closed, sitting at a small marble table inside a sunlit specialty coffee shop, holding a ceramic mug with both hands, blurred warm interior in the background, soft window light from behind, shot on 50mm at f2.0, photorealistic, no text.

Prompt escena 3 — Calle en hora dorada:

A 34 year old Latina woman with high cheekbones and a small nose, shoulder length curly dark brown hair, warm hazel eyes, wearing a cream linen blazer over a white t-shirt, with a soft thoughtful expression and mouth slightly closed, walking on a quiet urban sidewalk with blurred warm brick buildings behind her, late golden hour sun from the right side, gentle natural shadow on the left side of her face, shot on 35mm at f2.0, photorealistic, no text.

Cambia el lugar, cambia la luz y la acción. La descripción del personaje no se mueve un milímetro. Resultado: serie coherente que parece de la misma sesión.

Casos prácticos: cómics, redes sociales, branding personal

Estos son los tres usos donde he visto que más rinde la consistencia de personaje en mis proyectos y los de clientes.

Historia visual en redes sociales: una secuencia de 5 a 8 imágenes para Instagram, LinkedIn o un carrusel donde un protagonista atraviesa una situación (un día en su vida, un antes y un después, una mini-narrativa). Antes esto exigía sesión de fotos. Ahora se hace en una tarde con la descripción ancla.

Cómics y storytelling: historietas cortas, viñetas para newsletters, mini-cómics promocionales. El feature de character consistency es donde más se nota la mejora vs herramientas viejas. Mantener al protagonista en 12 viñetas era pesadilla pura hace un año.

Branding personal y avatares de marca: cuando alguien crea un personaje ficticio como representante de su marca (estilo mascota humanizada), necesita que ese personaje aparezca igual en cada pieza. Aquí la descripción ancla guardada como snippet en Notion vale oro.


Si vas a empezar con consistencia de personaje, hazlo con un caso pequeño: una serie de 3 imágenes. Escribe tu descripción ancla de 6 atributos, genera la primera imagen como referencia, y reutiliza la ancla en las otras dos. En 15 minutos vas a entender la mecánica, y a partir de ahí puedes escalar a series de 20 sin perder coherencia.

WH

Wilmer Hurtado

Consultor de Marketing & IA · Miami, FL

Más de 30 años de experiencia en Marketing, de los cuales 23 años en el mercado de los Estados Unidos. Ayudo a emprendedores, profesionales y empresas a crecer usando marketing digital e inteligencia artificial. Growth Hacker, Paid Media specialist y Productor Multimedia.

Próximo Taller

Taller de 6 horas de Claude Cowork

Taller en vivo de 6 horas (2 sesiones × 3h en Zoom). Aprende a usar Claude Cowork para producir contenido, reportes, contenido y automatizaciones reales. Sin saber programar.

Ver detalles del taller →