Volver al BlogInteligencia Artificial

Claude Opus 4.8 acaba de llegar: qué cambió y cuándo conviene usarlo (vs Sonnet 4.8)

31 de mayo de 20266 min de lectura

Opus 4.8 ya es el nuevo default en Max, Team y Enterprise. Te cuento qué cambió y cuándo Sonnet 4.8 sigue ganando.

Llevo dos semanas con Claude Opus 4.8 como mi default y la primera reacción no fue wow. Fue: se siente más lento. Eso me hizo dudar si valía la pena el cambio. Spoiler: sí vale, pero no para todo. Y la diferencia con Sonnet 4.8 no es donde la mayoría piensa.

En este momento Anthropic empujó Opus 4.8 como modelo por defecto en Max, Team y Enterprise, y además llega con high effort activado de fábrica. Eso significa que el modelo piensa más antes de responderte, gasta más tokens y, sí, te hace esperar un poco más. Para algunas cosas eso es exactamente lo que necesitas. Para otras es desperdicio puro de tiempo y dinero.

Qué cambió de verdad con Opus 4.8

El cambio más visible es el high effort by default. Antes podías elegir si querías que el modelo se tomara su tiempo o no. Ahora viene puesto en alto. En la práctica significa que cada respuesta de Opus 4.8 viene mejor estructurada, con más pasos intermedios, y que el modelo se atreve a decirte cuando no está seguro en vez de inventar respuestas plausibles pero falsas.

La otra cosa que noté es que retiene mejor el contexto en sesiones largas. Le pasé un proyecto de 60 mil tokens (briefs de cliente, transcripciones, notas) y al final de la sesión todavía recordaba decisiones del principio. Sonnet 4.7 ya hacía esto, pero Opus 4.8 lo hace sin que tengas que recordárselo cada veinte mensajes. Eso solo ya cambia cómo trabajas en proyectos largos.

El tercer cambio es más sutil: la honestidad. Opus 4.8 con high effort dice no sé y esto puede estar mal con mucha más frecuencia. Antes los modelos tendían a complacer. Este se planta. Y eso para tomar decisiones es oro puro.

Opus 4.8 vs Sonnet 4.8: las diferencias que sí pesan

Sonnet 4.8 es el modelo que la mayoría debería usar el 80% del día. Es rápido, es barato, es suficientemente bueno para casi cualquier tarea de oficina, correo, redacción, marketing. La diferencia real con Opus 4.8 no es inteligencia en general, es profundidad cuando el problema es ambiguo o cuando hay varias rutas válidas y tienes que elegir.

Opus 4.8 cobra más por mensaje (en plan Max no lo notas, pero en API sí se siente) y responde más lento. A cambio te da razonamiento más cuidadoso, mejores decisiones cuando hay varias opciones válidas, y menos errores en cadenas largas de pasos. Si tu tarea es un único paso, esa profundidad es desperdicio.

  • Velocidad: Sonnet 4.8 responde en segundos, Opus 4.8 puede tardar 30-60 segundos con high effort.
  • Costo: Opus 4.8 cuesta alrededor de 5x más por token que Sonnet 4.8 en la API.
  • Profundidad: Opus 4.8 razona mejor cuando hay ambigüedad o varias rutas posibles.
  • Contexto largo: Opus 4.8 retiene mejor decisiones tomadas hace 40 mil tokens atrás.
  • Honestidad: Opus 4.8 admite duda con más frecuencia y no te complace cuando no debe.

Cuándo Opus 4.8 sí justifica el costo

Lo uso cuando la decisión que estoy tomando es cara de revertir. Diseñar la estructura de un curso, revisar una propuesta de seis cifras, analizar un contrato, planificar un lanzamiento. Todo lo que si lo hago mal, me cuesta días arreglarlo o me hace quedar mal con un cliente importante.

También lo uso para research profundo donde necesito que el modelo se atreva a contradecirme. Sonnet tiende a ser más complaciente. Opus 4.8, especialmente con high effort, te dice esto que estás planteando tiene un agujero aquí con mucha más frecuencia. Esa es la diferencia que me hace pagarlo aunque tarde más.

Y para revisión de código complejo o estructura de prompts maestros, Opus 4.8 también se nota. No por la primera respuesta, sino por la calidad de la segunda y la tercera vuelta. Donde Sonnet se queda repitiendo lo mismo con variaciones, Opus encuentra el ángulo nuevo.

Cuándo Sonnet 4.8 sigue siendo el mejor

Para responder correos, redactar publicaciones de redes, hacer resúmenes, ajustar copy, reescribir textos, traducir, clasificar mensajes de clientes. Todo lo que hago decenas de veces al día. Sonnet 4.8 me responde en cinco segundos y la calidad es indistinguible para esas tareas. Pagar Opus aquí es tirar plata.

También para automatizaciones donde el costo importa. Si tienes un flujo que llama a la API mil veces al día, usar Opus 4.8 ahí es tirar dinero. Sonnet 4.8 te da el 95% del resultado por el 20% del precio. Esa diferencia se acumula al final del mes y se nota en la factura.

Mi regla de los tres pasos para decidir cada día

No me siento todas las mañanas a pensar qué modelo abrir. Tengo una regla mental que aplico en segundos: ¿cuántos pasos tiene la tarea, qué tan caro es equivocarme, y qué tan ambiguo es lo que estoy pidiendo? Tres preguntas, decisión en cinco segundos.

Si la tarea tiene un solo paso, error reversible, y la pregunta es clara, abro Sonnet 4.8. Si tiene varios pasos encadenados, el error me cuesta tiempo o dinero, o la pregunta admite varias respuestas válidas, abro Opus 4.8. No tengo que pensarlo más. Esta regla la armé después de meses de probar y todavía me sirve.

  • Una tarde típica mía: 80% Sonnet 4.8, 20% Opus 4.8.
  • En semanas de planeación o estrategia: 50/50.
  • En semanas de ejecución pura: 90% Sonnet 4.8.

El error que cometí las primeras dos semanas

Cuando Opus 4.8 salió como default, lo empecé a usar para todo. Resultado: respuestas que tardaban 40 segundos para cosas que necesitaba en cinco. Me frustraba sin saber por qué. La pista la encontré cuando un cliente me dijo se te ve más lento últimamente. Cambié de inmediato.

La lección que saqué: usar el modelo más potente por default no es señal de profesionalismo. Es señal de no haberte tomado el tiempo de pensar qué necesita cada tarea. La elección consciente del modelo es parte del oficio en 2026.


Si recién empiezas, no te obsesiones con elegir el modelo perfecto. Usa Sonnet 4.8 por default y reserva Opus 4.8 para las decisiones que de verdad mueven la aguja. Eso te ahorra plata y te da claridad de cuándo el modelo grande está aportando algo distinto.

WH

Wilmer Hurtado

Consultor de Marketing & IA · Miami, FL

Más de 30 años de experiencia en Marketing, de los cuales 23 años en el mercado de los Estados Unidos. Ayudo a emprendedores, profesionales y empresas a crecer usando marketing digital e inteligencia artificial. Growth Hacker, Paid Media specialist y Productor Multimedia.

Próximo Taller

Taller de 6 horas de Claude Cowork

Taller en vivo de 6 horas (2 sesiones × 3h en Zoom). Aprende a usar Claude Cowork para producir contenido, reportes, contenido y automatizaciones reales. Sin saber programar.

Ver detalles del taller →