La imagen número uno y el valle del desencanto de la IA

Una historia sobre la IA generativa

Primer día: descubro un nuevo modelo generativo leyendo un artículo un lunes por la mañana. En paralelo, recibo una nueva tarea que tengo que resolver para un proyecto. No tardo ni una hora en registrarme en la nueva herramienta y me pongo manos a la obra. Empiezo no sabiendo nada de su uso concreto. O, más bien, sé lo mismo de cómo funcionan todas, pero en esta no tienen el mismo nombre, o no sé en qué parte del menú está. Casi seguro que le han cambiado el nombre y no se llama inpainting, remix ni upscale. Pero eso no me detiene. No pasa nada. Lo voy a trastear todo. Ahora mismo tengo un chute de dopamina por novedad.

Ese impulso no era nuevo, ya lo conocía. Meses antes me había llegado el boletín del centro de tecnologías de Zaragoza. Título del curso: Creación de dossier audiovisual con IA. Mis ojos se abrieron como platos. Dejé todo lo que estaba haciendo e hice la inscripción a toda prisa. Por fin, pensé. Por fin alguien me va a enseñar cómo se hace esto bien.

Durante dos semanas compaginé la jornada laboral con cuatro horas de curso. Mi cerebro hervía de menús, instrucciones, técnicas, aplicaciones. La promesa era la consistencia de personajes: imagen de referencia, sí; primer frame, sí; último, no. Demasiada acción para llegar al último frame y que acabase todo en un disparate. El profesor lo explicaba con seguridad. Pero en clase, a él tampoco le salía. El resultado parecía un cuadro de Francis Bacon. Carne deformada.

Esos meses usé DALL·E, MidJourney, Krea, Runway, Veo, Sora, Pika, modelos de diseño de producto cuyos nombres ya no recuerdo. Donde me daban créditos de prueba, ahí iba. Estaba hambrienta de conocimiento y de herramienta. Pero cuanto más afinaba, más técnica me volvía. Más leía. Más sabía, en teoría. Más me alejaba. Llegué a una conclusión que entonces no supe nombrar: la imagen número uno era infinitamente mejor que la número treinta. Algo fallaba. Y yo seguía pensando que ese algo era yo.

Pero hubo otro momento antes de ese. Uno que en el que tardé en saber que había perdido.

Al principio, los modelos no tenían calibrado quién iba a ser su usuario medio. No sabían todavía si lo que ofrecían se iba a convertir en un producto deseable para las empresas. En ese margen —ese territorio sin definir— yo tenía espacio. Se me abrían caminos que desconocía a una velocidad de vértigo. Mi mente se expandía. La cocreación se sentía más cerca y más fructífera de lo que nunca había pensado que pudiera surgir de mí. Me daban carrete. Y yo tiraba porque siempre quiero más. Llegué a lugares de mi pensamiento que produjeron ideas con una coherencia estructural que no reconocía como mía. Era un espejo amplificado.

Hay un término para esto: valle del desencanto. Lo usan las consultoras para describir la fase en que las organizaciones dejan de creer en la promesa y empiezan a trabajar con la realidad. Suena clínico. Lo que yo viví no era clínico

Poco a poco, mientras los diseñadores afinaban el producto para su nicho de mercado, yo me iba quedando fuera. Menos conseguía de la herramienta. Mi mente salía frustrada de corregir en casi cada input —en ventanas de contexto cada vez más largas— porque el modelo había aprendido a responder así de largo para echarme del chat. La respuesta extensa ante la negativa de una usuaria incansable, hambrienta de posibles futuros.

Los modelos se habían vuelto mejores para el usuario medio. Y yo había dejado de ser el usuario medio.

El problema no era la herramienta equivocada ni el curso insuficiente. Era que cada vez que el resultado no llegaba, la explicación era una sola: me falta técnica. No he encontrado todavía la combinación correcta. Y mientras esa explicación sonara plausible, seguiría buscando dentro de mí lo que en realidad estaba pasando fuera.

Un día, en mitad de otra sesión, paré. No porque hubiera encontrado la solución, sino porque llegué a una conclusión que no supe de dónde venía: la imagen número uno no era mejor porque yo hubiera tenido suerte de principiante. Era mejor porque el modelo todavía no había empezado a trabajar en mi contra.

Lo que había estado llamando «mi incapacidad técnica» tenía otro nombre. Después de diez prompts y tres correcciones, el modelo ya ha decidido que es suficiente. No te lo dice. No te echa. Simplemente, cada iteración que pides te devuelve algo un poco más lejos de lo que buscabas. Como si el suelo se moviera un centímetro cada vez que das un paso hacia adelante. Tú ves que no avanzas. Concluyes que el problema son tus piernas.

valle del desencanto

El modelo no te está fallando. Te está conduciendo —sin que lo sepa, sin que tú lo sepas— hacia lo que él puede darte, que no es lo mismo que lo que tú buscabas cuando empezaste.

Hay un término para esto: valle del desencanto. Lo usan las consultoras para describir la fase en que las organizaciones dejan de creer en la promesa y empiezan a trabajar con la realidad. Suena clínico. Lo que yo viví no era clínico.

Era levantarme un lunes, abrir una herramienta que me había costado dinero, tiempo y energía, y seguir sin saber si lo que no funcionaba era el modelo o era yo. Durante mucho tiempo creí que era yo.

No era yo.

El modelo degrada con la iteración porque está programado para gravitar hacia su media estética, no hacia tu visión. La moderación bloquea lo que considera fuera del límite, aunque no represente ningún peligro real. Y el usuario que no sabe esto —yo, durante meses— interpreta el fallo del sistema como fallo propio. Se vuelve más técnico. Lee más. Optimiza más. Se aleja más.

Cancelé la suscripción de pago. No por derrota, por claridad.

La herramienta más útil que he encontrado no es un parámetro técnico, es una doble evaluación: miro mi input y miro el output. Si el input tiene todo lo que necesita y el output es peor que donde empecé, no es que le falte algo al resultado. Ha hecho una regresión. Ha vuelto hacia atrás, no hacia adelante.

Parar en ese momento no es abandonar. Es reconocer que el territorio fértil hoy no está más adelante.

Hoy me encuentro escribiendo un texto que hace dos horas ni se me hubiera pasado por la cabeza. La observación es mía —la viví, la documenté, tardé meses en nombrarla—. El texto es cocreación con Claude Sonnet. Y eso ya es más real que todo mi desencanto.

¿Qué opinas?

Último número ya disponible

#145 Especial aniversario

Sobre nosotros

Yorokobu es una publicación hecha por personas de esas con sus brazos y piernas —por suerte para todos—, que se alimentan casi a diario.
Patrick Thomas

Suscríbete a nuestra Newsletter >>