Poner orden en una palabra que lo abarca todo

Este era nuestro objetivo principal en el Maquinito de mayo. Para entender qué es un agente, primero hicimos un repaso de cómo hemos usado la IA en los últimos años. Hemos pasado por cuatro etapas: autocompletar (el copilot que termina tus frases), conversar (el ChatGPT al que le dábamos instrucciones cada vez más elaboradas), encargar (pedirle tareas concretas con acceso a herramientas) y, la última, actuar. “Búscame un AirBnB en Lisboa para el puente de mayo, máximo 120 euros, con buena valoración y cerca del metro.” Sin más instrucciones el sistema es capaz de encargarse.

Esa última etapa es donde viven los agentes. Y en este maquinito nos propusimos entender qué los hace distintos, y de paso, construir algunos.

Si quieres profundizar en la escala agéntica que usamos, echa un vistazo al artículo que publicamos antes del encuentro.

Nuestro experimento

Para el ejercicio práctico usamos Dify, una herramienta visual para construir flujos con IA que no requiere escribir código. Puedes conectar modelos, herramientas y pasos de forma gráfica, lo que la hace accesible para todos los públicos (en principio).

Montamos un flujo lineal y fuimos probando distintas acciones para configurarlo: qué le pedíamos al modelo, cómo encadenábamos los pasos, qué herramientas conectábamos.

A partir de ahí, los asistentes tomaron el relevo. Y de ese rato de exploración libre salieron experimentos muy diversos: alguien construyó un agente que aproxima la edad de una persona a partir de una foto, otro identificó el modelo de un coche con solo pasarle una imagen, y alguien montó el “cirujano plántico”: le das una foto de tu planta, el agente detecta qué especie es, qué problema tiene y qué cuidados necesita.

¿Qué aprendimos?

De esta sesión sacamos tres aprendizajes:

  1. No todos los sistemas con IA son agentes. Hay una diferencia real entre pedirle algo a un modelo y construir un flujo donde ese modelo toma decisiones encadenadas. Saber en qué etapa estás cambia cómo diseñas la solución.
  2. Diseñar el flujo es más difícil de lo que parece, aunque uses herramientas no-code. Dify hace que construir sea accesible, pero definir bien qué tiene que hacer cada paso, qué datos pasan de uno a otro y cuándo terminar el proceso requiere pensar con claridad. La herramienta quita la barrera técnica; el diseño sigue siendo trabajo.
  3. Los mejores ejemplos nacen de la exploración, no del plan. El cirujano plántico no estaba en el guion. Apareció porque alguien tuvo tiempo de probar algo que le apetecía. Los entornos que permiten ese margen suelen producir las ideas más interesantes.

Antes, construir algo así requería saber programar. Ahora requiere saber qué quieres. No es lo mismo, pero tampoco es más fácil.

Si estos temas despiertan tu curiosidad, te esperamos en el próximo Maquinito.