La evolución de los agentes de inteligencia artificial no es solo una cuestión de mejores modelos, sino de mejores arquitecturas de interacción con el mundo. En este contexto, se está produciendo una transición clave: pasar de agentes que utilizan herramientas mediante tool calling a agentes que generan y ejecutan código como mecanismo principal de acción.
Este cambio responde a una realidad técnica fundamental: los modelos de lenguaje han sido entrenados masivamente en código, lo que convierte a la programación en su lenguaje operativo más natural. Cuando se les obliga a interactuar exclusivamente mediante protocolos rígidos de herramientas, se introduce una fricción artificial que limita su capacidad real.

El code mode elimina esa fricción permitiendo que el agente:
- razone la solución completa,
- escriba el código necesario,
- y lo ejecute en un entorno seguro.
Esto no solo mejora la calidad de las respuestas, sino que transforma la economía, la autonomía y la escalabilidad de los sistemas basados en agentes.
Del tool calling a la ejecución programática
En el paradigma tradicional, un agente:
- interpreta una petición,
- selecciona una herramienta,
- construye una llamada siguiendo un esquema rígido,
- espera la respuesta,
- y repite el proceso tantas veces como sea necesario.
Cada paso consume tokens, introduce latencia y fragmenta el razonamiento.
En code mode, el agente:
- escribe un script completo,
- encapsula la lógica en funciones,
- usa bucles, condiciones y estructuras nativas,
- y ejecuta la tarea de una sola vez.
El resultado es un flujo más coherente, más eficiente y más cercano al razonamiento humano estructurado.
Impacto técnico y económico
Desde el punto de vista operativo, los beneficios son claros:
- Menor consumo de tokens
- Al reducir las interacciones ida/vuelta con herramientas, el ahorro es significativo:
- ~30 % en tareas simples
- hasta ~80 % en tareas complejas o repetitivas
- Mayor fiabilidad
- Menos llamadas, menos puntos de fallo.
- Mejor gestión de lógica compleja
- El agente no “recuerda pasos”, los programa.
Este cambio tiene consecuencias directas en sistemas de alto volumen como marketing automatizado, ecommerce o plataformas RAG.
Ejemplos prácticos por dominio
1. Marketing: de flujos rígidos a campañas programadas por IA
En un sistema de marketing tradicional basado en agentes con tool calling, lanzar una campaña puede implicar:
- crear audiencias,
- generar copys,
- programar envíos,
- analizar resultados,
- todo mediante múltiples llamadas independientes a distintas herramientas.
Un agente en code mode puede:
- analizar datos históricos,
- generar variantes de mensajes,
- programar envíos en distintos canales,
- y calcular métricas de rendimiento
- todo dentro de un único script.
Por ejemplo, el agente puede escribir un programa que
- recorra segmentos de clientes,
- adapte el mensaje según comportamiento previo,
- y ajuste automáticamente la frecuencia de impacto.
El marketing deja de ser una secuencia de acciones encadenadas y pasa a ser una estrategia ejecutada como código.
2. Ecommerce: operaciones masivas sin fricción
En ecommerce, muchas tareas son repetitivas y masivas:
- actualización de precios,
- creación de promociones,
- sincronización de inventario,
- generación de fichas de producto.
Con tool calling, cada producto suele implicar una llamada independiente.
En code mode, el agente puede
- escribir un script que recorra todo el catálogo,
- aplique reglas dinámicas de pricing,
- genere descripciones optimizadas,
- y actualice el sistema de una sola ejecución.
Esto reduce drásticamente:
- el coste,
- la latencia,
- y la complejidad operativa.
Además, el agente puede simular escenarios (“¿qué pasa si bajo precios un 5 % en esta categoría?”) ejecutando código de análisis antes de aplicar cambios reales.
3. RAG avanzado: de recuperación pasiva a razonamiento activo
En sistemas RAG tradicionales, el flujo suele ser:
- buscar documentos,
- recuperar fragmentos,
- generar una respuesta.
En un RAG avanzado basado en code mode, el agente puede:
- reformular consultas dinámicamente,
- ejecutar múltiples búsquedas con criterios distintos,
- evaluar la calidad de las fuentes,
- combinar resultados,
- y decidir si necesita más información antes de responder.
Por ejemplo, el agente puede escribir código que:
- compare versiones de documentos,
- detecte contradicciones,
- genere resúmenes parciales,
- y solo entonces construya la respuesta final.
El RAG deja de ser un “añadido de contexto” y se convierte en un proceso programado de investigación y síntesis.
Infraestructura: el habilitador silencioso
Nada de esto es viable sin una infraestructura específica.
Los agentes en code mode requieren:
- sandboxes aislados, donde ejecutar código sin riesgos,
- latencia mínima, evitando tiempos de arranque,
- carga dinámica, creando y destruyendo entornos por ejecución.
Esta infraestructura permite que el agente programe con libertad sin comprometer la seguridad ni la estabilidad del sistema principal.
Aquí, la clave no es solo el modelo de lenguaje, sino la capacidad de ejecutar código de forma segura, instantánea y a escala.
Cambio de paradigma: de asistentes a sistemas programables
La transición a code mode marca un punto de inflexión.
Los agentes dejan de ser:
sistemas que piden acciones a herramientas
y pasan a ser:
sistemas que programan su propia forma de actuar
Esto redefine qué entendemos por automatización, autonomía y “agencia” en inteligencia artificial.
El futuro de los agentes no se construye optimizando prompts ni ampliando catálogos de herramientas, sino creando entornos donde la IA pueda razonar, escribir y ejecutar código como parte natural de su pensamiento.