Primer día en QCon AI Boston

Tengo debilidad por InfoQ y sus eventos, y por eso tengo que ser más crítico. Llegué con una pregunta: ¿cuánto de lo que se presenta en una conferencia de IA es real y cuánto es demo con más luces y ruido que sustancia?

Y hoy hubo mucha sustancia… más de la que esperaba.

Hoy me centré en contexto

No hablo de lo que pasa en una sesión de trabajo con tu modelo. Me refiero a algo más profundo: cómo diseñas la información que le das a un agente de manera que pueda entender y operar de manera transversal, repetible y confiable.

Martin Spier de OpenAI dio la keynote con algo que parece obvio pero no lo es: cuando esperamos una respuesta de ChatGPT, hay todo un pipeline donde el modelo es solo una parte. Y en un mundo agéntico, el sistema acumula regresiones más rápido.

Ricardo Ferreira de Redis habló sobre context engineering, y cómo tratarlo como un recurso de arquitectura, no como un parámetro más del modelo. Y luego Ajay Prakash de LinkedIn mostró cómo lo hicieron en producción con MCP: 500+ skills creados por la comunidad, 70% más rápido en triage, y lo más interesante: adoptado no solo por ingenieros sino por PMs y data scientists. El contexto entendido no solo como un problema del área de ingeniería, sino como un problema organizacional.

El 90% de los agentes muere antes de llegar a producción

Zhou Yu de la Universidad de Columbia lo dijo sin rodeos. Tenemos un problema que va más allá del modelo, se trata de evaluación. No sabemos cuándo un agente está “listo”. No tenemos los criterios. No tenemos el proceso. Sin eso, vivimos entre la demo que funciona y el deploy que no — y así ningún presupuesto de IA está justificado.

Y luego Roblox

Si tienes niños, o no tan niños, ya sabes qué es Roblox. Lo que no es cosa de niños es el problema de ingeniería detrás: 144 millones de usuarios diarios, una codebase con más de 20 años, y lograr agentes que operen de manera confiable. Andrew Swerdlow mostró cómo construyeron un sistema donde agentes corren 24/7 logrando un 60% de aceptación de PRs. Eso es lo que separa un agente en producción de un prototipo.

Lo que me dejé en el tintero

QCon tiene sesiones en paralelo, lo que significa que siempre vas a perderte algo… y te va a doler. Las que me quedé debiendo y revisaré en las grabaciones:

KV Cache y la economía de la inferencia — Khawaja Shams (Momento). El costo real de correr modelos a escala.
Zero Trust en sistemas agénticos — Advait Patel (Broadcom). Compliance y restricciones no negociables en enterprise.
Your Newest Employee Has Sudo Access: Blueprints to Stop AI Insider Threats — Adrianna Valle (Klaviyo). El título solo ya da miedo.

Mañana día 2. Hay sesiones sobre evals, multi-agent patterns, y AI maturity en organizaciones.