Antes de un agente de IA: la pregunta que decide si va a funcionar

Una tarde de marzo, un Director de Operaciones de una empresa real nos escribe un correo. Tiene presupuesto aprobado por el dueño para un agente de IA. El proyecto está autorizado, los plazos definidos. Quiere empezar la semana siguiente.

La pregunta que le hacemos antes de cotizar es la misma que le hacemos a todos los clientes potenciales: "¿dónde viven los datos que el agente va a leer?". Tres correos después, el proyecto se pospone seis meses. No porque no haya presupuesto. Porque la respuesta a esa pregunta era "en archivos de Excel que cada quien guarda en su laptop".

“Hay una sola pregunta que determina si un proyecto de agente de IA va a funcionar antes de empezar. No es sobre presupuesto, equipo ni vendor. Es sobre dónde viven los datos.”

Si la respuesta no es "en un lugar donde una máquina los pueda leer", el proyecto no está listo — y gastar el presupuesto de todos modos es la forma más cara de aprenderlo.

Este artículo entrega tres cosas. Primero, por qué esa es la única pregunta que importa antes de invertir. Segundo, cinco preguntas más específicas que cualquier dueño puede contestar en diez minutos sin equipo técnico. Tercero, una matriz de resultado — verde, amarillo o rojo — que te dice qué hacer en cada caso.

La pregunta que importa (y por qué)

La conversación normal de venta de IA empieza por "¿qué quieres automatizar?". La pregunta correcta es anterior y más incómoda: "¿lo que quieres automatizar depende de información que vive en lugares legibles para una máquina?". Tres argumentos para por qué importa más que cualquier otra cosa.

Los agentes de IA son consumidores de datos, no creadores. Un agente típico necesita leer información sobre tu empresa para responder bien. Si preguntas "¿cuál es el saldo de la cuenta del cliente X?", el agente no inventa la respuesta — busca en una fuente. Si esa fuente no existe, no está estructurada, o está dispersa en sistemas que no se hablan, el agente no puede responder bien aunque sea el modelo más sofisticado del mercado.

La calidad del agente está limitada por la calidad de la fuente, no por la calidad del modelo. GPT, Claude, Gemini — la diferencia entre los modelos top del mercado importa menos que la diferencia entre "datos en una base estructurada" y "datos en archivos de Excel". Un modelo mediano con datos limpios supera a un modelo top con datos sucios. Esa es una afirmación incómoda para quien vende modelos sofisticados, pero es lo que se ve en proyectos reales una y otra vez.

Por eso, la pregunta correcta es sobre tus datos, no sobre el proveedor. El proveedor que termines eligiendo importa, pero importa después de haber resuelto la pregunta de datos. Un buen proveedor con datos no listos entrega un proyecto técnicamente correcto que falla operativamente. Un proveedor mediocre con datos listos entrega un proyecto que sí funciona.

“El error caro no es elegir mal proveedor. El error caro es contratar al mejor proveedor para automatizar un proceso cuyos datos no están listos para ser automatizados.”

Cuando los datos no están listos, el proveedor entrega lo prometido, el agente funciona técnicamente, y aun así el proyecto fracasa — porque las respuestas son inconsistentes, los datos están desactualizados, y el equipo deja de confiar en el sistema después de las primeras semanas.

Las cinco preguntas que tienes que contestar

Cinco preguntas, todas contestables sin equipo técnico, todas en menos de diez minutos. Cada una tiene tres respuestas posibles — sí, a medias, o no. Contéstalas honestamente: la trampa es responder con la versión optimista en lugar de la versión real.

✅ Sí — está documentada en sistemas digitales accesibles.
⚠️ A medias — algunas cosas sí, otras viven en cabezas de personas.
❌ No — el conocimiento clave es tribal y no está escrito.

✅ Sí — vive en una base centralizada o un sistema único.
⚠️ A medias — está en 2–3 sistemas que se pueden conectar técnicamente.
❌ No — está dispersa en archivos, hojas, chats y correos.

✅ Sí — se actualiza automáticamente, en tiempo real o casi real.
⚠️ A medias — diario o semanal pero de forma sistemática y predecible.
❌ No — se actualiza cuando alguien se acuerda o cuando explota algo.

✅ Sí — hay definiciones acordadas y documentadas por área.
⚠️ A medias — hay diferencias menores, pero todos saben de cuál es cuál.
❌ No — cada área tiene su propia versión de la verdad.

✅ Sí — hay alguien identificado, con tiempo asignado y autoridad real.
⚠️ A medias — hay alguien probable, pero sin tiempo formal asignado.
❌ No — no sabemos quién será — "alguien del equipo".

Tu resultado: verde, amarillo o rojo

Cuenta tus respuestas en cada categoría. La regla es estricta — basta una respuesta en ❌ para descartar verde, y dos para caer en rojo.

VERDE

Estás Listo

AMARILLO

Estas cerca o casi listo

ROJO

NO estás listo

Verde — 4 ó 5 respuestas en ✅, máximo una en ⚠️. Estás listo.

La conversación correcta ahora es elegir proveedor, definir un caso de uso piloto específico y arrancar. Si quieres entender los costos, ve al artículo Cuánto cuesta un agente de IA para una empresa mexicana del blog.

Amarillo — mezcla de ✅ y ⚠️, máximo una ❌.

Estás cerca, pero no listo. La inversión inteligente ahora es resolver lo que está en ⚠️ y ❌ antes de contratar IA. Típicamente esto significa ordenar los datos en una sola fuente, documentar definiciones de negocio por escrito, y nombrar dueños claros. Plazo aproximado: 2–4 meses, $80,000–$250,000 MXN. Después de eso, el proyecto de IA tiene una probabilidad significativamente mayor de funcionar.

Rojo — 2 o más respuestas en ❌.

No estás listo, y contratar IA ahora es la decisión más cara que puedes tomar. Antes de IA, necesitas Ingeniería de Datos. Y antes de Ingeniería de Datos, las herramientas livianas y la disciplina del artículo Excel + WhatsApp del blog. La progresión es ordenada — saltarse pasos es lo que hace que los proyectos de datos fracasen.

“Si terminaste en rojo o amarillo, esto no es una mala noticia — es la noticia que te ahorra entre $300,000 y $1.5 millones de pesos en un proyecto que iba a fracasar.”

Las empresas que llegan en verde casi siempre llegaron porque alguien antes hizo el trabajo aburrido de ordenar los datos. Ese trabajo es el proyecto correcto cuando estás en rojo — y el proyecto que evita en amarillo el desastre que viene después.

El orden correcto cuando estás en rojo

Si terminaste en rojo, el siguiente paso correcto no es buscar el mejor proveedor de IA — es ordenar los datos. La progresión total, de rojo a piloto productivo, toma típicamente entre 8 y 12 meses. Suena largo, pero comparado con tres proyectos fallidos consecutivos es rapidísimo.

ASO 01 · 1–2 MESES
Higiene básica
Lo que ya viste en el artículo Excel + WhatsApp. Centralizar los archivos críticos, nombrar dueños, acordar definiciones por escrito, eliminar copias dispersas. Costo: cercano a cero, dos tardes a la semana del equipo durante un mes.
PASO 02 · 2–4 MESES
Centralización de fuentes
Identificar las 3–4 fuentes que importan para el caso de uso del futuro agente, llevarlas a un repositorio único, y empezar a actualizar consistentemente. Aquí entran herramientas como bases de datos livianas (PostgreSQL, BigQuery), o en su versión más liviana, una sola hoja maestra bien gobernada. Costo: $80,000 a $250,000 MXN según complejidad.
PASO 03 · 3–4 MESES
Piloto de agente de IA
Solo después de los dos pasos anteriores. Ahora la conversación con un proveedor es productiva: puedes responder a la pregunta inicial — los datos viven aquí, se actualizan así, son consistentes con estas definiciones. El piloto debe ser específico (no un agente para todo), medible (con métricas claras de éxito), y reversible (si no funciona, no quiebra la operación).

Tres ideas para cerrar

Primero. La pregunta no es si tu empresa "necesita IA". La pregunta es si los datos que el agente va a usar están en un lugar legible para una máquina. Esa es la única pregunta que importa antes de invertir.

Segundo. Si la respuesta es no, el siguiente paso correcto no es buscar el mejor Proveedor de IA — es ordenar los datos. Esa es una conversación de Ingeniería de Datos, no de IA, y suele costar entre cinco y diez veces menos que el proyecto de IA que iba a fracasar.

Tercero. El proyecto correcto en cada momento depende de dónde estés. Saltar al final de la cadena cuando estás al principio es la forma más cara de fracasar — y es lo que hacen casi todas las empresas que terminan con un agente que nadie usa después de seis meses.