Cómo armar una base de conocimiento para tu IA
Lunes a la mañana. Le pediste a la IA que atienda a tus clientes y la primera respuesta fue brillante. La segunda inventó un precio que no existe, la tercera dio un horario viejo. No es que la IA falle: es que le pediste que responda sobre tu negocio sin darle, ordenada, la información de tu negocio.
Armar una base de conocimiento para tu IA es juntar y ordenar toda la información que tu negocio necesita que la IA sepa —precios, políticas, preguntas frecuentes, procesos— en un formato que pueda usar de forma confiable. Es el paso que más determina si la IA suena como parte de tu equipo o improvisa, y la mayoría lo saltea. Sin base de conocimiento, hasta el mejor modelo inventa.
Este es un satélite de la guía completa de context engineering: acá vemos cómo construir la información que tu IA va a usar.
Qué es una base de conocimiento, en simple
Una base de conocimiento es el conjunto ordenado de información real de tu negocio que la IA consulta para responder. No es un documento gigante volcado de cualquier manera: es información partida en piezas claras, cada una autocontenida y actualizada.
La diferencia con "pegarle todo a la IA" es enorme. Cuando volcás todo en un texto largo, el modelo pierde lo importante en el medio —el fenómeno "lost in the middle" que explicamos en por qué la IA olvida: la ventana de contexto—. Una base bien armada evita eso: la IA trae solo la pieza relevante a cada pregunta, sin ruido.
Por qué sin base la IA inventa
Cuando una IA no tiene tu información, no se queda callada: completa con lo que "supone". Los estudios de hallucination muestran lo lejos que puede llegar eso. En un análisis de Stanford sobre consultas legales, los modelos inventaron respuestas entre el 69% y el 88% de las veces cuando no tenían la fuente correcta. La lección para tu negocio es directa: una IA sin tu información ordenada no es neutral, es peligrosa, porque afirma con seguridad cosas que no sabe.
Los cuatro bloques que toda base necesita
Una base de conocimiento útil se arma sobre cuatro bloques de información que tu negocio ya tiene desparramados. Juntarlos y ordenarlos es el trabajo:
| Bloque | Qué incluye | Cada cuánto cambia |
|---|---|---|
| Datos duros | Precios, horarios, ubicación, contacto | Seguido |
| Políticas | Devoluciones, garantías, envíos, pagos | A veces |
| Preguntas frecuentes | Las consultas que más te repiten | Lento |
| Procesos | Cómo se hace un pedido, un turno, un reclamo | Lento |
El error típico es tener estos cuatro bloques en la cabeza de una persona o repartidos en chats viejos. Mientras vivan así, la IA no puede usarlos. El primer paso de armar la base es sacarlos de ahí y escribirlos.
La regla de las piezas autocontenidas
Cada pieza de información tiene que entenderse sola, sin depender de otra. Una pieza que arranca con "según lo anterior, no se aceptan devoluciones" no sirve: si la IA la trae sin la pieza previa, queda colgada y sin sentido. En cambio "No se aceptan devoluciones después de 30 días de la compra" se entiende sola y la IA la puede usar en cualquier contexto. Esta regla de autocontención es la misma que hace que las respuestas de una buena IA suenen completas: cada pieza es una respuesta lista.
Cómo ordenar la información para que la IA la use bien
Tener la información no alcanza: hay que ordenarla para que la IA la encuentre y la priorice. Lo crítico va donde el modelo mejor lo procesa, y lo accesorio no compite con lo importante.
La regla de oro: las reglas no negociables —las que la IA no puede equivocar nunca, como una política de cobro— van repetidas al inicio y al final del contexto, nunca enterradas en el medio. Lo desarrollamos en por qué la IA olvida. Y para bases grandes que cambian seguido, conviene recuperación selectiva en vez de volcar todo, un enfoque que comparamos en RAG vs contexto largo para tu negocio.
Del prompt suelto al sistema
Armar la base de conocimiento es el corazón de pasar de prompts sueltos a un sistema de contexto. Un prompt suelto es pedirle algo a la IA y rezar; un sistema es darle, ordenada, toda la información que necesita para responder bien siempre. Ese salto de mentalidad lo desarrollamos en prompts para tu negocio: del prompt al sistema de contexto. La base de conocimiento es lo que convierte respuestas que a veces aciertan en respuestas que aciertan por diseño.
Los errores que arruinan una base de conocimiento
Armar la base mal es casi tan común como no armarla, y los errores son siempre los mismos tres. El primero: volcar todo en un documento gigante sin estructura, lo que reproduce el problema "lost in the middle" en vez de resolverlo. El segundo: dejar piezas que dependen unas de otras, de modo que cuando la IA trae una sin la otra, queda incompleta. El tercero, el más silencioso: no actualizarla, de manera que la IA empieza a afirmar precios o políticas viejas con la misma seguridad de siempre.
| Error | Qué provoca | Cómo se arregla |
|---|---|---|
| Documento gigante sin estructura | La IA pierde lo importante | Partir en piezas claras |
| Piezas que se referencian entre sí | Respuestas incompletas | Hacer cada pieza autocontenida |
| Base desactualizada | La IA afirma datos viejos | Actualizar el día que algo cambia |
Reconocer estos tres errores antes de empezar te ahorra rehacer la base desde cero a los pocos meses, que es el desenlace típico cuando se arma con apuro.
Empezá chico: las 20 preguntas que más te repiten
No hace falta documentar todo tu negocio el primer día. La base más útil arranca con las 20 preguntas que tus clientes te hacen una y otra vez —horarios, precios, envíos, devoluciones— con sus respuestas exactas y autocontenidas. Esas 20 piezas suelen cubrir la enorme mayoría de las consultas reales, así que con poco trabajo ya tenés una IA que responde bien lo más frecuente. Después la base crece sola: cada pregunta que la IA no supo responder es una pieza nueva que sumás. Empezar chico y crecer con datos reales le gana siempre a intentar un documento perfecto y completo que nunca terminás.
Cómo mantenerla viva
Una base de conocimiento desactualizada es peor que no tener ninguna, porque la IA afirma con seguridad información vieja. Mantenerla viva es parte del trabajo, no un extra. Los pasos:
- Asigná un responsable de actualizar la información cuando cambia.
- Cada vez que cambie un precio o política, actualizá la pieza ese día.
- Revisá semanalmente qué preguntó la gente que la IA no supo responder.
- Agregá esas preguntas nuevas a la base como piezas autocontenidas.
- Borrá lo que ya no aplica para que no compita con lo vigente.
Ese ciclo convierte la base en un sistema que mejora solo: cada consulta que la IA no supo responder es una pieza nueva que sumás. Con el tiempo, la base cubre cada vez más sin que tengas que adivinar.
Si querés un sistema de IA con una base de conocimiento ordenada y actualizada —que responda desde tu información real y no invente— en martinpavon.com lo diseñamos a medida de tu negocio.
Preguntas frecuentes
¿Qué es una base de conocimiento para una IA?
Es el conjunto ordenado de información real de tu negocio —precios, políticas, preguntas frecuentes y procesos— que la IA consulta para responder. No es un documento volcado de cualquier forma, sino piezas claras, autocontenidas y actualizadas.
¿Por qué la IA inventa respuestas sin una base de conocimiento?
Porque cuando no tiene tu información, completa con suposiciones. Estudios de Stanford sobre consultas legales midieron que los modelos inventan entre el 69% y el 88% de las veces sin la fuente correcta. Una IA sin tu información ordenada afirma con seguridad cosas que no sabe.
¿Qué información debe tener la base de conocimiento?
Cuatro bloques: datos duros (precios, horarios), políticas (devoluciones, envíos), preguntas frecuentes y procesos (cómo se hace un pedido o un reclamo). El trabajo es sacarlos de la cabeza de una persona o de chats viejos y escribirlos ordenados.
¿Cómo ordeno la información para que la IA la use bien?
Las reglas no negociables van repetidas al inicio y al final del contexto, nunca enterradas en el medio donde el modelo las pierde. Y cada pieza debe entenderse sola, sin depender de otra. Para bases grandes que cambian, conviene recuperación selectiva.
¿Cada cuánto hay que actualizar la base de conocimiento?
Cada vez que cambia un dato, el mismo día: una base desactualizada hace que la IA afirme información vieja con seguridad. Además, conviene revisar semanalmente qué no supo responder y sumar esas preguntas como piezas nuevas.
