RAG
Técnica que hace que un modelo de lenguaje (LLM) responda usando los documentos de tu empresa, no solo su entrenamiento general. El sistema primero busca fragmentos relevantes en una base de conocimiento propia y luego el LLM genera la respuesta combinando lo encontrado con su capacidad de lenguaje. Es la forma más común de aterrizar IA generativa en contextos corporativos sin reentrenar un modelo.
¿Cuándo usar RAG en una empresa?
Cuando necesitas respuestas basadas en políticas internas, manuales, contratos, históricos o cualquier base de conocimiento que el modelo base no conoce. Típicamente el primer paso después de prompting antes de considerar fine-tuning.
¿Cuándo NO conviene RAG?
Cuando tus datos cambian por segundo, cuando necesitas razonamiento cuantitativo complejo, o cuando la calidad del dato fuente es pobre — RAG amplifica la calidad del corpus, no la compensa.