¿Qué es el Sistema RAG?
RAG (Retrieval-Augmented Generation) es un sistema de inteligencia artificial especializado en el procesamiento de información empresarial y legal.
- ✨ Procesa documentos PDF con tecnología OCR avanzada.
- 🧠 Comprende el contenido utilizando modelos de IA de última generación (DeepSeek/OpenAI).
- 💬 Responde preguntas específicas sobre sus documentos con rigor y precisión.
- 🎭 Se adapta a roles (contador, abogado, financiero, etc.).
- 📊 Extrae datos estructurados en formatos útiles (Excel, JSON, PDF).
🚀 Ventajas Principales:
🎯 Casos Ideales
- 📊 Análisis financiero y extractos bancarios
- ⚖️ Documentos legales, contratos, demandas
- 🧾 Facturas comerciales y validación DIAN
- 🔧 Manuales técnicos y de ingeniería
- 📚 Textos académicos y tesis
⏱️ Tiempo Promedio
- Subida: 30 segundos
- Procesamiento: 2-5 min (según volumen)
- Consultas: Instantáneas
🧭 Navegación del Sistema (v3.78+)
El sistema tiene 5 opciones directas en la barra horizontal superior:
Proyectos
Crear, seleccionar y gestionar proyectos y roles.
Siempre accesibleProc. Documental
Subir documentos, tablas extraídas, y fuentes.
Req. ProyectoChat & Análisis
Chat IA, visualizaciones y exportación.
Req. DocsFormato
Estilos y plantillas para exportar a Word/PDF.
Req. DocsConfiguración
Proveedores IA, uso, privacidad y roles.
Siempre accesible
Guía Completa de Uso
Los proyectos son espacios organizados donde agrupas documentos relacionados. DEBES crear un proyecto ANTES de subir documentos.
- 🗂️ Organización: Mantén documentos relacionados juntos.
- 📊 Contexto: El sistema entiende la relación entre documentos.
- 💾 Historial: Conserva conversaciones y análisis anteriores.
Cómo crearlo:
- Haz clic en "🗃️ Proyectos" en la barra superior.
- Clic en el botón verde "Crear Nuevo Proyecto".
- Asigna un Nombre (Ej: "Declaración Renta 2024") y una breve descripción.
- Selecciónalo en la lista para activarlo y comenzar.
Formatos Soportados:
✅ PDF (texto e imágenes escaneadas)
✅ Documentos Office (Word .docx, Excel
.xlsx)
✅ Texto plano (.txt, .md)
✅ Audio (.mp3, .wav,
.m4a, etc.): Transcripción automática.
✅ Carpetas completas: Sube lotes enteros; el sistema preservará
la estructura de directorios.
Recomendaciones de Calidad:
- 📸 Resolución mínima de escaneo: 300 DPI.
- 🔤 Texto escaneado legible y bien contrastado.
- 🎤 En audios, procura reducir el nivel de ruido de fondo.
- 🗂️ Un solo tema por documento mejora fuertemente la lectura AI.
- Ve a la pestaña "📄 Proc. Documental"
- Clic en "Browse files" y selecciona tus PDF
- Espera a que el analizador cargue e inicie la cola de procesamiento.
🔄 Procesamiento Automático en Segundo Plano
El sistema cuenta con motores OCR escalonados que actúan silenciosamente:
- 1. PyMuPDF: Extracción texto digital (ultra-rápido).
- 2. Tesseract OCR: Para escaneos típicos.
- 3. Google Cloud Vision: OCR avanzado para documentos complejos o alta distorsión.
- 4. DeepSeek Vision: Análisis multimodal visual (fallback).
| Volumen | Tiempo Estimado |
|---|---|
| 1-5 Páginas | 1 - 2 Minutos |
| 6-20 Páginas | 3 - 5 Minutos |
| Más de 20 Págs | 5 - 10 Minutos |
Interactúa conversacionalmente y solicita datos específicos, análisis, resúmenes y relaciones con fuentes 100% citadas.
Consultas Efectivas
- Extracción: "Lista los montos y conceptos"
- Análisis: "¿Cuál es el tema principal del docs?"
- Cálculos: "Suma total de pagos de enero"
- Relación: "¿Hay contradicciones entre el PDF A y PDF B?"
Consejos de Experto
- ✅ Sé específico con lo que deseas.
- ✅ Pide formato (tabla, lista, viñeta).
- ✅ Confirma exactitud (pide revisión doble).
🎛️ 10 Pestañas de Configuración
La pestaña ⚙️ Configuración despliega 10 submódulos de control:
- Gestión de Roles: Crea roles de IA (Ej: Analista HSEQ).
- Preferencias de Fuentes: Fuerza a la IA a priorizar, omitir o buscar solo en ciertos PDFs (ideal para limpiar el "ruido").
- Panel Centralizado y Config RAG: Chunking, distancias de Embedding.
- Modelos IA (5 Proveedores): DeepSeek V3 (Recomendado), Ollama Local (100% Privado), Anthropic Claude 3 Haiku, Google Gemini 2.0 Flash, OpenAI GPT-4o. Incluye fallback automático entre ellos.
- Privacidad y PII: El sistema sanitiza automáticamente datos sensibles (cédulas, nombres) antes de ir al LLM.
- Otras: Métricas de Calidad, Backups, Auditoría, Licencia.
💰 Dashboard de Costos (v3.72)
El sistema documenta cada micro-transacción. Ve a "Consumo IA" en la barra lateral o a "Estadísticas y Costos" en la configuración para auditar por proyecto, por proveedor o por mes.
Casos de Uso Reales
Ejemplos típicos estructurados para desplegar todo el poder analítico de la plataforma por profesiones.
⚖️ Documentos Legales
Rol Sugerido: Abogado Especializado
Contratos, demandas, resoluciones y sentencias.
Ejemplos de Prompt:
- "Analiza las cláusulas e identifica riesgos legales."
- "Resume argumentos jurídicos principales."
- "Compara resolución con jurisprudencia similar."
📊 Análisis Financiero
Rol Sugerido: Contador Especializado
Estados financieros, extractos, balances, 10-K.
Ejemplos de Prompt:
- "Encuentra duplicidades o inconsistencias tributarias."
- "Genera tabla Excel con movimientos organizados."
- "Calcula principales ratios financieros y tendencia."
🔗 Cross-Reference
Rol Sugerido: Analista de Datos
Comparar anexos, facturas vs extracto, contratos vinculados.
Ejemplos de Prompt:
- "¿Qué información repite el anexo en contraste a Base?"
- "Identifica contradicciones entre Factura A y B."
- "Tabla comparativa de cláusulas 2023 vs 2024."
🎯 Objetivo: Validar movimientos bancarios para declaración de renta. 📄 Documento: Extracto Bancolombia Enero-Marzo 2024 (45 páginas).
- Paso 1: Configurar rol "Contador Especializado" con temp = 0.2
- Paso 2: Subir el archivo de 45 páginas y esperar análisis (~4 min)
- Paso 3: Preguntar: "¿Cuál era el saldo inicial y final del período?" (El sistema entrega un saldo neto de apertura y cierre)
- Paso 4: Preguntar: "Clasifica movimientos por tipo y calcula totales" (El sistema separa Ingresos y Egresos sumados)
- Paso 5: Preguntar: "¿Hay inconsistencias?" (El sistema lee transferencias duplicadas o pagos inusuales)
- Paso 6: Output a Excel: "Exporta la tabla Excel completa" generará un file descargable.
Referencias Bibliográficas (Auto-Generadas)
El sistema no alucina. Cada respuesta que proporciona está fundamentada en párrafos exactos de sus documentos o fuentes externas verificadas.
¿Cómo razona realmente el sistema?
El motor inteligente es un sistema RAG (Retrieval-Augmented Generation). Toda respuesta del sistema combina dos capas de conocimiento:
| Capa | Origen de los Datos | Ejemplo Práctico |
|---|---|---|
| 1. Documentos Locales | Tus PDFs, excels o words (la gran prioridad del sistema). | El valor exacto de un activo, el nombre de una persona en un contrato. |
| 2. Conocimiento Experto de la IA | El entrenamiento global del modelo de lenguaje que usas (ej: GPT-4o, DeepSeek). | Saber qué dictan las normas NIIF, qué es un NIT, o cómo interpretar el código contable. |
1. Consulta Normal (Modo Local Estricto)
Las "Instrucciones de Grounding" obligan a la IA a fundamentarse excluyentemente en los textos recuperados. El modelo utiliza su vasta inteligencia solo como un marco analítico, nunca inventando ni rellenando suposiciones fuera del archivo original.
- Extrae citas concretas exactas y rastreables
(ej.
[Pág. 4, Contrato_Laboral.pdf]). - Sugerencia de Uso: Para auditorías numéricas rigurosas o revisiones literales.
2. 🌐 Incluir Fuentes Externas
Si marcas la casilla, añades al contexto normativo del modelo una búsqueda inteligente (mediante DuckDuckGo o SerpAPI) con enlaces web y las sugerencias de portales duros pre-integrados (Ej. DIAN, FASB.org, Superintendencia). Los datos centrales siguen saliendo de tu PDF.
- Permite que la IA cite urls oficiales en la sección final bibliográfica.
- Sugerencia de Uso: Análisis de cumplimiento contable o tributario donde la ley externa (Ej: jurisprudencia) evalúa su documento interior.
$O al
inicio del chat preventivamente se "liberarán" las cadenas de restricción o
"grounding". Esto permite a la Inteligencia Artificial opinar libremente, trazar
estrategias y analizar tu caso como consultor externo usando todo su poder de
entrenamiento mundial, utilizando la data de tu PDF sólo como "referencia
transversal".
Sistema de Confianza y Anti-Alucinación
Las "alucinaciones" ocurren cuando una IA inventa información. Para evitarlo en entornos financieros y legales, AIMAXIMUS incluye protecciones de grado empresarial:
- Validación N-Gramas: Compara milimétricamente lo que generó la IA contra el texto original del documento.
- Guard Financiero: Revisa automáticamente que ninguna suma ni cantidad varíe un solo centavo respecto al documento fuente.
- Autocorrección: Si el sistema detecta que la IA inventó algo crítico, rechaza la respuesta internamente y fuerza al modelo a intentarlo de nuevo.
Avisos de Confianza
Si el sistema no logra asegurar al 100% de certeza la validez de los montos en los intentos permitidos, mostrará un disclaimer amarillo o rojo en la interfaz pidiéndole precaución en la revisión humana. El sistema nunca te presentará algo dudoso como si fuera absoluto.
Soluciones y Troubleshooting
"El archivo no se procesa o se queda en 0%"
Solución: Posiblemente el PDF está protegido con contraseña o dañado. Ábralo en Chrome, dele "Imprimir > Guardar como PDF" e intente subir esa copia.
"La IA responde 'No encontré esa información'"
Solución: Revise la ortografía de su pregunta o use sinónimos. Si es una tabla, intente: "Extrae la tabla de gastos de la página 3". Active "Considerar el historial de chat completo" si la pregunta depende de una anterior.
"El sistema parece lento al responder"
Solución: Si activó las búsquedas web con 🌐, el sistema tarda un poco más (va a internet y vuelve). Para respuestas ultrarrápidas sobre sus PDFs, desactive la búsqueda web. Use el modelo DeepSeek V3 en Configuración si GPT-4 se siente congestionado.
Mejores Prácticas
La técnica del "Hazlo Paso a Paso"
Los LLMs (Modelos de Lenguaje) funcionan mucho mejor si les pides que razonen antes de responder. Al final de su instrucción agregue: "Aplica razonamiento Chain-of-Thought" o "Piensa paso a paso antes de dar el veredicto legal".
Construcción de un Prompt Perfecto:
- Contexto: "Actúa como auditor financiero de la DIAN..."
- Tarea: "...revisa los montos de IVA descontable en las facturas..."
- Restricciones: "...omite los valores en cero e ignora retenciones..."
- Formato: "...y preséntalo exclusivamente en una tabla markdown."
Optimiza el tamaño visual
Documentos gigantescos (de más de mil páginas) diluyen la atención de la IA. Es preferible dividir el PDF de 1200 páginas en 3 PDFs de 400 páginas e insertarlos al mismo proyecto.
Adicionalmente, si el documento está borroso, páselo por una herramienta online para realzar contraste antes de subirlo; la precisión OCR mejorará un 40%.
Exportación y Generación de Reportes
No dejes tus hallazgos atrapados en el chat. Extrae el valor en formatos comerciales estándar.
Exportar Respuesta a PDF o Word
Al final de cada burbuja de respuesta del IA, verás un botón para descargar el texto. Es excelente para transferir un contrato redactado directamente a Word (.docx) listo para imprimir o editar.
Exportación de Tablas a Excel
Pídele al chat: "Hazme una tabla con todas las facturas, fecha, y monto". El sistema generará la tabla en pantalla, y justo debajo aparecerá el botón verde para Exportar a Excel (.xlsx).
Generación Automática
El sistema detecta por sí mismo cuando el resultado contiene matrices o tablas financieras, habilitando instantáneamente las vías de exportación a CSV/Excel sin configuración extra de tu parte.
Roles y Optimización de IA
El sistema puede adoptar 15 "personalidades" analíticas pre-cargadas.
Rol: "Consulta Estricta"
Diseñado para auditoría pura con motor de búsqueda literal. Ignora conocimiento previo.
- "buscar [término]" — búsqueda literal con regex
- "ubicar [nombre]" — localización con página
- "línea de tiempo de [tema]" — extracción cronológica
- "encontrar todas las variables de [concepto]" — extracción clave-valor
Inventario de Roles (15)
| Rol | Especialidad |
|---|---|
| Abogado Especializado | Derecho general, contratos, litigios |
| Contador Público Col. | NIIF, tributaria, DIAN, IVA |
| Médico Generalista | Historias clínicas, farmacología |
| Ingeniero de Sistemas | Documentación, manuales, arquitectura |
| Profesor Universitario | Textos académicos, pedagogía |
| Economista | Análisis macro/micro, indicadores |
| Analista de Datos | Estadística, correlaciones |
| Analista Financiero | Ratios, balances, flujos de caja |
| Experto Catastral | Avalúos, predios, escrituras |
| Sabio (General) | Propósito general, múltiple uso |
| Abogado Tributarista | Estatuto tributario, procesos DIAN |
| Consulta Estricta | Búsqueda literal, timeline |
| Universal (Default) | Equilibrio precisión y flexibilidad |
| Consulta Directa | Respuestas concisas sin análisis |
| Jurista Senior | Jurisprudencia, casación, tutelas |
🆕 Novedades de las últimas versiones
- v3.61-3.63: Visualizaciones auto. Ahora dibujamos gráficos interactivos al detectar requests comparativos.
- v3.60: Lotes y Carpetas. Soporte de arrastrar carpetas enteras de cientos de archivos manteniendo la jerarquía original local.
- v3.59: Pipeline PII / Privacidad. Enmascaramiento activo; la IA nunca ve una cédula o dato directo de PII si el usuario no quiere.
- v3.58: Auditoría Estructural. Más precisión en estructuración final del documento procesado.
- v3.56: Nuevos Archivos. Pasamos de solo "PDF" a soportar
transcripciones de Audio, Word (
.docx) y hojas Excel o CSV.
Sistema de Gobernanza de Estilo y Formato
Este sistema le permite personalizar sus descargas exportadas a `.docx` y `.pdf` manteniendo los lineamientos de su empresa.
Personalización de Tipografía
Controla márgenes (en centímetros), interlineado (ej. 1.0, 1.15x, 2.0x), familia de fuente principal (Calibri, Times New Roman, Garamond) y la numeración automática de los subtítulos H1, H2.
| Plantilla | Uso Ideal | Specs |
|---|---|---|
| Corporativo | Informes y actas empresariales | Calibri 11pt, 1.15x |
| Jurídico | Demandas y resoluciones | Times 12pt, 1.5x |
| Académico | Investigación (APA guiado) | Garamond 12pt, 2.0x |
| Técnico | Manuales, manuales operativos | Arial 10pt, 1.0x |
Ejemplos Interactivos
Aprende a usar el sistema RAG con ejemplos paso a paso guiados de las tareas más comunes que suelen ejecutar nuestros usuarios élite.
Análisis de Extracto Bancario
Pasos de Simulación:
- Configurar la Temperatura en 0.2 para extraer cifras sin "alucinaciones".
- Subir el paquete de extractos unidos en 1 solo PDF.
- Esperar al indicador de completitud del motor OCR.
- Prompt sugerido: "Clasifica todos los movimientos por tipo y calcula totales separados de ingresos vs egresos."
- Genera Excel mediante la solicitud: "Hazme esto en tabla" y click al botón.
¿Qué aprenderás?
- Separar flujos de caja.
- Detección automática de duplicados bancarios.
- Creación de resúmenes por periodo contable.
Análisis de Contrato Legal
Pasos de Simulación:
- Configurar la Temperatura en 0.3 para exhaustividad textual.
- Subir Contratos escaneados. El sistema identificará incluso firmas y sellos gracias a DeepSeek Vision.
- Prompt crítico: "Haz un abstract de rescisión de contrato e indica las cláusulas y penalidades."
- Descarga el informe jurídico en
.docxcon formato "Jurídico" aplicado.
Procesamiento de Facturas
Subida de múltiples facturas PDF sueltas. El sistema las leerá como una gran base de datos compartida.
Prompt mágico sugerido:
"Analiza todas las facturas y dame una tabla que tenga: Proveedor, NIT, Fecha, Monto Bruto, IVA, y Total."