Documentación Oficial

Manual de Usuario

Guía completa para el uso del sistema de análisis inteligente de documentos RAG. Aprende a procesar, consultar y exportar.

¿Qué es el Sistema RAG?

RAG (Retrieval-Augmented Generation) es un sistema de inteligencia artificial especializado en el procesamiento de información empresarial y legal.

  • Procesa documentos PDF con tecnología OCR avanzada.
  • 🧠 Comprende el contenido utilizando modelos de IA de última generación (DeepSeek/OpenAI).
  • 💬 Responde preguntas específicas sobre sus documentos con rigor y precisión.
  • 🎭 Se adapta a roles (contador, abogado, financiero, etc.).
  • 📊 Extrae datos estructurados en formatos útiles (Excel, JSON, PDF).
🚀 Ventajas Principales:
Precisión Superior OCR Roles Configurables Análisis Contextual Memoria Conversacional
🎯 Casos Ideales
  • 📊 Análisis financiero y extractos bancarios
  • ⚖️ Documentos legales, contratos, demandas
  • 🧾 Facturas comerciales y validación DIAN
  • 🔧 Manuales técnicos y de ingeniería
  • 📚 Textos académicos y tesis
⏱️ Tiempo Promedio
  • Subida: 30 segundos
  • Procesamiento: 2-5 min (según volumen)
  • Consultas: Instantáneas

🧭 Navegación del Sistema (v3.78+)

El sistema tiene 5 opciones directas en la barra horizontal superior:

🗃️
Proyectos

Crear, seleccionar y gestionar proyectos y roles.

Siempre accesible
📄
Proc. Documental

Subir documentos, tablas extraídas, y fuentes.

Req. Proyecto
🧠
Chat & Análisis

Chat IA, visualizaciones y exportación.

Req. Docs
🎨
Formato

Estilos y plantillas para exportar a Word/PDF.

Req. Docs
⚙️
Configuración

Proveedores IA, uso, privacidad y roles.

Siempre accesible
Vista real del sistema
Vista general de AIMAXIMUS con la guía completa de uso visible
📸 Pantalla principal de AIMAXIMUS — vista de la Guía Completa de Uso con la barra de navegación superior y panel lateral
Barra de navegación superior del sistema AIMAXIMUS
📸 Barra de navegación superior con las 5 secciones principales

Guía Completa de Uso

Los proyectos son espacios organizados donde agrupas documentos relacionados. DEBES crear un proyecto ANTES de subir documentos.

  • 🗂️ Organización: Mantén documentos relacionados juntos.
  • 📊 Contexto: El sistema entiende la relación entre documentos.
  • 💾 Historial: Conserva conversaciones y análisis anteriores.
Cómo crearlo:
  1. Haz clic en "🗃️ Proyectos" en la barra superior.
  2. Clic en el botón verde "Crear Nuevo Proyecto".
  3. Asigna un Nombre (Ej: "Declaración Renta 2024") y una breve descripción.
  4. Selecciónalo en la lista para activarlo y comenzar.
Verificación: Asegúrate de ver el nombre del proyecto en la tarjeta lateral. Si no tienes uno seleccionado, NO podrás subir documentos.
Pantalla de gestión de proyectos mostrando la lista de proyectos y el botón Crear Nuevo Proyecto
📸 Vista "Proyectos" — lista de proyectos existentes con opciones de gestión
Pantalla de selección de proyecto activo en AIMAXIMUS
📸 Selector de proyecto activo — haz clic para activar y comenzar a trabajar

Formatos Soportados:

PDF (texto e imágenes escaneadas)
Documentos Office (Word .docx, Excel .xlsx)
Texto plano (.txt, .md)
Audio (.mp3, .wav, .m4a, etc.): Transcripción automática.
Carpetas completas: Sube lotes enteros; el sistema preservará la estructura de directorios.

Recomendaciones de Calidad:
  • 📸 Resolución mínima de escaneo: 300 DPI.
  • 🔤 Texto escaneado legible y bien contrastado.
  • 🎤 En audios, procura reducir el nivel de ruido de fondo.
  • 🗂️ Un solo tema por documento mejora fuertemente la lectura AI.
Lista de documentos del proyecto mostrando formatos PDF, Word y Excel procesados con sus metadatos
📸 Lista de Documentos — todos los formatos soportados (PDF, Word, Excel, TXT) en un solo panel

  1. Ve a la pestaña "📄 Proc. Documental"
  2. Clic en "Browse files" y selecciona tus PDF
  3. Espera a que el analizador cargue e inicie la cola de procesamiento.
🔄 Procesamiento Automático en Segundo Plano

El sistema cuenta con motores OCR escalonados que actúan silenciosamente:

  • 1. PyMuPDF: Extracción texto digital (ultra-rápido).
  • 2. Tesseract OCR: Para escaneos típicos.
  • 3. Google Cloud Vision: OCR avanzado para documentos complejos o alta distorsión.
  • 4. DeepSeek Vision: Análisis multimodal visual (fallback).
Volumen Tiempo Estimado
1-5 Páginas 1 - 2 Minutos
6-20 Páginas 3 - 5 Minutos
Más de 20 Págs 5 - 10 Minutos
Pantalla de subida de archivos en el procesamiento documental
📸 Panel de subida — arrastra o selecciona tus archivos PDF, Word o Excel
Interfaz de carga de carpetas completas de documentos del proyecto
📸 Carga masiva — puedes subir carpetas completas preservando la estructura
Indicador de procesamiento OCR en segundo plano en la barra lateral
📸 OCR en segundo plano — el sistema procesa mientras sigues trabajando
Barra de progreso del procesamiento documental mostrando porcentaje de avance
📸 Progreso en tiempo real — barra de avance por documento
Informe de avance del procesamiento con detalles de páginas y chunks generados
📸 Informe de avance — detalle de páginas procesadas, chunks y estado OCR

Interactúa conversacionalmente y solicita datos específicos, análisis, resúmenes y relaciones con fuentes 100% citadas.

Consultas Efectivas
  • Extracción: "Lista los montos y conceptos"
  • Análisis: "¿Cuál es el tema principal del docs?"
  • Cálculos: "Suma total de pagos de enero"
  • Relación: "¿Hay contradicciones entre el PDF A y PDF B?"
Consejos de Experto
  • ✅ Sé específico con lo que deseas.
  • ✅ Pide formato (tabla, lista, viñeta).
  • ✅ Confirma exactitud (pide revisión doble).
Vista inicial de la sección Chat y Análisis con el campo de consulta y opciones
📸 Chat & Análisis — pantalla de inicio con campo de consulta y opciones de búsqueda
Pantalla del chat mostrando una pregunta y respuesta de la IA con referencias documentales
📸 Respuesta contextualizada — la IA responde basándose en tus documentos con citas exactas
Campo de entrada de pregunta en el chat inteligente de AIMAXIMUS
📸 Campo de consulta — escribe tu pregunta y presiona Enter
Opciones avanzadas de búsqueda en el chat: modo local, fuentes externas y configuración
📸 Opciones de búsqueda — activa fuentes externas o modo estricto según tu necesidad

🎛️ 10 Pestañas de Configuración

La pestaña ⚙️ Configuración despliega 10 submódulos de control:

  • Gestión de Roles: Crea roles de IA (Ej: Analista HSEQ).
  • Preferencias de Fuentes: Fuerza a la IA a priorizar, omitir o buscar solo en ciertos PDFs (ideal para limpiar el "ruido").
  • Panel Centralizado y Config RAG: Chunking, distancias de Embedding.
  • Modelos IA (5 Proveedores): DeepSeek V3 (Recomendado), Ollama Local (100% Privado), Anthropic Claude 3 Haiku, Google Gemini 2.0 Flash, OpenAI GPT-4o. Incluye fallback automático entre ellos.
  • Privacidad y PII: El sistema sanitiza automáticamente datos sensibles (cédulas, nombres) antes de ir al LLM.
  • Otras: Métricas de Calidad, Backups, Auditoría, Licencia.

💰 Dashboard de Costos (v3.72)

El sistema documenta cada micro-transacción. Ve a "Consumo IA" en la barra lateral o a "Estadísticas y Costos" en la configuración para auditar por proyecto, por proveedor o por mes.

Panel avanzado de modelos de IA con configuración de proveedores DeepSeek OpenAI Anthropic y Google
📸 Configuración de modelos IA — gestiona proveedores, prioridades y API Keys
Panel avanzado de privacidad con configuración de sanitización PII y modo offline
📸 Panel de Privacidad — configura el nivel de protección de datos personales

Casos de Uso Reales

Ejemplos típicos estructurados para desplegar todo el poder analítico de la plataforma por profesiones.

⚖️ Documentos Legales

Rol Sugerido: Abogado Especializado

Contratos, demandas, resoluciones y sentencias.


Ejemplos de Prompt:

  • "Analiza las cláusulas e identifica riesgos legales."
  • "Resume argumentos jurídicos principales."
  • "Compara resolución con jurisprudencia similar."
📊 Análisis Financiero

Rol Sugerido: Contador Especializado

Estados financieros, extractos, balances, 10-K.


Ejemplos de Prompt:

  • "Encuentra duplicidades o inconsistencias tributarias."
  • "Genera tabla Excel con movimientos organizados."
  • "Calcula principales ratios financieros y tendencia."
🔗 Cross-Reference

Rol Sugerido: Analista de Datos

Comparar anexos, facturas vs extracto, contratos vinculados.


Ejemplos de Prompt:

  • "¿Qué información repite el anexo en contraste a Base?"
  • "Identifica contradicciones entre Factura A y B."
  • "Tabla comparativa de cláusulas 2023 vs 2024."

🎯 Objetivo: Validar movimientos bancarios para declaración de renta. 📄 Documento: Extracto Bancolombia Enero-Marzo 2024 (45 páginas).

  • Paso 1: Configurar rol "Contador Especializado" con temp = 0.2
  • Paso 2: Subir el archivo de 45 páginas y esperar análisis (~4 min)
  • Paso 3: Preguntar: "¿Cuál era el saldo inicial y final del período?" (El sistema entrega un saldo neto de apertura y cierre)
  • Paso 4: Preguntar: "Clasifica movimientos por tipo y calcula totales" (El sistema separa Ingresos y Egresos sumados)
  • Paso 5: Preguntar: "¿Hay inconsistencias?" (El sistema lee transferencias duplicadas o pagos inusuales)
  • Paso 6: Output a Excel: "Exporta la tabla Excel completa" generará un file descargable.

Referencias Bibliográficas (Auto-Generadas)

El sistema no alucina. Cada respuesta que proporciona está fundamentada en párrafos exactos de sus documentos o fuentes externas verificadas.

¿Cómo razona realmente el sistema?

El motor inteligente es un sistema RAG (Retrieval-Augmented Generation). Toda respuesta del sistema combina dos capas de conocimiento:

Capa Origen de los Datos Ejemplo Práctico
1. Documentos Locales Tus PDFs, excels o words (la gran prioridad del sistema). El valor exacto de un activo, el nombre de una persona en un contrato.
2. Conocimiento Experto de la IA El entrenamiento global del modelo de lenguaje que usas (ej: GPT-4o, DeepSeek). Saber qué dictan las normas NIIF, qué es un NIT, o cómo interpretar el código contable.
1. Consulta Normal (Modo Local Estricto)

Las "Instrucciones de Grounding" obligan a la IA a fundamentarse excluyentemente en los textos recuperados. El modelo utiliza su vasta inteligencia solo como un marco analítico, nunca inventando ni rellenando suposiciones fuera del archivo original.

  • Extrae citas concretas exactas y rastreables (ej. [Pág. 4, Contrato_Laboral.pdf]).
  • Sugerencia de Uso: Para auditorías numéricas rigurosas o revisiones literales.
2. 🌐 Incluir Fuentes Externas

Si marcas la casilla, añades al contexto normativo del modelo una búsqueda inteligente (mediante DuckDuckGo o SerpAPI) con enlaces web y las sugerencias de portales duros pre-integrados (Ej. DIAN, FASB.org, Superintendencia). Los datos centrales siguen saliendo de tu PDF.

  • Permite que la IA cite urls oficiales en la sección final bibliográfica.
  • Sugerencia de Uso: Análisis de cumplimiento contable o tributario donde la ley externa (Ej: jurisprudencia) evalúa su documento interior.
Modo Abierto de Opinión Estratégica ($O)
Si escribes $O al inicio del chat preventivamente se "liberarán" las cadenas de restricción o "grounding". Esto permite a la Inteligencia Artificial opinar libremente, trazar estrategias y analizar tu caso como consultor externo usando todo su poder de entrenamiento mundial, utilizando la data de tu PDF sólo como "referencia transversal".
Ejemplo real de referencias bibliográficas generadas automáticamente
Respuesta del chat mostrando referencias documentales con citas de página y documento fuente
📸 Referencias documentales auto-generadas — cada respuesta incluye la fuente exacta: documento y número de página

Sistema de Confianza y Anti-Alucinación

Las "alucinaciones" ocurren cuando una IA inventa información. Para evitarlo en entornos financieros y legales, AIMAXIMUS incluye protecciones de grado empresarial:

  • Validación N-Gramas: Compara milimétricamente lo que generó la IA contra el texto original del documento.
  • Guard Financiero: Revisa automáticamente que ninguna suma ni cantidad varíe un solo centavo respecto al documento fuente.
  • Autocorrección: Si el sistema detecta que la IA inventó algo crítico, rechaza la respuesta internamente y fuerza al modelo a intentarlo de nuevo.
Avisos de Confianza

Si el sistema no logra asegurar al 100% de certeza la validez de los montos en los intentos permitidos, mostrará un disclaimer amarillo o rojo en la interfaz pidiéndole precaución en la revisión humana. El sistema nunca te presentará algo dudoso como si fuera absoluto.

Soluciones y Troubleshooting

"El archivo no se procesa o se queda en 0%"

Solución: Posiblemente el PDF está protegido con contraseña o dañado. Ábralo en Chrome, dele "Imprimir > Guardar como PDF" e intente subir esa copia.

"La IA responde 'No encontré esa información'"

Solución: Revise la ortografía de su pregunta o use sinónimos. Si es una tabla, intente: "Extrae la tabla de gastos de la página 3". Active "Considerar el historial de chat completo" si la pregunta depende de una anterior.

"El sistema parece lento al responder"

Solución: Si activó las búsquedas web con 🌐, el sistema tarda un poco más (va a internet y vuelve). Para respuestas ultrarrápidas sobre sus PDFs, desactive la búsqueda web. Use el modelo DeepSeek V3 en Configuración si GPT-4 se siente congestionado.

Mejores Prácticas

La técnica del "Hazlo Paso a Paso"

Los LLMs (Modelos de Lenguaje) funcionan mucho mejor si les pides que razonen antes de responder. Al final de su instrucción agregue: "Aplica razonamiento Chain-of-Thought" o "Piensa paso a paso antes de dar el veredicto legal".

Construcción de un Prompt Perfecto:
  • Contexto: "Actúa como auditor financiero de la DIAN..."
  • Tarea: "...revisa los montos de IVA descontable en las facturas..."
  • Restricciones: "...omite los valores en cero e ignora retenciones..."
  • Formato: "...y preséntalo exclusivamente en una tabla markdown."
Optimiza el tamaño visual

Documentos gigantescos (de más de mil páginas) diluyen la atención de la IA. Es preferible dividir el PDF de 1200 páginas en 3 PDFs de 400 páginas e insertarlos al mismo proyecto.

Adicionalmente, si el documento está borroso, páselo por una herramienta online para realzar contraste antes de subirlo; la precisión OCR mejorará un 40%.

Exportación y Generación de Reportes

No dejes tus hallazgos atrapados en el chat. Extrae el valor en formatos comerciales estándar.

📄
Exportar Respuesta a PDF o Word

Al final de cada burbuja de respuesta del IA, verás un botón para descargar el texto. Es excelente para transferir un contrato redactado directamente a Word (.docx) listo para imprimir o editar.

📊
Exportación de Tablas a Excel

Pídele al chat: "Hazme una tabla con todas las facturas, fecha, y monto". El sistema generará la tabla en pantalla, y justo debajo aparecerá el botón verde para Exportar a Excel (.xlsx).

Generación Automática

El sistema detecta por sí mismo cuando el resultado contiene matrices o tablas financieras, habilitando instantáneamente las vías de exportación a CSV/Excel sin configuración extra de tu parte.

Exportación en acción
Panel de exportación de conversación con opciones de formato Word, PDF y Excel
📸 Panel de exportación de conversación — elige formato Word, PDF o Excel con un clic
Botones de exportación directa del chat: Word, PDF, Excel con la respuesta generada
📸 Botones de exportación rápida — aparecen automáticamente al final de cada respuesta
Opción de guardar respuesta como nota en el proyecto para referencia futura
📸 Guardar como Nota — conserva respuestas importantes dentro del proyecto para consultarlas más tarde

Roles y Optimización de IA

El sistema puede adoptar 15 "personalidades" analíticas pre-cargadas.

Rol: "Consulta Estricta"

Diseñado para auditoría pura con motor de búsqueda literal. Ignora conocimiento previo.

  • "buscar [término]" — búsqueda literal con regex
  • "ubicar [nombre]" — localización con página
  • "línea de tiempo de [tema]" — extracción cronológica
  • "encontrar todas las variables de [concepto]" — extracción clave-valor
Inventario de Roles (15)
Rol Especialidad
Abogado Especializado Derecho general, contratos, litigios
Contador Público Col. NIIF, tributaria, DIAN, IVA
Médico Generalista Historias clínicas, farmacología
Ingeniero de Sistemas Documentación, manuales, arquitectura
Profesor Universitario Textos académicos, pedagogía
Economista Análisis macro/micro, indicadores
Analista de Datos Estadística, correlaciones
Analista Financiero Ratios, balances, flujos de caja
Experto Catastral Avalúos, predios, escrituras
Sabio (General) Propósito general, múltiple uso
Abogado Tributarista Estatuto tributario, procesos DIAN
Consulta Estricta Búsqueda literal, timeline
Universal (Default) Equilibrio precisión y flexibilidad
Consulta Directa Respuestas concisas sin análisis
Jurista Senior Jurisprudencia, casación, tutelas
Gestión de roles en el sistema
Panel lateral mostrando el selector de roles y personalidades de la IA
📸 Selector de Roles en el menú lateral — cambia el perfil de análisis en cualquier momento
Panel avanzado de configuración de roles con opciones de edición, creación y personalización
📸 Panel Avanzado de Roles — crea, edita y personaliza roles ilimitados desde ⚙️ Configuración

🆕 Novedades de las últimas versiones

  • v3.61-3.63: Visualizaciones auto. Ahora dibujamos gráficos interactivos al detectar requests comparativos.
  • v3.60: Lotes y Carpetas. Soporte de arrastrar carpetas enteras de cientos de archivos manteniendo la jerarquía original local.
  • v3.59: Pipeline PII / Privacidad. Enmascaramiento activo; la IA nunca ve una cédula o dato directo de PII si el usuario no quiere.
  • v3.58: Auditoría Estructural. Más precisión en estructuración final del documento procesado.
  • v3.56: Nuevos Archivos. Pasamos de solo "PDF" a soportar transcripciones de Audio, Word (.docx) y hojas Excel o CSV.
Vista real de la sección de novedades en el sistema
Sección de Novedades del Sistema en AIMAXIMUS mostrando el historial de actualizaciones
📸 Novedades del Sistema — historial de versiones con descripción de cada mejora, accesible desde ⚙️ Configuración → Manual
Dashboard de estadísticas de consumo de APIs mostrando costos por proveedor y proyecto
📸 Dashboard de Consumo de APIs — monitorea cada centavo gastado en IA por proyecto y proveedor

Sistema de Gobernanza de Estilo y Formato

Este sistema le permite personalizar sus descargas exportadas a `.docx` y `.pdf` manteniendo los lineamientos de su empresa.

Personalización de Tipografía

Controla márgenes (en centímetros), interlineado (ej. 1.0, 1.15x, 2.0x), familia de fuente principal (Calibri, Times New Roman, Garamond) y la numeración automática de los subtítulos H1, H2.

Plantilla Uso Ideal Specs
Corporativo Informes y actas empresariales Calibri 11pt, 1.15x
Jurídico Demandas y resoluciones Times 12pt, 1.5x
Académico Investigación (APA guiado) Garamond 12pt, 2.0x
Técnico Manuales, manuales operativos Arial 10pt, 1.0x
Alcance de proyecto: Puedes tener una configuración "Global" general, pero si un proyecto específico (ej: "Demanda Client XX") requiere su propio formato legal, puedes sobreescribirlo en la pestaña "📁 Override por Proyecto".
Sistema de formato en acción
Panel de configuración de estilo y formato para exportación con opciones de tipografía e interlineado
📸 Panel de Estilo y Formato — configura fuente, márgenes, interlineado y numeración para tus exportaciones
Vista del manual mostrando la sección de formato y presentación con las plantillas disponibles
📸 Plantillas de presentación — Corporativo, Jurídico, Académico y Técnico con especificaciones predefinidas

Ejemplos Interactivos

Aprende a usar el sistema RAG con ejemplos paso a paso guiados de las tareas más comunes que suelen ejecutar nuestros usuarios élite.

Análisis de Extracto Bancario

⏱️ 15-20 min Dificultad: Intermedio Rol: Contador Especializado

Pasos de Simulación:
  1. Configurar la Temperatura en 0.2 para extraer cifras sin "alucinaciones".
  2. Subir el paquete de extractos unidos en 1 solo PDF.
  3. Esperar al indicador de completitud del motor OCR.
  4. Prompt sugerido: "Clasifica todos los movimientos por tipo y calcula totales separados de ingresos vs egresos."
  5. Genera Excel mediante la solicitud: "Hazme esto en tabla" y click al botón.
¿Qué aprenderás?
  • Separar flujos de caja.
  • Detección automática de duplicados bancarios.
  • Creación de resúmenes por periodo contable.

Análisis de Contrato Legal

⏱️ 12-15 min Dificultad: Avanzado Rol: Abogado Especializado

Pasos de Simulación:
  1. Configurar la Temperatura en 0.3 para exhaustividad textual.
  2. Subir Contratos escaneados. El sistema identificará incluso firmas y sellos gracias a DeepSeek Vision.
  3. Prompt crítico: "Haz un abstract de rescisión de contrato e indica las cláusulas y penalidades."
  4. Descarga el informe jurídico en .docx con formato "Jurídico" aplicado.

Procesamiento de Facturas

⏱️ 8-10 min Dificultad: Básico Rol: Consulta Estricta

Subida de múltiples facturas PDF sueltas. El sistema las leerá como una gran base de datos compartida.

Prompt mágico sugerido:

"Analiza todas las facturas y dame una tabla que tenga: Proveedor, NIT, Fecha, Monto Bruto, IVA, y Total."

El Chat Inteligente en acción
Pantalla completa del chat mostrando múltiples intercambios con la IA y respuestas detalladas
📸 Chat IA en acción — múltiples intercambios con respuestas fundamentadas en tus documentos
Segunda vista del chat mostrando análisis con referencias y fuentes documentales
📸 Análisis con referencias — la IA indica exactamente en qué página del documento encontró la información
Lista completa de documentos del proyecto con detalles de páginas, chunks y fecha de carga
📸 Documentos del proyecto — vista completa con metadatos: páginas, chunks generados y estado de procesamiento
Catálogo de documentos del proyecto con vista de tarjetas y filtros disponibles
📸 Catálogo de documentos — vista de tarjetas con miniatura, tipo y estado de cada archivo del proyecto