Cada organización funciona con documentos — y con los frágiles scripts que los trasladan entre formatos. Los informes de Word se convierten en PDFs, las hojas de cálculo en CSV, los escaneos en archivos buscables. Cada nuevo formato o regla implica reescribir una canalización. Existe una forma más flexible: dejar que un agente de IA haga las conversiones, en tu propia infraestructura, usando las herramientas que le proporciones. Este artículo muestra cómo construir exactamente eso con n8n, el Model Context Protocol (MCP) y el servidor GroupDocs.Conversion MCP, manteniendo tus documentos (y opcionalmente tu modelo de IA) completamente en las instalaciones.
De canalizaciones codificadas a automatización agente‑céntrica
La automatización tradicional codifica cómo se realiza una tarea: detectar el tipo de archivo, ramificar, llamar al conversor, manejar errores, escribir la salida. Cada nuevo requisito implica un cambio de código.
Una canalización agente‑céntrica codifica qué deseas. Declaras el objetivo — “convertir estos informes a PDF, pero comprobar primero el número de páginas” — y expones un conjunto de herramientas. El agente de IA decide qué herramientas llamar y en qué orden, y se adapta al resultado. Añade una herramienta y el agente puede usarla inmediatamente, sin volver a cablear. Esa adaptabilidad es el objetivo principal.
Qué es MCP y por qué importa aquí
La parte difícil de los agentes que usan herramientas siempre ha sido la integración — cada agente hablaba con cada herramienta de manera diferente. El Model Context Protocol es un estándar abierto y neutral que soluciona esto: cualquier agente compatible con MCP puede descubrir y llamar a cualquier capacidad de un servidor MCP. Piensa en ello como “USB‑C para herramientas de IA”.
GroupDocs publica operaciones de documentos como servidores MCP. El servidor GroupDocs.Conversion expone tres herramientas que un agente puede llamar:
| Herramienta | Qué hace |
|---|---|
convert |
Convierte un documento a otro formato (PDF, DOCX, XLSX, PPTX, HTML, PNG, CSV… más de 70 formatos) |
get_document_info |
Inspecciona un archivo — tipo, número de páginas, propiedades — antes de actuar |
get_supported_formats |
Descubre qué conversiones son posibles |
Al hablar MCP, tu agente no necesita una integración personalizada con GroupDocs. Simplemente ve las herramientas.
La arquitectura (todo código abierto, lleva tu propio LLM)
| Capa | Componente | Rol |
|---|---|---|
| Orquestación | n8n (auto‑alojado) | disparadores, el nodo AI Agent, enrutamiento de archivos |
| Razonamiento | Tu LLM, a través del nodo Chat Model de n8n | decide qué herramientas llamar — totalmente intercambiable |
| Herramientas | GroupDocs.Conversion MCP (stdio) detrás de supergateway | convert, get_document_info, get_supported_formats |
| Almacenamiento | un volumen Docker compartido | cómo fluyen los archivos de entrada y salida |
Una decisión clave de diseño: el LLM es enchufable. El nodo Chat Model de n8n es independiente del proveedor, de modo que el agente y las herramientas MCP nunca cambian cuando sustituyes modelos. El ejemplo a continuación usa OpenAI, pero el mismo flujo funciona en Azure OpenAI, Anthropic, AWS Bedrock — o un modelo totalmente auto‑alojado (Ollama, vLLM) cuando necesitas un despliegue aislado donde los documentos y la IA permanecen dentro de tu red.
Una nota de integración: el Conversion MCP es un servidor stdio ligero (el predeterminado seguro, sin red). Como n8n se conecta a las herramientas MCP mediante una URL, un pequeño puente de código abierto stdio‑to‑SSE (supergateway) lo expone en un puerto. El servidor en sí no se modifica.
Cómo se ejecuta la canalización
- Disparador — un webhook, correo entrante, carga de formulario o carpeta vigilada recibe un documento.
- Etapa — n8n escribe el archivo en la carpeta de almacenamiento compartido que lee el servidor MCP.
- Razonar — el AI Agent de n8n (tu Chat Model + el Conversion MCP como herramienta) recibe una instrucción como “Convertir report.docx a PDF y reportar el número de páginas.” Llama autónomamente a
get_document_info, luego aconvert. - Entregar — n8n toma el archivo convertido del almacenamiento compartido y lo dirige a su destino — correo, almacenamiento de objetos, SharePoint o la respuesta original.
El agente elige las herramientas y el orden. Eso permite que una única canalización maneje “solo conviértelo”, “convierte solo si tiene más de 10 páginas”, o “convierte y resume”.
Ponlo en marcha en minutos
Una pila mínima son dos servicios que comparten un volumen — el conversor (detrás del puente) y n8n:
services:
conversion-mcp: # GroupDocs.Conversion MCP, expuesto vía SSE
build: ./bridge # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
environment:
GROUPDOCS_MCP_STORAGE_PATH: /data
GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
volumes: [ ./data:/data, ./gd-license:/license:ro ]
n8n:
image: n8nio/n8n:latest
ports: ["5678:5678"]
volumes: [ ./data:/data ] # MISMA carpeta — el paso de archivo
Luego, en n8n, construye el agente con cuatro nodos: un Chat Trigger, un Chat Model (tus credenciales de OpenAI), una herramienta MCP Client apuntando a http://conversion-mcp:8000/sse, y un AI Agent que los conecta. Coloca un archivo en ./data, abre el chat y pídele al agente que lo convierta.
La configuración completa y ejecutable —
docker-compose.yml, la imagen del puente y un flujo de trabajo n8n importable — está en el repositorio de código abierto complementario (ver más abajo).
Licenciamiento
Sin una licencia, GroupDocs.Conversion se ejecuta en modo de evaluación: la salida lleva marca de agua y el uso puede estar limitado. Para producción, coloca un archivo GroupDocs.Total.lic en la carpeta de licencias montada; la salida será limpia y sin restricciones. Puedes solicitar una licencia temporal para probar la salida con licencia.
Por qué encaja en la empresa
- Soberanía de datos — los documentos y el motor de conversión permanecen en tu infraestructura. Elige un modelo auto‑alojado y la IA también lo hará.
- Sin bloqueo — cada capa es código abierto o basada en estándares (MCP). Cambia libremente el LLM, el orquestador o las herramientas.
- Auditabilidad — cada decisión del agente y cada llamada a herramienta son una ejecución de n8n visible y reproducible.
- Composibilidad — este es el beneficio acumulativo. Apunta el mismo agente a los demás servidores MCP de GroupDocs — Redaction, Watermark, Metadata — y una solicitud en lenguaje natural se convierte en una canalización completa: “redactar la información personal, convertir a PDF y luego aplicar la marca de agua ‘Confidencial’.”
Empezar
- Demo de código abierto complementario: GroupDocs.Conversion.Agentic — clónalo, agrega tu clave LLM,
docker compose upy comienza a conversar con tus documentos. - NuGet:
GroupDocs.Conversion.Mcp - Imagen Docker:
ghcr.io/groupdocs-conversion/conversion-net-mcp - Aprende más sobre MCP: modelcontextprotocol.io
La automatización agente‑céntrica de documentos no es una idea lejana — está a un docker compose up de distancia, construida con piezas que puedes leer, alojar y confiar. Da a tus agentes de IA la capacidad de convertir documentos, bajo tus condiciones.