Jede Organisation arbeitet mit Dokumenten — und mit den spröden Skripten, die sie zwischen Formaten bewegen. Word‑Berichte werden zu PDFs, Tabellenkalkulationen zu CSVs, Scans zu durchsuchbaren Dateien. Jedes neue Format oder jede neue Regel bedeutet, dass eine Pipeline neu geschrieben werden muss. Es gibt einen flexibleren Weg: Lassen Sie einen AI‑Agent die Konvertierungen auf Ihrer eigenen Infrastruktur durchführen, mit den Werkzeugen, die Sie ihm geben. Dieser Artikel zeigt, wie man genau das mit n8n, dem Model Context Protocol (MCP) und dem GroupDocs.Conversion MCP‑Server aufbaut – wobei Ihre Dokumente (und optional Ihr KI‑Modell) vollständig on‑premise bleiben.
Von hartkodierten Pipelines zur agentischen Automatisierung
Traditionelle Automatisierung kodiert wie eine Aufgabe erledigt wird: Dateityp erkennen, verzweigen, den Konverter aufrufen, Fehler behandeln, Ausgabe schreiben. Jede neue Anforderung bedeutet eine Code‑Änderung.
Ein agentischer Workflow kodiert was Sie wollen. Sie geben das Ziel an – „konvertiere diese Berichte zu PDF, aber prüfe zuerst die Seitenzahl“ – und stellen eine Menge Werkzeuge bereit. Der KI‑Agent entscheidet, welche Werkzeuge er aufruft und in welcher Reihenfolge, und passt sich dem Ergebnis an. Fügen Sie ein Werkzeug hinzu und der Agent kann es sofort nutzen, ohne Umbau. Diese Anpassungsfähigkeit ist der eigentliche Zweck.
Was ist MCP und warum es hier wichtig ist
Der schwierige Teil von Werkzeug‑nutzer‑Agenten war immer die Integration – jeder Agent sprach mit jedem Werkzeug anders. Das Model Context Protocol ist ein offener, herstellerneutraler Standard, der das behebt: Jeder MCP‑fähige Agent kann die Fähigkeiten eines MCP‑Servers entdecken und aufrufen. Denken Sie daran wie „USB‑C für KI‑Werkzeuge“.
GroupDocs veröffentlicht Dokumenten‑Operationen als MCP‑Server. Der GroupDocs.Conversion‑Server stellt drei Werkzeuge bereit, die ein Agent aufrufen kann:
| Werkzeug | Was es tut |
|---|---|
convert |
Konvertiert ein Dokument in ein anderes Format (PDF, DOCX, XLSX, PPTX, HTML, PNG, CSV… über 70 Formate) |
get_document_info |
Untersucht eine Datei – Typ, Seitenzahl, Eigenschaften – bevor etwas unternommen wird |
get_supported_formats |
Ermittelt, welche Konvertierungen möglich sind |
Da er MCP spricht, braucht Ihr Agent keine spezielle GroupDocs‑Integration. Er sieht nur Werkzeuge.
Die Architektur (vollständig Open‑Source, bringen Sie Ihr eigenes LLM mit)
| Schicht | Komponente | Rolle |
|---|---|---|
| Orchestrierung | n8n (self‑hosted) | Trigger, der AI‑Agent‑Knoten, Dateirouting |
| Reasoning | Your LLM, via n8n’s Chat Model node | entscheidet, welche Werkzeuge aufgerufen werden – vollständig austauschbar |
| Werkzeuge | GroupDocs.Conversion MCP (stdio) hinter supergateway | convert, get_document_info, get_supported_formats |
| Speicher | ein shared Docker volume | wie Dateien hinein‑ und herausfließen |
Eine zentrale Design‑Entscheidung: Das LLM ist austauschbar. Der Chat‑Model‑Knoten von n8n ist provider‑agnostisch, sodass Agent und MCP‑Werkzeuge nie geändert werden müssen, wenn Sie Modelle austauschen. Das untenstehende Beispiel nutzt OpenAI, aber derselbe Workflow läuft auf Azure OpenAI, Anthropic, AWS Bedrock – oder einem vollständig selbstgehosteten Modell (Ollama, vLLM), wenn Sie eine luftdichte Bereitstellung benötigen, bei der die Dokumente und die KI innerhalb Ihres Netzwerks bleiben.
Ein Integrations‑Hinweis: Der Conversion‑MCP ist ein leichter stdio‑Server (die sichere, netzwerklose Vorgabe). Da n8n über eine URL mit MCP‑Werkzeugen verbindet, stellt eine kleine Open‑Source stdio‑to‑SSE‑Brücke (supergateway) ihn auf einem Port bereit. Der Server selbst bleibt unverändert.
Wie der Workflow abläuft
- Trigger – ein Webhook, eingehende E‑Mail, Formular‑Upload oder ein beobachteter Ordner erhält ein Dokument.
- Stage – n8n schreibt die Datei in den gemeinsamen Speicherordner, den der MCP‑Server ausliest.
- Reason – der n8n AI Agent (Ihr Chat Model + der Conversion‑MCP als Werkzeug) erhält eine Anweisung wie „Konvertiere report.docx zu PDF und gib die Seitenzahl aus.“ Er ruft autonom
get_document_infoauf, dannconvert. - Deliver – n8n nimmt die konvertierte Datei aus dem gemeinsamen Speicher und leitet sie weiter – E‑Mail, Objektspeicher, SharePoint oder die ursprüngliche Antwort.
Der Agent wählt die Werkzeuge und die Reihenfolge. Das ermöglicht, dass ein einziger Workflow „einfach konvertieren“, „nur konvertieren, wenn mehr als 10 Seiten“ oder „konvertieren und zusammenfassen“ abdeckt.
In wenigen Minuten einsatzbereit
Ein Minimal‑Stack besteht aus zwei Diensten, die ein Volume teilen – dem Konverter (hinter der Brücke) und n8n:
services:
conversion-mcp: # GroupDocs.Conversion MCP, exposed over SSE
build: ./bridge # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
environment:
GROUPDOCS_MCP_STORAGE_PATH: /data
GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
volumes: [ ./data:/data, ./gd-license:/license:ro ]
n8n:
image: n8nio/n8n:latest
ports: ["5678:5678"]
volumes: [ ./data:/data ] # SAME folder — the file hand-off
Dann bauen Sie in n8n den Agenten mit vier Knoten: einem Chat Trigger, einem Chat Model (Ihr OpenAI‑Credential), einem MCP Client‑Werkzeug, das auf http://conversion-mcp:8000/sse zeigt, und einem AI Agent, der sie verbindet. Legen Sie eine Datei in ./data, öffnen Sie den Chat und bitten Sie den Agenten, sie zu konvertieren.
The complete, runnable setup —
docker-compose.yml, the bridge image, and an importable n8n workflow — is in the companion open-source repository (see below).
Lizenzierung
Ohne Lizenz läuft GroupDocs.Conversion im Evaluations‑Modus: Die Ausgabe ist mit Wasserzeichen versehen und die Nutzung kann eingeschränkt sein. Für die Produktion legen Sie eine GroupDocs.Total.lic‑Datei in den gemounteten Lizenzordner – die Ausgabe ist dann sauber und uneingeschränkt. Sie können request a temporary license erhalten, um lizenzierten Output zu testen.
Warum das zur Enterprise passt
- Data sovereignty — Dokumente und die Konvertierungs‑Engine bleiben in Ihrer Infrastruktur. Wählen Sie ein selbstgehostetes Modell und die KI bleibt ebenfalls vor Ort.
- No lock‑in — jede Schicht ist Open‑Source oder standardbasiert (MCP). Tauschen Sie das LLM, den Orchestrator oder die Werkzeuge frei aus.
- Auditability — jede Agent‑Entscheidung und jeder Werkzeug‑Aufruf ist eine sichtbare, wiederholbare n8n‑Ausführung.
- Composability — das ist der kumulative Nutzen. Richten Sie denselben Agenten auf die anderen GroupDocs‑MCP‑Server aus — Redaction, Watermark, Metadata — und eine natürlichsprachliche Anfrage wird zu einer kompletten Pipeline: „Redact the PII, convert to PDF, then watermark it ‘Confidential’.“ (Der Textteil bleibt unverändert, da er Glossar‑Begriffe enthält.)
Erste Schritte
- Companion open‑source demo: GroupDocs.Conversion.Agentic — klonen, Ihren LLM‑Key hinzufügen,
docker compose upund mit Ihren Dokumenten sprechen. - NuGet:
GroupDocs.Conversion.Mcp - Docker image:
ghcr.io/groupdocs-conversion/conversion-net-mcp - Learn more about MCP: modelcontextprotocol.io
Agentische Dokumenten‑Automatisierung ist keine ferne Idee — sie ist nur ein docker compose up entfernt, gebaut aus Bausteinen, die Sie lesen, hosten und vertrauen können. Geben Sie Ihren KI‑Agenten die Fähigkeit, Dokumente zu konvertieren, zu Ihren Bedingungen.