Každá organizace pracuje s dokumenty — a s křehkými skripty, které je přesouvají mezi formáty. Wordové zprávy se mění na PDF, tabulky na CSV, skeny na prohledávatelné soubory. Každý nový formát nebo pravidlo znamená přepsání pipeline. Existuje flexibilnější způsob: nechte AI agenta provádět konverze na vaší vlastní infrastruktuře pomocí nástrojů, které mu poskytnete. Tento článek ukazuje, jak přesně takové řešení postavit s n8n, Model Context Protocol (MCP) a GroupDocs.Conversion MCP serverem — přičemž vaše dokumenty (a případně i AI model) zůstávají zcela on‑premise.
Od hardcodovaných pipeline po agentní automatizaci
Tradiční automatizace kóduje jak se úloha provádí: detekuje typ souboru, rozvětvuje, volá konvertor, ošetřuje chyby, zapisuje výstup. Každý nový požadavek znamená změnu kódu.
Agentní workflow kóduje co chcete. Zadáte cíl — „převést tyto zprávy na PDF, ale nejprve zkontrolovat počet stránek“ — a vystavíte sadu nástrojů. AI agent rozhodne, které nástroje zavolat a v jakém pořadí, a přizpůsobí se výsledku. Přidáte nástroj a agent ho může okamžitě použít, bez jakéhokoli přeprogramování. Tato přizpůsobivost je podstatou celého přístupu.
Co je MCP a proč je zde důležité
Nejtěžší částí nástrojových agentů byla vždy integrace — každý agent komunikoval s každým nástrojem jinak. Model Context Protocol je otevřený, nezávislý standard, který to řeší: jakýkoli MCP‑schopný agent může objevit a zavolat libovolné schopnosti MCP serveru. Představte si to jako „USB‑C pro AI nástroje“.
GroupDocs zveřejňuje operace s dokumenty jako MCP servery. GroupDocs.Conversion server vystavuje tři nástroje, které může agent volat:
| Nástroj | Co dělá |
|---|---|
convert |
Převést dokument do jiného formátu (PDF, DOCX, XLSX, PPTX, HTML, PNG, CSV… více než 70 formátů) |
get_document_info |
Prozkoumat soubor — typ, počet stránek, vlastnosti — před provedením akce |
get_supported_formats |
Zjistit, které konverze jsou možné |
Protože používá MCP, váš agent nepotřebuje žádnou vlastní integraci s GroupDocs. Vidí jen nástroje.
Architektura (vše open‑source, přineste si vlastní LLM)
| Vrstva | Součást | Role |
|---|---|---|
| Orchestrace | n8n (self‑hosted) | spouštěče, uzel AI Agent, směrování souborů |
| Uvažování | Váš LLM, přes n8n Chat Model uzel | rozhoduje, které nástroje zavolat — plně vyměnitelné |
| Nástroje | GroupDocs.Conversion MCP (stdio) za supergateway | convert, get_document_info, get_supported_formats |
| Úložiště | sdílený Docker svazek | jak soubory proudí dovnitř a ven |
Klíčové rozhodnutí designu: LLM je zaměnitelný. n8n Chat Model uzel je nezávislý na poskytovateli, takže agent a MCP nástroje se nikdy nemění, když vyměníte model. V příkladu níže je použito OpenAI, ale stejný workflow běží na Azure OpenAI, Anthropic, AWS Bedrock — nebo na plně self‑hostovaném modelu (Ollama, vLLM), když potřebujete nasazení bez přístupu k síti, kde dokumenty i AI zůstávají uvnitř vaší sítě.
Jedna poznámka k integraci: Conversion MCP je lehký stdio server (bezpečný, výchozí bez síťové komunikace). Protože n8n se k MCP nástrojům připojuje přes URL, malý open‑source stdio‑to‑SSE most (supergateway) jej vystavuje na portu. Server samotný zůstává nezměněn.
Jak workflow funguje
- Spouštěč — webhook, příchozí e‑mail, nahrání formulářem nebo sledovaná složka přijme dokument.
- Etapa — n8n zapíše soubor do sdílené složky, ze které MCP server čte.
- Uvažování — n8n AI Agent (váš Chat Model + Conversion MCP jako nástroj) dostane instrukci jako „Převést report.docx na PDF a uvést počet stránek.“ Samostatně zavolá
get_document_info, pakconvert. - Doručení — n8n vezme převedený soubor ze sdíleného úložiště a pošle ho dál — e‑mail, objektové úložiště, SharePoint nebo původní odpověď.
Agent si sám vybírá nástroje a jejich pořadí. To umožňuje jednomu workflow zvládnout „jen převést toto“, „převést jen pokud má více než 10 stránek“ nebo „převést a shrnout“.
Postavte to během několika minut
Minimální stack jsou dvě služby sdílející jeden svazek — konvertor (za mostem) a n8n:
services:
conversion-mcp: # GroupDocs.Conversion MCP, exposed over SSE
build: ./bridge # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
environment:
GROUPDOCS_MCP_STORAGE_PATH: /data
GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
volumes: [ ./data:/data, ./gd-license:/license:ro ]
n8n:
image: n8nio/n8n:latest
ports: ["5678:5678"]
volumes: [ ./data:/data ] # SAME folder — the file hand‑off
Pak v n8n vytvoříte agenta ze čtyř uzlů: Chat Trigger, Chat Model (vaše OpenAI pověření), MCP Client nástroj ukazující na http://conversion-mcp:8000/sse a AI Agent, který je propojí. Vložte soubor do ./data, otevřete chat a požádejte agenta o převod.
Kompletní, spustitelná konfigurace —
docker-compose.yml, obraz mostu a importovatelný n8n workflow — je v doprovodném open‑source repozitáři (viz níže).
Licencování
Bez licence běží GroupDocs.Conversion v evaluačním režimu: výstup je vodoznakovaný a používání může být omezené. Pro produkci vložte soubor GroupDocs.Total.lic do připojené licenční složky — výstup je pak čistý a neomezený. Můžete request a temporary license pro vyzkoušení licencovaného výstupu.
Proč to sedí do podniku
- Suverenita dat — dokumenty i konverzní engine zůstávají ve vaší infrastruktuře. Zvolíte-li self‑hostovaný model, AI také zůstane uvnitř.
- Žádný vendor lock‑in — každá vrstva je open‑source nebo založená na standardech (MCP). LLM, orchestrátor nebo nástroje můžete měnit libovolně.
- Auditovatelnost — každé rozhodnutí agenta a volání nástroje jsou viditelné, opakovatelné spouštění v n8n.
- Komponovatelnost — to je kumulativní výhoda. Nasměrujte téhož agenta na ostatní GroupDocs MCP servery — Redaction, Watermark, Metadata — a jeden požadavek v přirozeném jazyce se stane kompletní pipeline: „odstranit PII, převést na PDF, pak přidat vodoznak ‘Confidential’.“
Začínáme
- Doprovodná open‑source ukázka: GroupDocs.Conversion.Agentic — naklonujte, přidejte svůj LLM klíč,
docker compose upa začněte mluvit se svými dokumenty. - NuGet:
GroupDocs.Conversion.Mcp - Docker image:
ghcr.io/groupdocs-conversion/conversion-net-mcp - Více o MCP: modelcontextprotocol.io
Agentní automatizace dokumentů není vzdálená vize — je to jen docker compose up daleko, postavená z částí, které můžete číst, hostovat a důvěřovat jim. Dejte svým AI agentům schopnost převádět dokumenty na vašich podmínkách.