Každá organizace pracuje s dokumenty — a s křehkými skripty, které je přesouvají mezi formáty. Wordové zprávy se mění na PDF, tabulky na CSV, skeny na prohledávatelné soubory. Každý nový formát nebo pravidlo znamená přepsání pipeline. Existuje flexibilnější způsob: nechte AI agenta provádět konverze na vaší vlastní infrastruktuře pomocí nástrojů, které mu poskytnete. Tento článek ukazuje, jak přesně takové řešení postavit s n8n, Model Context Protocol (MCP) a GroupDocs.Conversion MCP serverem — přičemž vaše dokumenty (a případně i AI model) zůstávají zcela on‑premise.

Od hardcodovaných pipeline po agentní automatizaci

Tradiční automatizace kóduje jak se úloha provádí: detekuje typ souboru, rozvětvuje, volá konvertor, ošetřuje chyby, zapisuje výstup. Každý nový požadavek znamená změnu kódu.

Agentní workflow kóduje co chcete. Zadáte cíl — „převést tyto zprávy na PDF, ale nejprve zkontrolovat počet stránek“ — a vystavíte sadu nástrojů. AI agent rozhodne, které nástroje zavolat a v jakém pořadí, a přizpůsobí se výsledku. Přidáte nástroj a agent ho může okamžitě použít, bez jakéhokoli přeprogramování. Tato přizpůsobivost je podstatou celého přístupu.

Co je MCP a proč je zde důležité

Nejtěžší částí nástrojových agentů byla vždy integrace — každý agent komunikoval s každým nástrojem jinak. Model Context Protocol je otevřený, nezávislý standard, který to řeší: jakýkoli MCP‑schopný agent může objevit a zavolat libovolné schopnosti MCP serveru. Představte si to jako „USB‑C pro AI nástroje“.

GroupDocs zveřejňuje operace s dokumenty jako MCP servery. GroupDocs.Conversion server vystavuje tři nástroje, které může agent volat:

Nástroj Co dělá
convert Převést dokument do jiného formátu (PDF, DOCX, XLSX, PPTX, HTML, PNG, CSV… více než 70 formátů)
get_document_info Prozkoumat soubor — typ, počet stránek, vlastnosti — před provedením akce
get_supported_formats Zjistit, které konverze jsou možné

Protože používá MCP, váš agent nepotřebuje žádnou vlastní integraci s GroupDocs. Vidí jen nástroje.

Architektura (vše open‑source, přineste si vlastní LLM)

Vrstva Součást Role
Orchestrace n8n (self‑hosted) spouštěče, uzel AI Agent, směrování souborů
Uvažování Váš LLM, přes n8n Chat Model uzel rozhoduje, které nástroje zavolat — plně vyměnitelné
Nástroje GroupDocs.Conversion MCP (stdio) za supergateway convert, get_document_info, get_supported_formats
Úložiště sdílený Docker svazek jak soubory proudí dovnitř a ven

Klíčové rozhodnutí designu: LLM je zaměnitelný. n8n Chat Model uzel je nezávislý na poskytovateli, takže agent a MCP nástroje se nikdy nemění, když vyměníte model. V příkladu níže je použito OpenAI, ale stejný workflow běží na Azure OpenAI, Anthropic, AWS Bedrock — nebo na plně self‑hostovaném modelu (Ollama, vLLM), když potřebujete nasazení bez přístupu k síti, kde dokumenty i AI zůstávají uvnitř vaší sítě.

Jedna poznámka k integraci: Conversion MCP je lehký stdio server (bezpečný, výchozí bez síťové komunikace). Protože n8n se k MCP nástrojům připojuje přes URL, malý open‑source stdio‑to‑SSE most (supergateway) jej vystavuje na portu. Server samotný zůstává nezměněn.

Jak workflow funguje

  1. Spouštěč — webhook, příchozí e‑mail, nahrání formulářem nebo sledovaná složka přijme dokument.
  2. Etapa — n8n zapíše soubor do sdílené složky, ze které MCP server čte.
  3. Uvažování — n8n AI Agent (váš Chat Model + Conversion MCP jako nástroj) dostane instrukci jako „Převést report.docx na PDF a uvést počet stránek.“ Samostatně zavolá get_document_info, pak convert.
  4. Doručení — n8n vezme převedený soubor ze sdíleného úložiště a pošle ho dál — e‑mail, objektové úložiště, SharePoint nebo původní odpověď.

Agent si sám vybírá nástroje a jejich pořadí. To umožňuje jednomu workflow zvládnout „jen převést toto“, „převést jen pokud má více než 10 stránek“ nebo „převést a shrnout“.

Postavte to během několika minut

Minimální stack jsou dvě služby sdílející jeden svazek — konvertor (za mostem) a n8n:

services:
  conversion-mcp:                    # GroupDocs.Conversion MCP, exposed over SSE
    build: ./bridge                  # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
    environment:
      GROUPDOCS_MCP_STORAGE_PATH: /data
      GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
    volumes: [ ./data:/data, ./gd-license:/license:ro ]
  n8n:
    image: n8nio/n8n:latest
    ports: ["5678:5678"]
    volumes: [ ./data:/data ]        # SAME folder — the file hand‑off

Pak v n8n vytvoříte agenta ze čtyř uzlů: Chat Trigger, Chat Model (vaše OpenAI pověření), MCP Client nástroj ukazující na http://conversion-mcp:8000/sse a AI Agent, který je propojí. Vložte soubor do ./data, otevřete chat a požádejte agenta o převod.

Kompletní, spustitelná konfigurace — docker-compose.yml, obraz mostu a importovatelný n8n workflow — je v doprovodném open‑source repozitáři (viz níže).

Licencování

Bez licence běží GroupDocs.Conversion v evaluačním režimu: výstup je vodoznakovaný a používání může být omezené. Pro produkci vložte soubor GroupDocs.Total.lic do připojené licenční složky — výstup je pak čistý a neomezený. Můžete request a temporary license pro vyzkoušení licencovaného výstupu.

Proč to sedí do podniku

  • Suverenita dat — dokumenty i konverzní engine zůstávají ve vaší infrastruktuře. Zvolíte-li self‑hostovaný model, AI také zůstane uvnitř.
  • Žádný vendor lock‑in — každá vrstva je open‑source nebo založená na standardech (MCP). LLM, orchestrátor nebo nástroje můžete měnit libovolně.
  • Auditovatelnost — každé rozhodnutí agenta a volání nástroje jsou viditelné, opakovatelné spouštění v n8n.
  • Komponovatelnost — to je kumulativní výhoda. Nasměrujte téhož agenta na ostatní GroupDocs MCP servery — Redaction, Watermark, Metadata — a jeden požadavek v přirozeném jazyce se stane kompletní pipeline: „odstranit PII, převést na PDF, pak přidat vodoznak ‘Confidential’.“

Začínáme

  • Doprovodná open‑source ukázka: GroupDocs.Conversion.Agentic — naklonujte, přidejte svůj LLM klíč, docker compose up a začněte mluvit se svými dokumenty.
  • NuGet: GroupDocs.Conversion.Mcp
  • Docker image: ghcr.io/groupdocs-conversion/conversion-net-mcp
  • Více o MCP: modelcontextprotocol.io

Agentní automatizace dokumentů není vzdálená vize — je to jen docker compose up daleko, postavená z částí, které můžete číst, hostovat a důvěřovat jim. Dejte svým AI agentům schopnost převádět dokumenty na vašich podmínkách.