Every organization runs on documents — and on the brittle scripts that move them between formats. Word reports become PDFs, spreadsheets become CSVs, scans become searchable files. Each new format or rule means rewriting a pipeline. There’s a more flexible way: let an AI agent do the conversions, on your own infrastructure, using the tools you give it. This article shows how to build exactly that with n8n, the Model Context Protocol (MCP), and the GroupDocs.Conversion MCP server — keeping your documents (and optionally your AI model) entirely on‑premise.

하드코딩된 파이프라인에서 에이전시 자동화로

전통적인 자동화는 작업이 어떻게 수행되는지 를 코드에 담습니다: 파일 유형을 감지하고, 분기하고, 변환기를 호출하고, 오류를 처리하고, 출력을 기록합니다. 새로운 요구사항이 생길 때마다 코드를 수정해야 합니다.

에이전시 워크플로는 무엇을 원하는지 를 담습니다. 목표를 명시합니다 — “이 보고서를 PDF로 변환하되, 먼저 페이지 수를 확인해 주세요” — 그리고 도구 집합을 노출합니다. AI 에이전트는 어떤 도구를 어떤 순서로 호출할지 스스로 결정하고 결과에 맞춰 적응합니다. 도구를 하나 추가하면 에이전트는 즉시 사용할 수 있으며, 별도의 재배선이 필요 없습니다. 이 적응성이 바로 핵심 포인트입니다.

MCP란 무엇이며 여기서 왜 중요한가

도구를 사용하는 에이전트의 가장 큰 난관은 통합이었습니다 — 각 에이전트가 각 도구와 서로 다른 방식으로 통신했기 때문이죠. Model Context Protocol은 이 문제를 해결하는 오픈, 벤더 중립 표준입니다: MCP를 인식하는 모든 에이전트는 어떤 MCP 서버의 기능도 자동으로 발견하고 호출할 수 있습니다. 이를 “AI 도구용 USB‑C”라고 생각하면 됩니다.

GroupDocs는 문서 작업을 MCP 서버 형태로 제공합니다. GroupDocs.Conversion 서버는 에이전트가 호출할 수 있는 세 가지 도구를 노출합니다:

도구 설명
convert 문서를 다른 형식(PDF, DOCX, XLSX, PPTX, HTML, PNG, CSV… 70개 이상)으로 변환
get_document_info 파일을 검사 — 유형, 페이지 수, 속성 — 후에 작업 수행
get_supported_formats 가능한 변환 형식을 탐색

MCP를 지원하기 때문에 에이전트는 별도의 GroupDocs 통합 코드를 필요로 하지 않습니다. 도구만 보이면 됩니다.

아키텍처 (전부 오픈소스, LLM은 직접 선택)

계층 구성 요소 역할
오케스트레이션 n8n (self‑hosted) 트리거, AI Agent 노드, 파일 라우팅
추론 Your LLM, via n8n’s Chat Model node 어떤 도구를 호출할지 결정 — 완전 교체 가능
도구 GroupDocs.Conversion MCP (stdio) behind supergateway convert, get_document_info, get_supported_formats
스토리지 shared Docker volume 파일이 들어오고 나가는 흐름

핵심 설계 선택: LLM은 플러그인식이라는 점입니다. n8n의 Chat Model 노드는 공급자에 구애받지 않으므로, 모델을 교체해도 에이전트와 MCP 도구는 전혀 바뀌지 않습니다. 아래 예시는 OpenAI를 사용하지만, Azure OpenAI, Anthropic, AWS Bedrock — 혹은 완전 자체 호스팅 모델(Ollama, vLLM) 등으로도 동일하게 동작합니다. 이렇게 하면 문서와 AI 모두 네트워크 밖에 머무는 에어갭 환경을 구현할 수 있습니다.

한 가지 통합 팁: Conversion MCP는 가벼운 stdio 서버(보안·네트워크 비사용 기본)입니다. n8n이 MCP 도구에 URL로 연결하므로, 작은 오픈소스 stdio‑to‑SSE 브리지(supergateway)가 포트를 통해 노출합니다. 서버 자체는 변경되지 않습니다.

워크플로 실행 흐름

  1. Trigger — 웹훅, 인바운드 이메일, 폼 업로드, 혹은 감시 폴더가 문서를 받습니다.
  2. Stage — n8n이 파일을 MCP 서버가 읽을 수 있는 공유 스토리지 폴더에 기록합니다.
  3. Reason — n8n AI Agent(Chat Model + Conversion MCP 도구)에게 “report.docx를 PDF로 변환하고 페이지 수를 알려 주세요.” 라는 명령이 전달됩니다. 에이전트는 스스로 get_document_info를 호출한 뒤 convert를 실행합니다.
  4. Deliver — n8n이 변환된 파일을 공유 스토리지에서 꺼내어 이메일, 객체 스토리지, SharePoint, 혹은 원래 응답으로 라우팅합니다.

에이전트가 도구와 순서를 선택합니다. 그래서 “그냥 변환해”, “10페이지 이상일 때만 변환”, “변환하고 요약해” 같은 다양한 요구를 하나의 워크플로로 처리할 수 있습니다.

몇 분 안에 구축하기

필요한 최소 스택은 두 개 서비스와 하나의 공유 볼륨뿐입니다 — 변환기(브리지 뒤)와 n8n:

services:
  conversion-mcp:                    # GroupDocs.Conversion MCP, exposed over SSE
    build: ./bridge                  # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
    environment:
      GROUPDOCS_MCP_STORAGE_PATH: /data
      GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
    volumes: [ ./data:/data, ./gd-license:/license:ro ]
  n8n:
    image: n8nio/n8n:latest
    ports: ["5678:5678"]
    volumes: [ ./data:/data ]        # SAME folder — the file hand‑off

그 다음 n8n에서 네 개 노드로 에이전트를 구성합니다: Chat Trigger, Chat Model(OpenAI 자격증명), http://conversion-mcp:8000/sse를 가리키는 MCP Client 도구, 그리고 이들을 연결하는 AI Agent. ./data에 파일을 넣고 채팅을 열어 에이전트에게 변환을 요청하면 됩니다.

전체 실행 가능한 설정(docker-compose.yml, 브리지 이미지, 그리고 가져올 수 있는 n8n 워크플로)은 아래 오픈소스 레포지토리(Companion)에서 확인할 수 있습니다.

라이선스

라이선스가 없으면 GroupDocs.Conversion은 평가 모드로 동작합니다: 출력에 워터마크가 삽입되고 사용이 제한될 수 있습니다. 프로덕션에서는 GroupDocs.Total.lic 파일을 마운트된 라이선스 폴더에 넣으면 출력이 깨끗하고 제한 없이 제공됩니다. 라이선스가 필요하면 temporary license 요청 페이지에서 임시 라이선스를 받아볼 수 있습니다.

엔터프라이즈에 적합한 이유

  • 데이터 주권 — 문서와 변환 엔진이 모두 자체 인프라에 머무릅니다. 자체 호스팅 모델을 선택하면 AI도 동일하게 내부에 배치됩니다.
  • 벤더 락인 없음 — 모든 계층이 오픈소스 또는 표준(MCP) 기반이므로 LLM, 오케스트레이터, 도구를 자유롭게 교체할 수 있습니다.
  • 감사 가능성 — 에이전트의 모든 결정과 도구 호출이 가시적인 n8n 실행 로그로 남아 재현 가능합니다.
  • 조합성 — 이것이 바로 복합적인 장점입니다. 동일한 에이전트를 다른 GroupDocs MCP 서버(Redaction, Watermark, Metadata)에 연결하면, 하나의 자연어 요청이 전체 파이프라인이 됩니다: “PII를 마스킹하고 PDF로 변환한 뒤 ‘Confidential’ 워터마크를 넣어 주세요.”

시작하기

  • Companion 오픈소스 데모: GroupDocs.Conversion.Agentic — 레포지토리를 클론하고 LLM 키를 추가한 뒤 docker compose up 하면 문서와 대화할 수 있습니다.
  • NuGet: GroupDocs.Conversion.Mcp
  • Docker 이미지: ghcr.io/groupdocs-conversion/conversion-net-mcp
  • MCP 자세히 보기: modelcontextprotocol.io

Agentic 문서 자동화는 먼 미래의 이야기가 아니라, docker compose up 한 번으로 구현 가능한 현실입니다. 읽고, 호스팅하고, 신뢰할 수 있는 구성 요소들로 AI 에이전트에게 문서 변환 능력을 부여해 보세요.