Every organization runs on documents — and on the brittle scripts that move them between formats. Word reports become PDFs, spreadsheets become CSVs, scans become searchable files. Each new format or rule means rewriting a pipeline. There’s a more flexible way: let an AI agent do the conversions, on your own infrastructure, using the tools you give it. This article shows how to build exactly that with n8n, the Model Context Protocol (MCP), and the GroupDocs.Conversion MCP server — keeping your documents (and optionally your AI model) entirely on‑premise.
ハードコーディングされたパイプラインからエージェント型自動化へ
従来の自動化は タスクのやり方 をコード化します:ファイルタイプを検出し、分岐し、コンバータを呼び出し、エラーを処理し、出力を書き込む。新しい要件が出るたびにコードを変更しなければなりません。
エージェント型 ワークフローは 何をしたいか をコード化します。目標を述べます — 「このレポートを PDF に変換するが、まずページ数を確認する」 — そして ツール のセットを公開します。AI エージェントはどのツールを呼び出すか、どの順序で呼び出すかを決定し、結果に応じて適応します。ツールを追加すれば、エージェントはすぐにそれを使えるので、配線の変更は不要です。この適応性こそがポイントです。
MCP とは何か、そしてここで重要な理由
ツールを使うエージェントの難点は常に統合でした — エージェントごとにツールとのやり取りが異なっていました。Model Context Protocol はオープンでベンダーに依存しない標準で、これを解決します:MCP 対応エージェントは任意の MCP サーバーの機能を検出し呼び出すことができます。AI ツールの「USB‑C」のようなものと考えてください。
GroupDocs はドキュメント操作を MCP サーバーとして公開しています。GroupDocs.Conversion サーバーはエージェントが呼び出せる 3 つのツールを提供します。
| ツール | 機能 |
|---|---|
convert |
ドキュメントを別の形式(PDF、DOCX、XLSX、PPTX、HTML、PNG、CSV… 70 以上)に変換 |
get_document_info |
ファイルの種類、ページ数、プロパティなどを取得して事前に検査 |
get_supported_formats |
可能な変換形式を取得 |
MCP で会話できるため、エージェントは GroupDocs へのカスタム統合を必要とせず、ツールだけを認識します。
アーキテクチャ(すべてオープンソース、LLM は自分で持ち込む)
| レイヤー | コンポーネント | 役割 |
|---|---|---|
| オーケストレーション | n8n(セルフホスト) | トリガー、AI Agent ノード、ファイルルーティング |
| 推論 | ご自身の LLM、n8n の Chat Model ノード経由 | どのツールを呼び出すかを決定 — 完全に差し替え可能 |
| ツール | GroupDocs.Conversion MCP(stdio)+ supergateway | convert、get_document_info、get_supported_formats |
| ストレージ | 共有 Docker ボリューム | ファイルの入出力 |
重要な設計選択:LLM はプラグイン可能 です。n8n の Chat Model ノードはプロバイダー非依存なので、モデルを入れ替えてもエージェントや MCP ツールは変更不要です。以下の例は OpenAI を使用していますが、Azure OpenAI、Anthropic、AWS Bedrock、あるいは完全セルフホスト型モデル(Ollama、vLLM)でも同じワークフローが動作します。これにより、ドキュメントと AI の両方をネットワーク外に閉じ込めたエアギャップ環境が実現できます。
1 つの統合上の注意点:Conversion MCP は軽量 stdio サーバー(ネットワーク不要のデフォルト)です。n8n が URL 経由で MCP ツールに接続するため、stdio‑to‑SSE ブリッジ(supergateway)がポート上に公開します。サーバー自体は変更不要です。
ワークフローの流れ
- トリガー — Webhook、受信メール、フォームアップロード、または監視フォルダーがドキュメントを受け取ります。
- ステージ — n8n がファイルを MCP サーバーが参照する共有ストレージフォルダーに書き込みます。
- 推論 — n8n の AI Agent(Chat Model + Conversion MCP ツール)に「report.docx を PDF に変換し、ページ数を報告して」という指示が渡されます。エージェントは自律的に
get_document_infoを呼び出し、続いてconvertを実行します。 - 配信 — n8n が共有ストレージから変換済みファイルを取得し、メール、オブジェクトストレージ、SharePoint、または元のレスポンス先へ転送します。
エージェントがツールと順序を選択するため、単一のワークフローで「ただ変換する」「10 ページ以上の場合のみ変換する」「変換して要約する」などを実現できます。
数分で立ち上げる
最小構成は 2 つのサービスが同じボリュームを共有するだけです — コンバータ(ブリッジ背後)と n8n:
services:
conversion-mcp: # GroupDocs.Conversion MCP, exposed over SSE
build: ./bridge # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
environment:
GROUPDOCS_MCP_STORAGE_PATH: /data
GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
volumes: [ ./data:/data, ./gd-license:/license:ro ]
n8n:
image: n8nio/n8n:latest
ports: ["5678:5678"]
volumes: [ ./data:/data ] # SAME folder — the file hand-off
次に n8n でエージェントを 4 つのノードで構築します:Chat Trigger、Chat Model(OpenAI 資格情報)、http://conversion-mcp:8000/sse を指す MCP Client ツール、そしてそれらを配線する AI Agent。./data にファイルを置き、チャットを開いてエージェントに変換を指示してください。
完全に実行可能なセットアップ —
docker-compose.yml、ブリッジイメージ、インポート可能な n8n ワークフロー — は下記のオープンソースリポジトリにあります(下記参照)。
ライセンス
ライセンスが無い場合、GroupDocs.Conversion は 評価モード で動作し、出力に透かしが入り使用が制限されることがあります。本番環境では GroupDocs.Total.lic ファイルをマウントしたライセンスフォルダーに配置すれば、出力はクリーンで制限なしになります。ライセンスが必要な場合は temporary license をリクエスト してください。
エンタープライズに適している理由
- データ主権 — ドキュメントと変換エンジンが自社インフラに残ります。セルフホスト型モデルを選べば AI も同様です。
- ロックインなし — すべての層がオープンソースまたは標準(MCP)ベース。LLM、オーケストレータ、ツールを自由に入れ替え可能。
- 監査可能 — エージェントの意思決定とツール呼び出しはすべて可視化・再現可能な n8n 実行として記録されます。
- 構成可能 — これが累積的な利点です。同じエージェントを他の GroupDocs MCP サーバー(Redaction、Watermark、Metadata)に向けるだけで、自然言語の 1 文でフルパイプラインが構築できます:「PII をマスクし、PDF に変換し、‘Confidential’ と透かしを入れる」。
はじめに
- オープンソースデモ:GroupDocs.Conversion.Agentic — クローンして LLM キーを追加し、
docker compose upで起動、ドキュメントと会話を開始。 - NuGet:
GroupDocs.Conversion.Mcp - Docker イメージ:
ghcr.io/groupdocs-conversion/conversion-net-mcp - MCP の詳細:modelcontextprotocol.io
エージェント型ドキュメント自動化は遠い未来の話ではありません — docker compose up ひとつで、読めてホストでき、信頼できる部品から構築できます。AI エージェントに自社の条件でドキュメント変換をさせましょう。