每個組織都依賴文件——以及在不同格式之間搬移它們的脆弱腳本。Word 報告會變成 PDF,試算表會變成 CSV,掃描件會變成可搜尋的檔案。每新增一種格式或規則,都意味著必須重新編寫管道。其實有更彈性的做法:讓 AI 代理 在您自己的基礎設施上執行轉換,使用您提供的工具。本文將示範如何使用 n8n、Model Context Protocol (MCP) 與 GroupDocs.Conversion MCP 伺服器 來構建這樣的解決方案——讓您的文件(以及可選的 AI 模型)完全保留在本地。
從硬編碼管道到代理自動化
傳統自動化會編碼 如何 完成任務:偵測檔案類型、分支、呼叫轉換器、處理錯誤、寫入輸出。每一項新需求都需要修改程式碼。
代理式 工作流程則編碼 想要什麼。您只需說明目標——「將這些報告轉成 PDF,但先檢查頁數」——並公開一組 工具。AI 代理決定要呼叫哪些工具、呼叫順序,並根據結果調整。新增工具後,代理即可立即使用,無需重新接線。這種適應性正是核心所在。
MCP 是什麼,為何在此重要
工具使用代理最困難的部分一直是整合——每個代理與每個工具的溝通方式都不同。Model Context Protocol 是一個開放、供應商中立的標準,解決了這個問題:任何支援 MCP 的代理都能發現並呼叫任何 MCP 伺服器的功能。可以把它想像成「AI 工具的 USB‑C」。
GroupDocs 以 MCP 伺服器的形式發布文件操作。GroupDocs.Conversion 伺服器公開三個代理可呼叫的工具:
| 工具 | 功能說明 |
|---|---|
convert |
將文件轉換為其他格式(PDF、DOCX、XLSX、PPTX、HTML、PNG、CSV… 超過 70 種格式) |
get_document_info |
在執行前檢查檔案——類型、頁數、屬性等 |
get_supported_formats |
探索哪些轉換是可能的 |
因為它支援 MCP,您的代理不需要自訂 GroupDocs 整合,只要看到工具即可。
架構(全開源,自備 LLM)
| 層級 | 元件 | 角色 |
|---|---|---|
| 編排 | n8n(自行託管) | 觸發、AI 代理節點、檔案路由 |
| 推理 | 您的 LLM,透過 n8n 的 Chat Model 節點 | 決定呼叫哪些工具——可自由替換 |
| 工具 | GroupDocs.Conversion MCP(stdio)搭配 supergateway | convert、get_document_info、get_supported_formats |
| 儲存 | 共享 Docker 卷 | 檔案的進出流向 |
關鍵設計選擇:LLM 可插拔。n8n 的 Chat Model 節點與供應商無關,當您更換模型時,代理與 MCP 工具都不需要變動。以下範例使用 OpenAI,但相同工作流程也能在 Azure OpenAI、Anthropic、AWS Bedrock,或完全自行託管的模型(Ollama、vLLM)上執行,適用於文件與 AI 必須同時留在內部網路的空氣隔離部署。
整合說明:Conversion MCP 是一個輕量級 stdio 伺服器(安全、無網路的預設)。由於 n8n 透過 URL 連接 MCP 工具,我們使用一個小型開源 stdio-to‑SSE 桥接器(supergateway)將其暴露在埠口。伺服器本身保持不變。
工作流程執行方式
- 觸發 — 透過 webhook、收件郵件、表單上傳或監控資料夾接收文件。
- 階段 — n8n 將檔案寫入 MCP 伺服器讀取的共享儲存資料夾。
- 推理 — n8n 的 AI 代理(您的 Chat Model + Conversion MCP 作為工具)收到指令,例如 「將 report.docx 轉成 PDF 並回報頁數」,它會自動先呼叫
get_document_info,再呼叫convert。 - 交付 — n8n 從共享儲存中取得轉換後的檔案,並將其路由至郵件、物件儲存、SharePoint,或原始回應等目的地。
代理自行決定使用哪些工具以及順序。正因如此,單一工作流程即可處理 「只要轉換」、「若超過 10 頁才轉換」 或 「轉換並摘要」 等不同需求。
幾分鐘內部署
最小化堆疊只需要兩個服務共享同一個卷——轉換器(透過橋接)與 n8n:
services:
conversion-mcp: # GroupDocs.Conversion MCP,透過 SSE 暴露
build: ./bridge # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
environment:
GROUPDOCS_MCP_STORAGE_PATH: /data
GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
volumes: [ ./data:/data, ./gd-license:/license:ro ]
n8n:
image: n8nio/n8n:latest
ports: ["5678:5678"]
volumes: [ ./data:/data ] # 同一資料夾 — 檔案交接點
接著在 n8n 中,使用四個節點建立代理:Chat Trigger、Chat Model(您的 OpenAI 憑證)、指向 http://conversion-mcp:8000/sse 的 MCP Client 工具,以及將它們串接的 AI Agent。將檔案放入 ./data,開啟聊天視窗,向代理下指令讓它轉換檔案。
完整、可執行的設定——
docker-compose.yml、橋接映像以及可匯入的 n8n 工作流程——皆在下方的開源伴隨倉庫中(見下方)。
授權
若未提供授權,GroupDocs.Conversion 會以 評估模式 執行:輸出會加上浮水印且可能受使用限制。正式環境請將 GroupDocs.Total.lic 檔案放入掛載的授權資料夾——輸出即會乾淨且無限制。您可以申請臨時授權以測試授權版輸出。
為何適合企業
- 資料主權 — 文件與轉換引擎皆保留在您的基礎設施上。選擇自行託管的模型,AI 也同樣留在本地。
- 無鎖定 — 每一層都是開源或基於標準(MCP)。可自由替換 LLM、編排器或工具。
- 可稽核 — 每一次代理的決策與工具呼叫都以可見、可重放的 n8n 執行紀錄呈現。
- 可組合 — 這是複利效應。將 相同 代理指向其他 GroupDocs MCP 伺服器——Redaction、Watermark、Metadata——只要一個自然語言請求,就能形成完整管道:「將 PII 馬賽克、轉成 PDF,然後加上『機密』浮水印」。
開始使用
- 伴隨開源示範:GroupDocs.Conversion.Agentic — 克隆後加入您的 LLM 金鑰,
docker compose up,即可開始與文件對話。 - NuGet:
GroupDocs.Conversion.Mcp - Docker 映像:
ghcr.io/groupdocs-conversion/conversion-net-mcp - 深入了解 MCP:modelcontextprotocol.io
代理式文件自動化不再是遙不可及的概念——只要 docker compose up,即可在您可讀、可託管、可信任的組件上實現。讓您的 AI 代理具備文件轉換能力,完全依照您的條件執行。