Mỗi tổ chức đều hoạt động dựa trên tài liệu — và trên những script dễ gãy khi di chuyển chúng giữa các định dạng. Các báo cáo Word trở thành PDF, bảng tính thành CSV, bản quét thành tệp có thể tìm kiếm. Mỗi định dạng hoặc quy tắc mới đều đồng nghĩa với việc phải viết lại một pipeline. Có một cách linh hoạt hơn: để một đại lý AI thực hiện các chuyển đổi, trên hạ tầng của bạn, bằng các công cụ bạn cung cấp. Bài viết này chỉ ra cách xây dựng chính xác điều đó với n8n, Model Context Protocol (MCP), và GroupDocs.Conversion MCP server — giữ tài liệu (và tùy chọn mô hình AI) hoàn toàn ở nội bộ.
Từ các pipeline được mã hoá cứng sang tự động hoá dựa trên đại lý
Tự động hoá truyền thống mã hoá cách một nhiệm vụ được thực hiện: phát hiện loại tệp, phân nhánh, gọi bộ chuyển đổi, xử lý lỗi, ghi đầu ra. Mỗi yêu cầu mới đều là một thay đổi mã.
Một workflow đại lý mã hoá điều gì bạn muốn. Bạn nêu mục tiêu — “chuyển đổi các báo cáo này sang PDF, nhưng trước tiên kiểm tra số trang” — và cung cấp một tập hợp công cụ. Đại lý AI quyết định công cụ nào sẽ gọi và theo thứ tự nào, đồng thời thích nghi với kết quả. Thêm một công cụ và đại lý có thể sử dụng ngay lập tức, không cần chỉnh sửa lại. Khả năng thích ứng này chính là mục đích của nó.
MCP là gì, và tại sao lại quan trọng ở đây
Phần khó khăn của các đại lý sử dụng công cụ luôn là việc tích hợp — mỗi đại lý giao tiếp với mỗi công cụ theo cách khác nhau. Model Context Protocol là một tiêu chuẩn mở, không phụ thuộc vào nhà cung cấp, giải quyết vấn đề này: bất kỳ đại lý nào hỗ trợ MCP đều có thể khám phá và gọi bất kỳ khả năng nào của máy chủ MCP. Hãy nghĩ nó như “USB‑C cho các công cụ AI”.
GroupDocs công bố các thao tác tài liệu dưới dạng máy chủ MCP. Máy chủ GroupDocs.Conversion cung cấp ba công cụ mà một đại lý có thể gọi:
| Công cụ | Chức năng |
|---|---|
convert |
Chuyển đổi tài liệu sang định dạng khác (PDF, DOCX, XLSX, PPTX, HTML, PNG, CSV… hơn 70 định dạng) |
get_document_info |
Kiểm tra một tệp — loại, số trang, thuộc tính — trước khi thực hiện |
get_supported_formats |
Khám phá các chuyển đổi có thể thực hiện được |
Vì nó nói MCP, đại lý của bạn không cần tích hợp tùy chỉnh với GroupDocs. Nó chỉ nhìn thấy các công cụ.
Kiến trúc (hoàn toàn mã nguồn mở, tự mang LLM của bạn)
| Lớp | Thành phần | Vai trò |
|---|---|---|
| Điều phối | n8n (tự host) | kích hoạt, nút AI Agent, định tuyến tệp |
| Lý luận | LLM của bạn, qua nút Chat Model của n8n | quyết định công cụ nào sẽ gọi — có thể hoán đổi hoàn toàn |
| Công cụ | GroupDocs.Conversion MCP (stdio) phía sau supergateway | convert, get_document_info, get_supported_formats |
| Lưu trữ | một volume Docker chia sẻ | cách các tệp di chuyển vào và ra |
Một lựa chọn thiết kế then chốt: LLM có thể cắm vào. Nút Chat Model của n8n không phụ thuộc vào nhà cung cấp, vì vậy đại lý và các công cụ MCP không thay đổi khi bạn đổi mô hình. Ví dụ dưới đây sử dụng OpenAI, nhưng cùng workflow có thể chạy trên Azure OpenAI, Anthropic, AWS Bedrock — hoặc một mô hình tự host hoàn toàn (Ollama, vLLM) khi bạn cần triển khai không kết nối mạng, nơi tài liệu và AI ở trong mạng nội bộ của bạn.
Một lưu ý tích hợp: Conversion MCP là một máy chủ stdio nhẹ (mặc định an toàn, không mạng). Vì n8n kết nối tới các công cụ MCP qua URL, một cầu nối stdio‑to‑SSE mã nguồn mở nhỏ (supergateway) sẽ mở nó trên một cổng. Máy chủ không thay đổi gì.
Cách workflow hoạt động
- Kích hoạt — một webhook, email đến, tải lên form, hoặc thư mục được giám sát nhận tài liệu.
- Giai đoạn — n8n ghi tệp vào thư mục lưu trữ chung mà máy chủ MCP đọc từ đó.
- Lý luận — AI Agent của n8n (Chat Model của bạn + Conversion MCP làm công cụ) nhận lệnh như “Chuyển đổi report.docx sang PDF và báo cáo số trang.” Nó tự động gọi
get_document_info, sau đóconvert. - Giao — n8n lấy tệp đã chuyển đổi từ lưu trữ chung và định tuyến tiếp — email, lưu trữ đối tượng, SharePoint, hoặc phản hồi gốc.
Đại lý chọn công cụ và thứ tự. Đó là lý do một workflow duy nhất có thể xử lý “chỉ chuyển đổi cái này”, “chuyển đổi nếu có hơn 10 trang”, hoặc “chuyển đổi và tóm tắt”.
Triển khai trong vài phút
Một stack tối thiểu chỉ gồm hai dịch vụ chia sẻ một volume — bộ chuyển đổi (đằng sau cầu nối) và n8n:
services:
conversion-mcp: # GroupDocs.Conversion MCP, exposed over SSE
build: ./bridge # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
environment:
GROUPDOCS_MCP_STORAGE_PATH: /data
GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
volumes: [ ./data:/data, ./gd-license:/license:ro ]
n8n:
image: n8nio/n8n:latest
ports: ["5678:5678"]
volumes: [ ./data:/data ] # SAME folder — the file hand-off
Sau đó trong n8n, xây dựng đại lý bằng bốn nút: một Chat Trigger, một Chat Model (thông tin xác thực OpenAI của bạn), một công cụ MCP Client trỏ tới http://conversion-mcp:8000/sse, và một AI Agent nối chúng lại với nhau. Đặt một tệp vào ./data, mở chat, và yêu cầu đại lý chuyển đổi nó.
Cài đặt đầy đủ, có thể chạy được —
docker-compose.yml, hình ảnh cầu nối, và một workflow n8n có thể nhập — nằm trong kho mã nguồn mở kèm theo (xem bên dưới).
Giấy phép
Nếu không có giấy phép, GroupDocs.Conversion chạy ở chế độ đánh giá: đầu ra có watermark và có thể bị giới hạn. Đối với môi trường sản xuất, đặt tệp GroupDocs.Total.lic vào thư mục license đã gắn — đầu ra sẽ sạch và không bị hạn chế. Bạn có thể yêu cầu giấy phép tạm thời để thử nghiệm đầu ra có giấy phép.
Vì sao giải pháp này phù hợp với doanh nghiệp
- Quyền chủ sở hữu dữ liệu — tài liệu và động cơ chuyển đổi ở trên hạ tầng của bạn. Chọn mô hình tự host và AI cũng sẽ ở trong nội bộ.
- Không khóa vendor — mọi lớp đều là mã nguồn mở hoặc dựa trên tiêu chuẩn (MCP). Thay đổi LLM, bộ điều phối, hoặc công cụ một cách tự do.
- Khả năng kiểm toán — mọi quyết định của đại lý và mỗi lần gọi công cụ đều là một lần thực thi n8n có thể xem lại và phát lại.
- Khả năng kết hợp — đây là lợi thế cộng dồn. Đưa cùng đại lý tới các máy chủ MCP GroupDocs khác — Redaction, Watermark, Metadata — và một yêu cầu ngôn ngữ tự nhiên sẽ trở thành một pipeline đầy đủ: “xóa PII, chuyển đổi sang PDF, rồi thêm watermark ‘Confidential’.”
Bắt đầu
- Demo mã nguồn mở kèm theo: GroupDocs.Conversion.Agentic — clone repo, thêm khóa LLM của bạn, chạy
docker compose up, và bắt đầu trò chuyện với tài liệu. - NuGet:
GroupDocs.Conversion.Mcp - Docker image:
ghcr.io/groupdocs-conversion/conversion-net-mcp - Tìm hiểu thêm về MCP: modelcontextprotocol.io
Tự động hoá tài liệu dựa trên đại lý không còn là ý tưởng xa vời — chỉ cần một lệnh docker compose up, được xây dựng từ các thành phần bạn có thể đọc, host và tin cậy. Hãy cho các đại lý AI của bạn khả năng chuyển đổi tài liệu, theo cách của bạn.