هر سازمانی بر اسناد کار میکند — و بر اسکریپتهای شکنندهای که آنها را بین فرمتها جابجا میکنند. گزارشهای Word به PDF تبدیل میشوند، صفحات گسترده به CSV تبدیل میشوند، اسکنها به فایلهای قابل جستجو تبدیل میشوند. هر فرمت یا قاعده جدیدی به معنای نوشتن دوباره یک خط لوله است. راهی انعطافپذیرتر وجود دارد: بگذارید یک AI agent تبدیلها را انجام دهد، روی زیرساخت خودتان، با استفاده از ابزارهایی که به آن میدهید. این مقاله نشان میدهد چگونه دقیقاً این کار را با n8n، Model Context Protocol (MCP) و GroupDocs.Conversion MCP server بسازید — بهطوری که اسناد شما (و بهاختیار مدل AI شما) کاملاً در محل باقی بمانند.
از خطوط لوله سختکد شده به خودکارسازی agentic
اتوماتیکسازی سنتی چگونگی انجام یک کار را رمزگذاری میکند: تشخیص نوع فایل، شاخهبندی، فراخوانی مبدل، مدیریت خطاها، نوشتن خروجی. هر نیاز جدیدی تغییر کد میطلبد.
یک جریان کاری agentic چه میخواهید را رمزگذاری میکند. هدف را میگویید — «این گزارشها را به PDF تبدیل کن، اما ابتدا تعداد صفحات را بررسی کن» — و مجموعهای از ابزارها را در دسترس میگذارید. عامل AI تصمیم میگیرد کدام ابزارها را و به چه ترتیب فراخوانی کند و به نتایج واکنش نشان میدهد. افزودن یک ابزار به این معنی است که عامل میتواند بلافاصله از آن استفاده کند، بدون نیاز به تغییرات دیگر. این قابلیت سازگاری، هدف اصلی است.
MCP چیست و چرا در اینجا مهم است
سختترین بخش عوامل استفادهکننده از ابزارها همیشه یکپارچهسازی بوده است — هر عامل بهطرز متفاوتی با هر ابزار صحبت میکرد. Model Context Protocol یک استاندارد باز و بیطرف است که این مشکل را حل میکند: هر عاملی که از MCP آگاهی داشته باشد میتواند قابلیتهای هر سرور MCP را کشف و فراخوانی کند. میتوانید آن را «USB‑C برای ابزارهای AI» تصور کنید.
GroupDocs عملیاتهای سند را بهصورت سرورهای MCP منتشر میکند. سرور GroupDocs.Conversion سه ابزار را برای عامل فراهم میکند:
| ابزار | عملکرد |
|---|---|
convert |
تبدیل یک سند به فرمت دیگر (PDF, DOCX, XLSX, PPTX, HTML, PNG, CSV… بیش از ۷۰ فرمت) |
get_document_info |
بررسی یک فایل — نوع، تعداد صفحات، ویژگیها — قبل از اقدام |
get_supported_formats |
کشف اینکه چه تبدیلهایی ممکن است |
چون این سرور با MCP صحبت میکند، عامل شما نیازی به یکپارچهسازی سفارشی GroupDocs ندارد. فقط ابزارها را میبیند.
معماری (همه متن باز، مدل خودتان را بیاورید)
| لایه | کامپوننت | نقش |
|---|---|---|
| هماهنگی | n8n (self‑hosted) | تریگرها، گره AI Agent، مسیریابی فایل |
| استدلال | Your LLM, via n8n’s Chat Model node | تصمیمگیری دربارهٔ فراخوانی ابزارها — کاملاً قابل تعویض |
| ابزارها | GroupDocs.Conversion MCP (stdio) پشت supergateway | convert, get_document_info, get_supported_formats |
| ذخیرهسازی | یک shared Docker volume | نحوهٔ جریان ورودی و خروجی فایلها |
یک انتخاب کلیدی طراحی: LLM قابل وصل شدن است. گره Chat Model در n8n مستقل از ارائهدهنده است، بنابراین عامل و ابزارهای MCP هرگز هنگام تعویض مدل تغییر نمیکنند. مثال زیر از OpenAI استفاده میکند، اما همان جریان کاری میتواند روی Azure OpenAI، Anthropic، AWS Bedrock — یا یک مدل کاملاً خود میزبانیشده (Ollama, vLLM) اجرا شود وقتی که نیاز به استقرار ایزوله دارید که اسناد و AI داخل شبکه شما بمانند.
یک نکتهٔ یکپارچهسازی: Conversion MCP یک سرور stdio سبک (پیشفرض امن، بدون شبکه) است. از آنجا که n8n ابزارهای MCP را از طریق یک URL متصل میکند، یک bridge متن باز کوچک stdio‑to‑SSE (supergateway) آن را روی یک پورت در دسترس قرار میدهد. خود سرور بدون تغییر میماند.
نحوهٔ اجرای جریان کاری
- Trigger — یک وبهوک، ایمیل ورودی، بارگذاری فرم یا پوشهٔ نظارتشده یک سند دریافت میکند.
- Stage — n8n فایل را در پوشهٔ ذخیرهسازی مشترکی مینویسد که سرور MCP از آن میخواند.
- Reason — AI Agent n8n (مدل چت شما + Conversion MCP بهعنوان ابزار) دستوری مانند «report.docx را به PDF تبدیل کن و تعداد صفحات را گزارش بده.» دریافت میکند. بهصورت خودکار
get_document_infoرا فراخوانی میکند، سپسconvert. - Deliver — n8n فایل تبدیلشده را از ذخیرهسازی مشترک برمیدارد و به مسیر بعدی میفرستد — ایمیل، ذخیرهسازی شیء، SharePoint یا پاسخ اولیه.
عامل ابزارها و ترتیب آنها را انتخاب میکند. این همان چیزی است که اجازه میدهد یک جریان کاری واحد بتواند «فقط این را تبدیل کن»، «فقط اگر بیش از ۱۰ صفحه باشد تبدیل کن» یا «تبدیل کن و خلاصهسازی کن» را انجام دهد.
در چند دقیقه راهاندازی کنید
یک پشتهٔ حداقل شامل دو سرویس با یک حجم مشترک است — مبدل (پشت پل) و n8n:
services:
conversion-mcp: # GroupDocs.Conversion MCP, exposed over SSE
build: ./bridge # supergateway --stdio "groupdocs-conversion-mcp" --port 8000
environment:
GROUPDOCS_MCP_STORAGE_PATH: /data
GROUPDOCS_LICENSE_PATH: /license/GroupDocs.Total.lic
volumes: [ ./data:/data, ./gd-license:/license:ro ]
n8n:
image: n8nio/n8n:latest
ports: ["5678:5678"]
volumes: [ ./data:/data ] # SAME folder — the file hand‑off
سپس در n8n، عامل را در چهار گره میسازید: یک Chat Trigger، یک Chat Model (اعتبار OpenAI شما)، یک ابزار MCP Client که به http://conversion-mcp:8000/sse اشاره دارد، و یک AI Agent که آنها را بههم وصل میکند. یک فایل را در ./data بگذارید، چت را باز کنید و از عامل بخواهید آن را تبدیل کند.
تنظیم کامل و قابل اجرا —
docker-compose.yml، تصویر bridge، و یک جریان کاری n8n قابل وارد کردن — در مخزن متن باز همراه (در زیر) موجود است.
مجوزدهی
بدون لایسنس، GroupDocs.Conversion در evaluation mode اجرا میشود: خروجی دارای واترمارک است و ممکن است استفاده محدود باشد. برای تولید، یک فایل GroupDocs.Total.lic را در پوشهٔ لایسنس سوار شده قرار دهید — خروجی سپس پاک و بدون محدودیت خواهد بود. میتوانید request a temporary license کنید تا خروجی دارای لایسنس را امتحان کنید.
چرا این راهحل برای سازمانها مناسب است
- Data sovereignty — اسناد و موتور تبدیل در زیرساخت شما میمانند. یک مدل خود میزبانیشده انتخاب کنید و AI نیز همینطور.
- No lock‑in — هر لایهای متن باز یا مبتنی بر استاندارد (MCP) است. میتوانید LLM، هماهنگکننده یا ابزارها را آزادانه تعویض کنید.
- Auditability — هر تصمیم عامل و هر فراخوانی ابزار بهصورت یک اجرای قابل مشاهده و بازپخش n8n ثبت میشود.
- Composability — این مزیت ترکیبی است. همان عامل را به سرورهای دیگر MCP GroupDocs — Redaction, Watermark, Metadata — اشاره دهید و یک درخواست زبان طبیعی به یک خط لوله کامل تبدیل میشود: «اطلاعات شخصی را حذف کن، به PDF تبدیل کن، سپس واترمارک «Confidential» بزن.»
شروع کنید
- دموی متن باز همراه: GroupDocs.Conversion.Agentic — آن را کلون کنید، کلید LLM خود را اضافه کنید،
docker compose upرا اجرا کنید و شروع به گفتگو با اسناد خود کنید. - NuGet:
GroupDocs.Conversion.Mcp - Docker image:
ghcr.io/groupdocs-conversion/conversion-net-mcp - Learn more about MCP: modelcontextprotocol.io
خودکارسازی اسناد agentic دیگر ایدهای دوردست نیست — فقط با یک docker compose up در دسترس است، ساخته شده از اجزایی که میتوانید بخوانید، میزبانی کنید و به آن اعتماد داشته باشید. به عوامل AI خود توانایی تبدیل اسناد را بدهید، بهشرط خودتان.