مدیریت متادیتا بخشی مهم از خودکار سازی مستندات است، به ویژه برای برنامههایی که با فرمتهای مختلف مستند کار میکنند. در این مقاله، به مدیریت متادیتا در برنامههای پایتون با تمرکز بر استخراج، تغییر و حذف متادیتا میپردازیم.
در این راهنمای، به بخشهای زیر میپردازیم:
- GroupDocs.Metadata چیست و چگونه کمک میکند؟
- چگونه نصب شود
- راهنمای شروع سریع
- ویژگیهای کلیدی
- موردهای استفاده رایج
- شروع با یک نسخه آزمایشی رایگان
- همچنین ببینید
GroupDocs.Metadata چیست و چگونه کمک میکند؟
GroupDocs.Metadata for Python via .NET یک کتابخانه قدرتمند است که برای کمک به توسعه دهندگان در مدیریت متادیتا در فرمتهای مختلف مستند در برنامههای پایتون طراحی شده است. در حالی که پایتون روشهای بومی برای استخراج متادیتا پایهای مانند اندازه فایل، نوع و ویژگیها را فراهم میکند، این روشها در برخورد با متادیتا پیچیدهتری که با فرمتهای خاص فایل مرتبط هستند، ناکارآمد هستند.
GroupDocs.Metadata این شکاف را پر میکند و به کاربران اجازه میدهد تا متادیتا را از فایلهای مختلف مانند PDF، فرمتهای Microsoft Office، تصاویر، صدا، ویدئو و بسیاری دیگر استخراج، به روز رسانی و حذف کنند. همچنین دسترسی به اطلاعات جزئی مانند نویسنده، عنوان، ویژگیهای خاص فرمت فایل، از جمله دادههای موقعیت GPS و بسیاری دیگر را امکانپذیر میکند. با یک API ساده، GroupDocs.Metadata به شما اجازه میدهد تا متادیتا را به طور مؤثر تغییر دهید تا بسیاری از صحنههای خودکار سازی مستندات و پردازش دادهها را پوشش دهد.
چگونه نصب شود
GroupDocs.Metadata for Python via .NET با استفاده از pip به راحتی نصب میشود. میتوانید API ما را در پروژه پایتون خود با نصب آن با دستور زیر به عنوان مرجع قرار دهید:
pip install groupdocs-metadata-net
راهنمای شروع سریع
شروع کار با GroupDocs.Metadata for Python via .NET با پروژه نمونههای ما سریع و ساده است. این یک راهنمای ساده برای راه اندازی است:
- 
کلون کردن مخزن: مخزن نمونه را به ماشین محلی خود کلون کنید. git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
- 
رفتن به پوشه نمونهها: cd ./GroupDocs.Metadata-for-Python-via-.NET/
- 
نصب بستههای لازم: pip install groupdocs-metadata-net
- 
اجرا نمونهها: python run_examples.py
این یک سری از اسکریپتهای نمونه را اجرا میکند که عملکردهای مختلف کتابخانه GroupDocs.Metadata را نشان میدهد.
ویژگیهای کلیدی
GroupDocs.Metadata for Python via .NET با مجموعهای از ویژگیها تجهیز شده است که آن را به یک API مفید برای توسعه دهندگان که با متادیتا مستندات کار میکنند تبدیل میکند. این برخی از ویژگیهای کلیدی هستند:
- مجموعهای از ویژگیهای مدیریت متادیتا: متادیتا را از فرمتهای مختلف مستندات بخوانید، به روز رسانی و حذف کنید.
- تغییر ویژگیهای هدفمند: جستجو، به روز رسانی و حذف ویژگیهای متادیتا خاصی که به معیارهای خاصی برمی گردند.
- مدیریت یکپارچه ویژگیها: از برچسبها برای تغییر ویژگیهای متادیتا مشترک به صورت یکنواخت استفاده کنید.
- پشتیبانی از مستندات محافظت شده با رمز عبور: با مستندات که محافظت شدهاند کار کنید، انعطافپذیری را حتی با دادههای حساس تضمین کنید.
- دریافت اطلاعات مستندات: اطلاعات جزئی دربارهٔ صفحات پنهان، امضاهای دیجیتال، نظرات کاربران، اصلاحات و بیشتر را استخراج کنید.
- همخوانی با استانداردهای محبوب: با استانداردهای متادیتا پیشرو مانند IPTC، XMP، EXIF و Image Resources کار کنید.
- مدیریت متادیتا چند رسانهای: ویژگیهای متادیتا بومی در فرمتهای مختلف را تغییر دهید و اطلاعات فنی را از فایلهای چند رسانهای استخراج کنید.
- حساب کردن آمار مستندات: آمار مستندات معمولی مانند شمارش کلمات و شمارش کاراکترها را برای مستندات خود محاسبه کنید.
- شناسایی فرمت فایل: فرمت و نوع MIME یک فایل را بر اساس ساختار داخلی آن شناسایی کنید.
- پشتیبانی از برچسبهای صوتی: برچسبهای مختلف صوتی مانند ID3، Lyrics و APE را مدیریت کنید.
موردهای استفاده رایج
در زیر برخی از موردهای استفاده رایج برای GroupDocs.Metadata در برنامههای پایتون، همراه با نمونه کدهای مربوطه آمده است.
مورد استفاده 1: استخراج متادیتا از یک تصویر
در این مثال، ما ویژگیهای متادیتا یک فایل تصویر (مثلا image.jpg) را بر اساس معیارهای خاصی دریافت میکنیم.
- ایجاد یک شیء متادیتا: یک نمونه جدید از کلاس متادیتا را با فایل خود ایجاد کنید.
- تعریف معیارهای جستجو: از یک معیار جستجو برای یافتن ویژگیهای خاص استفاده کنید.
- دریافت و نمایش متادیتا: ویژگیهای مطابقت یافته را دریافت و نام و ارزش آنها را ثبت کنید.
import os
import groupdocs.metadata as gm
from datetime import datetime
def run():
    with gm.Metadata("image.jpg") as metadata:
        # بررسی کنید که فرمت فایل شناخته شده است و مستند رمزگذاری نشده است
        if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
            # تعریف یک معیار جستجو برای یافتن همه ویژگیها
            specification = gm.search.AnySpecification()
            # یافتن ویژگیها بر اساس معیار جستجو
            properties = metadata.find_properties(specification)
            # تکرار ویژگیهای یافت شده و نام و ارزش آنها را چاپ کنید
            for property in properties:
                # دادههای پیچیده را با استفاده از ویژگی interpreted_value مدیریت کنید
                if not (property.interpreted_value is None):
                    print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
                else:
                    print(f"Property name: {property.name}, Property value: {property.value}")
مورد استفاده 2: پاکسازی متادیتا از یک مستند
در اینجا، ما متادیتا نامطلوب را از یک مستند PDF پاک میکنیم.
- بارگذاری PDF: یک شیء متادیتا برای فایل PDF ایجاد کنید.
- پاکسازی متادیتا: بستههای متادیتا شناسایی شده را حذف کنید.
- ذخیره مستند پاک شده: مستند پاک شده را در یک فایل جدید ذخیره کنید.
import groupdocs.metadata as gm
def run():
    with gm.Metadata("input.pdf") as metadata:
        # حذف بستههای متادیتا شناسایی شده و ثبت ویژگیهای حذف شده
        affected = metadata.sanitize()
        print(f"Properties removed: {affected}")
        # ذخیره PDF پاک شده
        metadata.save("output.pdf")
مورد استفاده 3: به روز رسانی متادیتا مستند
این مثال نشان میدهد که چگونه میتوانید متادیتا حقوق تکثیر مستندات خود را به روز کنید — مانند زمانی که یک سال جدید شروع میشود. این فرایند شامل سه مرحله اصلی است:
- بارگذاری مستند: یک شیء متادیتا برای فایل مستند ایجاد کنید.
- تعیین ویژگیهای جدید: متادیتا حقوق تکثیر مستند را به روز کنید.
- ذخیره مستند به روز شده: تغییرات را در فایل ذخیره کنید.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime
def run():
    files = os.listdir(input_dir_path)
    for file in files:
        with gm.Metadata(input_dir_path + file) as metadata:
            if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
                print()
                print(file)
                # تعریف یک معیار جستجو برای یافتن ویژگی حقوق تکثیر
                specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
                # تعیین ویژگی حقوق تکثیر به یک مقدار جدید
                affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
                print(f"Affected properties: {affected}")
                # ذخیره فایل به روز شده
                metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)
شروع با یک نسخه آزمایشی رایگان
به طور پیش فرض، کتابخانه در حالت آزمایشی بدون مجوز کار میکند، به شما اجازه میدهد تا ویژگیهای پایه و عملکردهای آن را بررسی کنید. میتوانید GroupDocs.Metadata for Python via .NET را از صفحه ریلیزهای GroupDocs دانلود کنید.
همچنین میتوانید یک مجوز موقت از این لینک دریافت کنید. مجوز موقت به شما اجازه میدهد تا از کتابخانه بدون هیچ محدودیت استفاده کنید و تمام قابلیتهای آن را به طور کامل بررسی کنید.
همچنین ببینید
برای مطالعه بیشتر و کسب اطلاعات بیشتر در مورد GroupDocs.Metadata و عملکردهای آن، به موارد زیر مراجعه کنید: