مدیریت متادیتا بخشی مهم از خودکار سازی مستندات است، به ویژه برای برنامه‌هایی که با فرمت‌های مختلف مستند کار می‌کنند. در این مقاله، به مدیریت متادیتا در برنامه‌های پایتون با تمرکز بر استخراج، تغییر و حذف متادیتا می‌پردازیم.

در این راهنمای، به بخش‌های زیر می‌پردازیم:

  1. GroupDocs.Metadata چیست و چگونه کمک می‌کند؟
  2. چگونه نصب شود
  3. راهنمای شروع سریع
  4. ویژگی‌های کلیدی
  5. موردهای استفاده رایج
  6. شروع با یک نسخه آزمایشی رایگان
  7. همچنین ببینید

GroupDocs.Metadata چیست و چگونه کمک می‌کند؟

GroupDocs.Metadata for Python via .NET یک کتابخانه قدرتمند است که برای کمک به توسعه دهندگان در مدیریت متادیتا در فرمت‌های مختلف مستند در برنامه‌های پایتون طراحی شده است. در حالی که پایتون روش‌های بومی برای استخراج متادیتا پایه‌ای مانند اندازه فایل، نوع و ویژگی‌ها را فراهم می‌کند، این روش‌ها در برخورد با متادیتا پیچیده‌تری که با فرمت‌های خاص فایل مرتبط هستند، ناکارآمد هستند.

GroupDocs.Metadata این شکاف را پر می‌کند و به کاربران اجازه می‌دهد تا متادیتا را از فایل‌های مختلف مانند PDF، فرمت‌های Microsoft Office، تصاویر، صدا، ویدئو و بسیاری دیگر استخراج، به روز رسانی و حذف کنند. همچنین دسترسی به اطلاعات جزئی مانند نویسنده، عنوان، ویژگی‌های خاص فرمت فایل، از جمله داده‌های موقعیت GPS و بسیاری دیگر را امکان‌پذیر می‌کند. با یک API ساده، GroupDocs.Metadata به شما اجازه می‌دهد تا متادیتا را به طور مؤثر تغییر دهید تا بسیاری از صحنه‌های خودکار سازی مستندات و پردازش داده‌ها را پوشش دهد.

چگونه نصب شود

GroupDocs.Metadata for Python via .NET با استفاده از pip به راحتی نصب می‌شود. می‌توانید API ما را در پروژه پایتون خود با نصب آن با دستور زیر به عنوان مرجع قرار دهید:

pip install groupdocs-metadata-net

راهنمای شروع سریع

شروع کار با GroupDocs.Metadata for Python via .NET با پروژه نمونه‌های ما سریع و ساده است. این یک راهنمای ساده برای راه اندازی است:

  1. کلون کردن مخزن: مخزن نمونه را به ماشین محلی خود کلون کنید.

    git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
    
  2. رفتن به پوشه نمونه‌ها:

    cd ./GroupDocs.Metadata-for-Python-via-.NET/
    
  3. نصب بسته‌های لازم:

    pip install groupdocs-metadata-net
    
  4. اجرا نمونه‌ها:

    python run_examples.py
    

این یک سری از اسکریپت‌های نمونه را اجرا می‌کند که عملکردهای مختلف کتابخانه GroupDocs.Metadata را نشان می‌دهد.

ویژگی‌های کلیدی

GroupDocs.Metadata for Python via .NET با مجموعه‌ای از ویژگی‌ها تجهیز شده است که آن را به یک API مفید برای توسعه دهندگان که با متادیتا مستندات کار می‌کنند تبدیل می‌کند. این برخی از ویژگی‌های کلیدی هستند:

  • مجموعه‌ای از ویژگی‌های مدیریت متادیتا: متادیتا را از فرمت‌های مختلف مستندات بخوانید، به روز رسانی و حذف کنید.
  • تغییر ویژگی‌های هدفمند: جستجو، به روز رسانی و حذف ویژگی‌های متادیتا خاصی که به معیارهای خاصی برمی گردند.
  • مدیریت یکپارچه ویژگی‌ها: از برچسب‌ها برای تغییر ویژگی‌های متادیتا مشترک به صورت یکنواخت استفاده کنید.
  • پشتیبانی از مستندات محافظت شده با رمز عبور: با مستندات که محافظت شده‌اند کار کنید، انعطاف‌پذیری را حتی با داده‌های حساس تضمین کنید.
  • دریافت اطلاعات مستندات: اطلاعات جزئی دربارهٔ صفحات پنهان، امضاهای دیجیتال، نظرات کاربران، اصلاحات و بیشتر را استخراج کنید.
  • همخوانی با استانداردهای محبوب: با استانداردهای متادیتا پیشرو مانند IPTC، XMP، EXIF و Image Resources کار کنید.
  • مدیریت متادیتا چند رسانه‌ای: ویژگی‌های متادیتا بومی در فرمت‌های مختلف را تغییر دهید و اطلاعات فنی را از فایل‌های چند رسانه‌ای استخراج کنید.
  • حساب کردن آمار مستندات: آمار مستندات معمولی مانند شمارش کلمات و شمارش کاراکترها را برای مستندات خود محاسبه کنید.
  • شناسایی فرمت فایل: فرمت و نوع MIME یک فایل را بر اساس ساختار داخلی آن شناسایی کنید.
  • پشتیبانی از برچسب‌های صوتی: برچسب‌های مختلف صوتی مانند ID3، Lyrics و APE را مدیریت کنید.

موردهای استفاده رایج

در زیر برخی از موردهای استفاده رایج برای GroupDocs.Metadata در برنامه‌های پایتون، همراه با نمونه کدهای مربوطه آمده است.

مورد استفاده 1: استخراج متادیتا از یک تصویر

در این مثال، ما ویژگی‌های متادیتا یک فایل تصویر (مثلا image.jpg) را بر اساس معیارهای خاصی دریافت می‌کنیم.

  1. ایجاد یک شیء متادیتا: یک نمونه جدید از کلاس متادیتا را با فایل خود ایجاد کنید.
  2. تعریف معیارهای جستجو: از یک معیار جستجو برای یافتن ویژگی‌های خاص استفاده کنید.
  3. دریافت و نمایش متادیتا: ویژگی‌های مطابقت یافته را دریافت و نام و ارزش آنها را ثبت کنید.
import os
import groupdocs.metadata as gm
from datetime import datetime

def run():
    with gm.Metadata("image.jpg") as metadata:
        # بررسی کنید که فرمت فایل شناخته شده است و مستند رمزگذاری نشده است
        if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
            # تعریف یک معیار جستجو برای یافتن همه ویژگی‌ها
            specification = gm.search.AnySpecification()
            # یافتن ویژگی‌ها بر اساس معیار جستجو
            properties = metadata.find_properties(specification)
            # تکرار ویژگی‌های یافت شده و نام و ارزش آنها را چاپ کنید
            for property in properties:
                # داده‌های پیچیده را با استفاده از ویژگی interpreted_value مدیریت کنید
                if not (property.interpreted_value is None):
                    print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
                else:
                    print(f"Property name: {property.name}, Property value: {property.value}")

مورد استفاده 2: پاکسازی متادیتا از یک مستند

در اینجا، ما متادیتا نامطلوب را از یک مستند PDF پاک می‌کنیم.

  1. بارگذاری PDF: یک شیء متادیتا برای فایل PDF ایجاد کنید.
  2. پاکسازی متادیتا: بسته‌های متادیتا شناسایی شده را حذف کنید.
  3. ذخیره مستند پاک شده: مستند پاک شده را در یک فایل جدید ذخیره کنید.
import groupdocs.metadata as gm

def run():
    with gm.Metadata("input.pdf") as metadata:
        # حذف بسته‌های متادیتا شناسایی شده و ثبت ویژگی‌های حذف شده
        affected = metadata.sanitize()
        print(f"Properties removed: {affected}")
        # ذخیره PDF پاک شده
        metadata.save("output.pdf")

مورد استفاده 3: به روز رسانی متادیتا مستند

این مثال نشان می‌دهد که چگونه می‌توانید متادیتا حقوق تکثیر مستندات خود را به روز کنید — مانند زمانی که یک سال جدید شروع می‌شود. این فرایند شامل سه مرحله اصلی است:

  1. بارگذاری مستند: یک شیء متادیتا برای فایل مستند ایجاد کنید.
  2. تعیین ویژگی‌های جدید: متادیتا حقوق تکثیر مستند را به روز کنید.
  3. ذخیره مستند به روز شده: تغییرات را در فایل ذخیره کنید.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime

def run():
    files = os.listdir(input_dir_path)
    for file in files:
        with gm.Metadata(input_dir_path + file) as metadata:
            if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
                print()
                print(file)

                # تعریف یک معیار جستجو برای یافتن ویژگی حقوق تکثیر
                specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
                # تعیین ویژگی حقوق تکثیر به یک مقدار جدید
                affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
                print(f"Affected properties: {affected}")
                # ذخیره فایل به روز شده
                metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)

شروع با یک نسخه آزمایشی رایگان

به طور پیش فرض، کتابخانه در حالت آزمایشی بدون مجوز کار می‌کند، به شما اجازه می‌دهد تا ویژگی‌های پایه و عملکردهای آن را بررسی کنید. می‌توانید GroupDocs.Metadata for Python via .NET را از صفحه ریلیزهای GroupDocs دانلود کنید.

همچنین می‌توانید یک مجوز موقت از این لینک دریافت کنید. مجوز موقت به شما اجازه می‌دهد تا از کتابخانه بدون هیچ محدودیت استفاده کنید و تمام قابلیت‌های آن را به طور کامل بررسی کنید.

همچنین ببینید

برای مطالعه بیشتر و کسب اطلاعات بیشتر در مورد GroupDocs.Metadata و عملکردهای آن، به موارد زیر مراجعه کنید: