إدارة البيانات الوصفية هي جزء مهم من التلقائية الوثائقية، خاصة للأتطبيقات التي تعمل مع أنواع مختلفة من صيغ الوثائق. في هذا المقال، سننظر إلى كيفية إدارة البيانات الوصفية في تطبيقات Python، مع التركيز على استخراج، تعديل وإزالة البيانات الوصفية.
في هذا الدليل، سنستكشف الأقسام التالية:
- ما هو GroupDocs.Metadata وكيف يساعد؟
- كيفية التثبيت
- دليل البدء السريع
- الميزات الرئيسية
- أشكال الاستخدام الشائعة
- بدء مع تجربة مجانية
- انظر أيضًا
ما هو GroupDocs.Metadata وكيف يساعد؟
GroupDocs.Metadata for Python via .NET هي مكتبة قوية مصممة لمساعدة المطورين على إدارة البيانات الوصفية عبر صيغ وثائق مختلفة في تطبيقات Python. بينما يوفر Python طرقًا أصلية لاستخراج البيانات الوصفية الأساسية مثل حجم الملف، النوع، والميزات، فإن هذه الطرق لا تكفي عند التعامل مع بيانات وصفية أكثر تعقيدًا مرتبطة بصيغ الملفات المحددة.
يملأ GroupDocs.Metadata هذه الفجوة من خلال السماح للمستخدمين باسترجاع، تحديث وإزالة البيانات الوصفية من ملفات مثل PDF، صيغ Microsoft Office، الصور، الصوت، الفيديو، وغيرها الكثير. كما يتيح الوصول إلى معلومات مفصلة مثل المؤلف، العنوان، خصائص صيغ الملفات المحددة، بما في ذلك بيانات موقع GPS، وغيرها الكثير. مع واجهة برمجة تطبيقات بسيطة، يتيح لك GroupDocs.Metadata التعامل مع البيانات الوصفية بشكل فعال لتغطية العديد من حالات التلقائية الوثائقية وعمليات معالجة البيانات.
كيفية التثبيت
يمكن تثبيت GroupDocs.Metadata for Python via .NET بسهولة باستخدام pip. يمكنك مرجع API في مشروع Python الخاص بك من خلال تثبيته باستخدام الأمر التالي:
pip install groupdocs-metadata-net
دليل البدء السريع
بدء العمل مع GroupDocs.Metadata for Python via .NET سريع وسهل مع مشروع أمثلةنا. إليك دليل بسيط لمساعدتك على الإعداد:
-
استنساخ المستودع: استنسخ المستودع الخاص بالأمثلة إلى جهازك المحلي.
git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
-
التنقل إلى مجلد الأمثلة:
cd ./GroupDocs.Metadata-for-Python-via-.NET/
-
تثبيت الحزم اللازمة:
pip install groupdocs-metadata-net
-
تشغيل الأمثلة:
python run_examples.py
سيؤدي هذا إلى تنفيذ سلسلة من scripts الأمثلة التي تبين وظائف مختلفة من مكتبة GroupDocs.Metadata.
الميزات الرئيسية
GroupDocs.Metadata for Python via .NET مجهز بمجموعة من الميزات التي تجعلها API مفيدًا للمطورين الذين يعملون مع البيانات الوصفية للوثائق. إليك بعض الميزات الرئيسية:
- مجموعة غنية من ميزات إدارة البيانات الوصفية: قراءة، تحديث وإزالة البيانات الوصفية من صيغ الوثائق المختلفة.
- تعديل الخصائص المستهدفة: البحث، تحديث وإزالة الخصائص الوصفية المحددة التي تتوافق مع معايير معينة.
- إدارة الخصائص الموحدة: استخدام العلامات لتسهيل التعامل مع الخصائص الوصفية الشائعة بطريقة موحدة.
- دعم الوثائق المحمية بكلمة مرور: العمل مع الوثائق التي يتم حمايتها، مما يضمن المرونة حتى مع البيانات الحساسة.
- معلومات حول خصائص الوثيقة: استخراج معلومات مفصلة حول الصفحات المخفية، التوقيعات الرقمية، تعليقات المستخدم، التعديلات، وغيرها.
- التوافق مع المعايير الشائعة: العمل مع معايير البيانات الوصفية الرائدة مثل IPTC، XMP، EXIF، وموارد الصور.
- معالجة البيانات الوصفية المتعددة: التعامل مع خصائص البيانات الوصفية الأصلية في صيغ مختلفة واستخراج معلومات تقنية من ملفات متعددة الوسائط.
- حساب إحصائيات الوثيقة: حساب إحصائيات الوثيقة الشائعة مثل عدد الكلمات وعدد الحروف في وثائقك.
- اكتشاف صيغ الملفات: تحديد صيغة ومIME type للملف بناءً على بنيته الداخلية.
- دعم علامات الصوت: إدارة علامات الصوت المختلفة، بما في ذلك ID3، Lyrics، وAPE.
أشكال الاستخدام الشائعة
إليك بعض أشكال الاستخدام الشائعة لـ GroupDocs.Metadata في تطبيقات Python، مع قطع الكود المقابلة.
شكل الاستخدام 1: استرجاع البيانات الوصفية من صورة
في هذا المثال، سنسترجع خصائص البيانات الوصفية لملف صورة (مثل image.jpg
) بناءً على معايير معينة.
- تهيئة كائن البيانات الوصفية: إنشاء نسخة جديدة من فئة Metadata مع ملفك.
- تعريف معايير البحث: استخدام معيار البحث للبحث عن خصائص معينة.
- استرجاع وإظهار البيانات الوصفية: استرجاع الخصائص المتطابقة وسجل أسماءها وقيمها.
import os
import groupdocs.metadata as gm
from datetime import datetime
def run():
with gm.Metadata("image.jpg") as metadata:
# التحقق من أن صيغة الملف معروفة ولا يتم تشفيرها
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
# تعريف معيار البحث للبحث عن جميع الخصائص
specification = gm.search.AnySpecification()
# البحث عن الخصائص بناءً على معيار البحث
properties = metadata.find_properties(specification)
# التكرار عبر الخصائص التي تم العثور عليها وطباعة أسماءها وقيمها
for property in properties:
# التعامل مع أنواع البيانات المعقدة باستخدام الخاصية interpreted_value
if not (property.interpreted_value is None):
print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
else:
print(f"Property name: {property.name}, Property value: {property.value}")
شكل الاستخدام 2: تنظيف البيانات الوصفية من وثيقة
في هذا المثال، سننظف البيانات الوصفية غير المرغوب فيها من وثيقة PDF.
- تحميل PDF: إنشاء كائن Metadata للملف PDF.
- تنظيف البيانات الوصفية: إزالة حزم البيانات الوصفية التي تم اكتشافها.
- حفظ الوثيقة النظيف: حفظ الوثيقة النظيف في ملف جديد.
import groupdocs.metadata as gm
def run():
with gm.Metadata("input.pdf") as metadata:
# إزالة حزم البيانات الوصفية التي تم اكتشافها وسجل الخصائص التي تم إزالتها
affected = metadata.sanitize()
print(f"Properties removed: {affected}")
# حفظ PDF النظيف
metadata.save("output.pdf")
شكل الاستخدام 3: تحديث البيانات الوصفية للوثيقة
يوضح هذا المثال كيفية تحديث البيانات الوصفية لحقوق النشر في وثائقك — مثل عندما يبدأ العام الجديد. يتضمن العملية ثلاثة خطوات رئيسية:
- تحميل الوثيقة: تهيئة كائن Metadata للملف الوثيقة.
- تعيين خصائص جديدة: تحديث بيانات حقوق النشر للوثيقة.
- حفظ الوثيقة المحدثة: حفظ التغييرات في الملف.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime
def run():
files = os.listdir(input_dir_path)
for file in files:
with gm.Metadata(input_dir_path + file) as metadata:
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
print()
print(file)
# تعريف معيار البحث للبحث عن خاصية حقوق النشر
specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
# تعيين خاصية حقوق النشر إلى قيمة جديدة
affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
print(f"Affected properties: {affected}")
# حفظ الملف المحدث
metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)
بدء مع تجربة مجانية
بالتعريف، تعمل المكتبة في وضع التجربة دون رخصة، مما يتيح لك استكشاف ميزاتها الأساسية ووظائفها. يمكنك تحميل GroupDocs.Metadata for Python via .NET من صفحة إصدارات GroupDocs.
بالإضافة إلى ذلك، يمكنك الحصول على رخصة مؤقتة من هذا الرابط. تسمح الرخصة المؤقتة لك باستخدام المكتبة دون أي قيود واستكشاف قدراتها بالكامل.
انظر أيضًا
لتعمق المزيد واستكشاف المزيد من المعلومات حول GroupDocs.Metadata ووظائفها، راجع الموارد التالية: