ניהול מטא-נתונים הוא חלק חשוב באוטומציה של מסמכים, במיוחד עבור אפליקציות שפועלות עם פורמטים שונים של מסמכים. במאמר זה, נראה כיצד לנהל מטא-נתונים באפליקציות פייטון, עם דגש על הוצאת, שינוי והסרת מטא-נתונים.

בהדרכת זו, נחקור את החלקים הבאים:

  1. מה זה GroupDocs.Metadata וכיצד הוא עוזר?
  2. איך להתקין
  3. מדריך התחלה מהירה
  4. תכונות מרכזיות
  5. תרחישי שימוש נפוצים
  6. התחלה עם ניסיון חינם
  7. לראות גם

מה זה GroupDocs.Metadata וכיצד הוא עוזר?

GroupDocs.Metadata for Python via .NET היא ספרייה חזקה שנועדה לעזור למפתחים לנהל מטא-נתונים ברחבי פורמטי מסמכים שונים באפליקציות פייטון. בעוד שפייטון מספקת שיטות יתומות להוצאת מטא-נתונים בסיסיים כגון גודל קובץ, סוג ומאפיינים, שיטות אלה לא מספיקות כאשר עוסקים במטא-נתונים מורכבים יותר הקשורים לפורמטי קבצים ספציפיים.

GroupDocs.Metadata ממלא את הפער הזה מאפשרת למשתמשים להוציא, לעדכן ולהסיר מטא-נתונים מקבצים כגון PDFs, פורמטי Microsoft Office, תמונות, אודיו, וידאו ורבים אחרים. הוא גם מאפשר גישה למידע מפורט כגון המחבר, הכותרת, מאפיינים ספציפיים של פורמטי קבצים, כולל נתוני מיקום GPS ועוד. עם API פשוט, GroupDocs.Metadata מאפשר לכם לנתח מטא-נתונים באופן יעיל כדי לכסות סצנרי אוטומציה של מסמכים ומעבדת נתונים רבים.

איך להתקין

GroupDocs.Metadata for Python via .NET ניתן להתקין בקלות באמצעות pip. ניתן להתייחס לאפי שלנו בפרויקט הפייטון שלכם על ידי התקנתו עם הפקודה הבאה:

pip install groupdocs-metadata-net

מדריך התחלה מהירה

התחלת עבודה עם GroupDocs.Metadata for Python via .NET מהירה וישירה עם פרויקט הדוגמאות שלנו. זהו מדריך פשוט כדי לעזור לכם להתקין:

  1. שכפל את המאגר: שכפל את מאגר הדוגמאות למחשב המקומי שלכם.

    git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
    
  2. עבור לתיקיית הדוגמאות:

    cd ./GroupDocs.Metadata-for-Python-via-.NET/
    
  3. התקן חבילות נדרשות:

    pip install groupdocs-metadata-net
    
  4. הרץ את הדוגמאות:

    python run_examples.py
    

זה יבצע סדרה של סקריפטים דוגמאות הדמונסטרציות של תכונות שונות של ספריית GroupDocs.Metadata.

תכונות מרכזיות

GroupDocs.Metadata for Python via .NET מצוידת בטווח של תכונות שממליצות עליה כ-API שימושי למפתחים העוסקים במטא-נתונים של מסמכים. כאן הן כמה מהתכונות המרכזיות:

  • קבוצה עשירה של תכונות ניהול מטא-נתונים: קריאה, עדכון והסרת מטא-נתונים מפורמטי מסמכים שונים.
  • ניתוח מאפיינים מוקד: חיפוש, עדכון והסרת מאפיינים ספציפיים של מטא-נתונים שמקיימים תנאים מסוימים.
  • ניהול מאפיינים מאוחד: השתמשו בתגיות כדי לנהל מאפיינים נפוצים של מטא-נתונים בצורה אחידה.
  • תמיכה במסמכים מוגנים בסיסמא: עבודה עם מסמכים שמוגנים, מבטיחה גמישות גם עם נתונים רגישים.
  • ביקורת על מאפייני מסמך: הוצאת מידע מפורט על דפים מוסתרים, חתימות דיגיטליות, הערות משתמשים, תיקונים ועוד.
  • תאימות עם תקנים פופולריים: עבודה עם תקני מטא-נתונים מובילים כגון IPTC, XMP, EXIF ומשאבי תמונה.
  • טיפול במטא-נתונים רב-תקשורתיים: ניתוח מאפיינים מקוריים של מטא-נתונים בפורמטים שונים והצאת מידע טכני מקבצי רב-תקשורת.
  • חישוב סטטיסטיקות מסמך: חישוב סטטיסטיקות מסמך נפוצות כמו ספירת מילים וספירת תווים עבור המסמכים שלכם.
  • זיהוי פורמט קובץ: זיהוי הפורמט והסוג MIME של קובץ על פי מבנה הפנימי שלו.
  • תמיכה בתגיות אודיו: ניהול תגיות אודיו שונות, כולל ID3, מילים ו-APE.

תרחישי שימוש נפוצים

להלן תרחישי שימוש נפוצים עבור GroupDocs.Metadata באפליקציות פייטון, יחד עם קטעי קוד מתאימים.

תרחיש 1: להביא מטא-נתונים מתמונה

בדוגמה זו, נביא מאפייני מטא-נתונים של קובץ תמונה (למשל, image.jpg) על פי תנאים מסוימים.

  1. התחל את האובייקט מטא-נתונים: יצר תצורה חדשה של מחלקת המטא-נתונים עם הקובץ שלך.
  2. הגדר תנאי חיפוש: השתמש בהגדרה של חיפוש כדי למצוא מאפיינים מסוימים.
  3. הביא וצג מטא-נתונים: הביא את המאפיינים המתאימים והדפיס את שמותיהם וערכיהם.
import os
import groupdocs.metadata as gm
from datetime import datetime

def run():
    with gm.Metadata("image.jpg") as metadata:
        # בדוק אם הפורמט הקובץ ידוע והמסמך לא מוצפן
        if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
            # הגדר הגדרה של חיפוש כדי למצוא כל המאפיינים
            specification = gm.search.AnySpecification()
            # מצא מאפיינים על פי ההגדרה של החיפוש
            properties = metadata.find_properties(specification)
            # עבור את המאפיינים שנמצאו והדפס את שמותיהם וערכיהם
            for property in properties:
                # טפל בסוגי נתונים מורכבים על ידי השימוש במאפיין interpreted_value
                if not (property.interpreted_value is None):
                    print(f"שם המאפיין: {property.name}, ערך המאפיין: {property.interpreted_value}")
                else:
                    print(f"שם המאפיין: {property.name}, ערך המאפיין: {property.value}")

תרחיש 2: לנקות מטא-נתונים מסמך

כאן ננקה מטא-נתונים לא רצויים ממסמך PDF.

  1. טען את ה-PDF: יצר אובייקט מטא-נתונים עבור הקובץ PDF.
  2. נקה מטא-נתונים: הסר חבילות מטא-נתונים שנמצאו.
  3. שמור את המסמך הנקוי: שמור את המסמך הנקוי לקובץ חדש.
import groupdocs.metadata as gm

def run():
    with gm.Metadata("input.pdf") as metadata:
        # הסר חבילות מטא-נתונים שנמצאו והדפס את המאפיינים שנסרו
        affected = metadata.sanitize()
        print(f"מאפיינים שנסרו: {affected}")
        # שמור את ה-PDF הנקוי
        metadata.save("output.pdf")

תרחיש 3: לעדכן מטא-נתונים של מסמך

בדוגמה זו, נראה כיצד לעדכן את מטא-נתוני הזכויות יוצרים של המסמכים שלכם — כגון כאשר שנה חדשה מתחילה.

התהליך כולל שלושה צעדים עיקריים:

  1. טען את המסמך: התחל אובייקט מטא-נתונים עבור הקובץ המסמך.
  2. הגדר מאפיינים חדשים: עדכן את מטא-נתוני הזכויות יוצרים של המסמך.
  3. שמור את המסמך המעודכן: שמור את השינויים לקובץ.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime

def run():
    files = os.listdir(input_dir_path)
    for file in files:
        with gm.Metadata(input_dir_path + file) as metadata:
            if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
                print()
                print(file)

                # הגדר הגדרה של חיפוש כדי למצוא את המאפיין הזכויות יוצרים
                specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
                # הגדר את המאפיין הזכויות יוצרים לערך חדש
                affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
                print(f"מאפיינים שנפגעו: {affected}")
                # שמור את הקובץ המעודכן
                metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)

התחלה עם ניסיון חינם

בברירת המחדל, הספרייה פועלת במצב ניסיון ללא רישיון, מאפשרת לכם לחקור את התכונות הבסיסיות והפונקציות שלה. אתה יכול להוריד GroupDocs.Metadata for Python via .NET מהדף GroupDocs Releases.

בנוסף, אתה יכול לרכוש רישיון זמני מהקישור הזה. הרישיון הזמני מאפשר לך להשתמש בספרייה ללא הגבלות ולחקור את יכולותיה באופן מלא.

לראות גם

לחקור יותר ולהשיג מידע נוסף על GroupDocs.Metadata ותכונותיה, התייחס למקורות הבאים: