Metadatenverwaltung ist ein wichtiger Bestandteil der Dokumentenautomatisierung, insbesondere für Anwendungen, die mit verschiedenen Dokumentformaten arbeiten. In diesem Artikel werden wir uns ansehen, wie man Metadaten in Python-Anwendungen verwaltet, mit dem Schwerpunkt auf dem Extrahieren, Ändern und Entfernen von Metadaten.
In dieser Anleitung werden wir die folgenden Abschnitte erkunden:
- Was ist GroupDocs.Metadata und wie hilft es?
- Wie installiere ich
- Schnellstartanleitung
- Wichtige Funktionen
- Häufige Anwendungsfälle
- Mit einer kostenlosen Testversion beginnen
- Siehe auch
Was ist GroupDocs.Metadata und wie hilft es?
GroupDocs.Metadata for Python via .NET ist eine leistungsstarke Bibliothek, die entwickelt wurde, um Entwicklern die Verwaltung von Metadaten in verschiedenen Dokumentformaten in Python-Anwendungen zu erleichtern. Während Python native Methoden bietet, um grundlegende Metadaten wie Dateigröße, Typ und Attribute zu extrahieren, sind diese Methoden bei der Bearbeitung komplexerer Metadaten, die mit bestimmten Dateiformaten verbunden sind, unzureichend.
GroupDocs.Metadata schließt diese Lücke, indem es Benutzern ermöglicht, Metadaten aus Dateien wie PDFs, Microsoft Office-Formaten, Bildern, Audio, Video und vielen anderen zu extrahieren, zu aktualisieren und zu entfernen. Es ermöglicht auch den Zugriff auf detaillierte Informationen wie den Autor, den Titel, spezifische Eigenschaften von Dateiformaten einschließlich GPS-Standortdaten und viele andere. Mit einer einfachen API ermöglicht GroupDocs.Metadata Ihnen, Metadaten effektiv zu manipulieren, um viele Szenarien der Dokumentenautomatisierung und Datenverarbeitung abzudecken.
Wie installiere ich
GroupDocs.Metadata for Python via .NET kann einfach mit pip installiert werden. Sie können unsere API in Ihrem Python-Projekt referenzieren, indem Sie es mit dem folgenden Befehl installieren:
pip install groupdocs-metadata-net
Schnellstartanleitung
Der Einstieg in GroupDocs.Metadata for Python via .NET ist schnell und einfach mit unserem Beispielprojekt. Hier ist eine einfache Anleitung, um Ihnen den Einstieg zu erleichtern:
-
Repository klonen: Klonen Sie das Beispielrepository auf Ihren lokalen Computer.
git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
-
Zum Beispielordner navigieren:
cd ./GroupDocs.Metadata-for-Python-via-.NET/
-
Notwendige Pakete installieren:
pip install groupdocs-metadata-net
-
Beispiele ausführen:
python run_examples.py
Dies führt eine Reihe von Beispielskripten aus, die verschiedene Funktionen der GroupDocs.Metadata-Bibliothek demonstrieren.
Wichtige Funktionen
GroupDocs.Metadata for Python via .NET verfügt über eine Reihe von Funktionen, die es zu einer nützlichen API für Entwickler machen, die mit Dokumentmetadaten arbeiten. Hier sind einige der wichtigsten Funktionen:
- Umfangreicher Satz von Metadatenverwaltungsfunktionen: Lesen, Aktualisieren und Entfernen von Metadaten aus verschiedenen Dokumentformaten.
- Zielgerichtete Eigenschaftsmanipulation: Suchen, Aktualisieren und Löschen bestimmter Metadateneigenschaften, die bestimmten Kriterien entsprechen.
- Einheitliche Eigenschaftsverwaltung: Verwenden Sie Tags für die einfache Manipulation gemeinsamer Metadateneigenschaften auf konsistente Weise.
- Unterstützung für passwortgeschützte Dokumente: Arbeiten Sie mit gesicherten Dokumenten, um Flexibilität auch bei sensiblen Daten zu gewährleisten.
- Einblick in Dokumenteneigenschaften: Extrahieren Sie detaillierte Informationen über versteckte Seiten, digitale Signaturen, Benutzerkommentare, Überarbeitungen und mehr.
- Kompatibilität mit gängigen Standards: Arbeiten Sie mit führenden Metadatenstandards wie IPTC, XMP, EXIF und Image Resources.
- Multimedia-Metadatenverwaltung: Manipulieren Sie native Metadateneigenschaften in verschiedenen Formaten und extrahieren Sie technische Informationen aus Multimedia-Dateien.
- Berechnung von Dokumentstatistiken: Berechnen Sie allgemeine Dokumentstatistiken wie Wort- und Zeichenanzahl für Ihre Dokumente.
- Dateiformaterkennung: Identifizieren Sie das Format und den MIME-Typ einer Datei basierend auf ihrer internen Struktur.
- Unterstützung für Audio-Tags: Verwalten Sie verschiedene Audio-Tags, einschließlich ID3, Lyrics und APE.
Häufige Anwendungsfälle
Hier sind einige häufige Anwendungsfälle für GroupDocs.Metadata in Python-Anwendungen, zusammen mit entsprechenden Codeausschnitten.
Anwendungsfall 1: Metadaten aus einem Bild abrufen
In diesem Beispiel holen wir die Metadateneigenschaften einer Bilddatei (z. B. image.jpg
) basierend auf bestimmten Kriterien ab.
- Metadatenobjekt initialisieren: Erstellen Sie eine neue Instanz der Metadata-Klasse mit Ihrer Datei.
- Suchkriterien definieren: Verwenden Sie eine Suchspezifikation, um bestimmte Eigenschaften zu finden.
- Metadaten abrufen und anzeigen: Holen Sie sich die übereinstimmenden Eigenschaften und protokollieren Sie deren Namen und Werte.
import os
import groupdocs.metadata as gm
from datetime import datetime
def run():
with gm.Metadata("image.jpg") as metadata:
# Überprüfen Sie, ob das Dateiformat bekannt ist und das Dokument nicht verschlüsselt ist
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
# Definieren Sie eine Suchspezifikation, um alle Eigenschaften zu finden
specification = gm.search.AnySpecification()
# Finden Sie Eigenschaften basierend auf der Suchspezifikation
properties = metadata.find_properties(specification)
# Durchlaufen Sie die gefundenen Eigenschaften und drucken Sie deren Namen und Werte
for property in properties:
# Komplexe Datentypen mit der interpreted_value-Eigenschaft verarbeiten
if not (property.interpreted_value is None):
print(f"Eigenschaftsname: {property.name}, Eigenschaftswert: {property.interpreted_value}")
else:
print(f"Eigenschaftsname: {property.name}, Eigenschaftswert: {property.value}")
Anwendungsfall 2: Metadaten aus einem Dokument bereinigen
Hier bereinigen wir unerwünschte Metadaten aus einem PDF-Dokument.
- PDF laden: Erstellen Sie ein Metadata-Objekt für die PDF-Datei.
- Metadaten bereinigen: Entfernen Sie erfasste Metadatenpakete.
- Gereinigtes Dokument speichern: Speichern Sie das bereinigte Dokument in einer neuen Datei.
import groupdocs.metadata as gm
def run():
with gm.Metadata("input.pdf") as metadata:
# Entfernen Sie erfasste Metadatenpakete und protokollieren Sie die entfernten Eigenschaften
affected = metadata.sanitize()
print(f"Entfernte Eigenschaften: {affected}")
# Speichern Sie das bereinigte PDF
metadata.save("output.pdf")
Anwendungsfall 3: Dokumentmetadaten aktualisieren
Dieses Beispiel zeigt, wie Sie die Urheberrechtsmetadaten Ihrer Dokumente aktualisieren können – z. B. wenn ein neues Jahr beginnt. Der Prozess umfasst drei Hauptschritte:
- Dokument laden: Initialisieren Sie ein Metadata-Objekt für die Dokumentdatei.
- Neue Eigenschaften festlegen: Aktualisieren Sie die Urheberrechtsmetadaten des Dokuments.
- Aktualisiertes Dokument speichern: Speichern Sie die Änderungen in der Datei.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime
def run():
files = os.listdir(input_dir_path)
for file in files:
with gm.Metadata(input_dir_path + file) as metadata:
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
print()
print(file)
# Definieren Sie eine Suchspezifikation, um die Urheberrechtseigenschaft zu finden
specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
# Setzen Sie die Urheberrechtseigenschaft auf einen neuen Wert
affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
print(f"Betroffene Eigenschaften: {affected}")
# Speichern Sie die aktualisierte Datei
metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)
Mit einer kostenlosen Testversion beginnen
Standardmäßig arbeitet die Bibliothek im Testmodus ohne Lizenz, sodass Sie ihre grundlegenden Funktionen und Funktionen erkunden können. Sie können GroupDocs.Metadata for Python via .NET von der GroupDocs Releases-Seite herunterladen.
Zusätzlich können Sie eine temporäre Lizenz von diesem Link erwerben. Die temporäre Lizenz ermöglicht es Ihnen, die Bibliothek ohne Einschränkungen zu verwenden und ihre Fähigkeiten vollständig zu erkunden.
Siehe auch
Um tiefer einzutauchen und mehr Einblicke in GroupDocs.Metadata und seine Funktionen zu erhalten, besuchen Sie die folgenden Ressourcen: