Beheren van metadata is een belangrijk onderdeel van documentautomatisering, vooral voor applicaties die werken met verschillende documentformaten. In dit artikel bekijken we hoe je metadata kunt beheren in Python-applicaties, met een focus op het extraheren, wijzigen en verwijderen van metadata.

In deze handleiding bespreken we de volgende secties:

  1. Wat is GroupDocs.Metadata en hoe helpt het?
  2. Hoe te installeren
  3. Snelle startgids
  4. Belangrijke functies
  5. Gebruiksgevallen
  6. Aan de slag met een gratis proefversie
  7. Zie ook

Wat is GroupDocs.Metadata en hoe helpt het?

GroupDocs.Metadata for Python via .NET is een krachtige bibliotheek ontworpen om ontwikkelaars te helpen bij het beheren van metadata over verschillende documentformaten in Python-applicaties. Hoewel Python ingebouwde methoden biedt om basismetadata zoals bestandgrootte, type en kenmerken te extraheren, vallen deze methoden tekort bij het omgaan met complexere metadata die verbonden is aan specifieke bestandformaten.

GroupDocs.Metadata vult deze kloof op door gebruikers in staat te stellen metadata op te halen, bij te werken en te verwijderen van bestanden zoals PDF’s, Microsoft Office-formaten, afbeeldingen, audio, video en vele andere. Het biedt ook toegang tot gedetailleerde informatie zoals de auteur, titel, specifieke eigenschappen van bestandformaten, inclusief GPS-locatiegegevens en veel meer. Met een eenvoudig API maakt GroupDocs.Metadata het mogelijk om metadata effectief te manipuleren om veel documentautomatiserings- en gegevensverwerkingsscenario’s te dekken.

Hoe te installeren

GroupDocs.Metadata for Python via .NET kan eenvoudig worden geïnstalleerd met behulp van pip. Je kunt onze API in je Python-project refereren door het te installeren met het volgende commando:

pip install groupdocs-metadata-net

Snelle startgids

Aan de slag gaan met GroupDocs.Metadata for Python via .NET is snel en eenvoudig met onze voorbeeldproject. Hier is een eenvoudige gids om je te helpen bij het instellen:

  1. Clone de Repository: Cloneer de voorbeeldrepository naar je lokale machine.

    git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
    
  2. Navigeer naar de Voorbeeldmap:

    cd ./GroupDocs.Metadata-for-Python-via-.NET/
    
  3. Installeer benodigde pakketten:

    pip install groupdocs-metadata-net
    
  4. Voer de Voorbeelden Uit:

    python run_examples.py
    

Dit zal een reeks voorbeeldscripts uitvoeren die verschillende functionaliteiten van de GroupDocs.Metadata-bibliotheek demonstreren.

Belangrijke functies

GroupDocs.Metadata for Python via .NET is uitgerust met een reeks functies die het een nuttige API maken voor ontwikkelaars die werken met documentmetadata. Hier zijn enkele van de belangrijkste functies:

  • Rijke set van metadatabeheersfuncties: Lees, update en verwijder metadata van verschillende documentformaten.
  • Gecibeleerde eigenschapmanipulatie: Zoek, update en verwijder specifieke metadata-eigenschappen die aan bepaalde criteria voldoen.
  • Gecentraliseerde eigenschapbeheer: Gebruik tags voor eenvoudige manipulatie van algemene metadata-eigenschappen op een consistente manier.
  • Ondersteuning voor wachtwoordbeveiligde documenten: Werk met documenten die beveiligd zijn, waardoor flexibiliteit wordt gegarandeerd, zelfs met gevoelige gegevens.
  • Inzicht in documenteigenschappen: Extraheer gedetailleerde informatie over verborgen pagina’s, digitale handtekeningen, gebruikersopmerking, revisies en meer.
  • Compatibiliteit met populaire standaarden: Werk met leidende metadata-standaarden zoals IPTC, XMP, EXIF en Image Resources.
  • Multimediametadatabeheer: Manipuleer ingebouwde metadata-eigenschappen in verschillende formaten en extraheer technische informatie uit multimediabestanden.
  • Documentstatistieken berekenen: Bereken algemene documentstatistieken zoals woordteller en teken teller voor je documenten.
  • Bestandsformaatdetectie: Identificeer het formaat en MIME-type van een bestand op basis van zijn interne structuur.
  • Ondersteuning voor audiotags: Beheer verschillende audiotags, waaronder ID3, Lyrics en APE.

Gebruiksgevallen

Hieronder staan enkele gebruikgevallen voor GroupDocs.Metadata in Python-applicaties, samen met overeenkomstige codefragmenten.

Gebruiksgeval 1: Metadata ophalen van een afbeelding

In dit voorbeeld halen we metadata-eigenschappen van een afbeeldingsbestand (bijvoorbeeld image.jpg) op basis van specifieke criteria.

  1. Initialiseer het Metadata-object: Maak een nieuw exemplaar van de Metadata-klasse met je bestand.
  2. Definieer zoekcriteria: Gebruik een zoekspecificatie om bepaalde eigenschappen te vinden.
  3. Ophaal en weergeef metadata: Haal de overeenkomende eigenschappen op en log hun namen en waarden.
import os
import groupdocs.metadata as gm
from datetime import datetime

def run():
    with gm.Metadata("image.jpg") as metadata:
        # Controleer of het bestand formaat bekend is en het document niet is versleuteld
        if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
            # Definieer een zoekspecificatie om alle eigenschappen te vinden
            specification = gm.search.AnySpecification()
            # Zoek eigenschappen op basis van de zoekspecificatie
            properties = metadata.find_properties(specification)
            # Iterateer door de gevonden eigenschappen en druk hun namen en waarden af
            for property in properties:
                # Handleer complexe datatypes door gebruik te maken van de interpreted_value-eigenschap
                if not (property.interpreted_value is None):
                    print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
                else:
                    print(f"Property name: {property.name}, Property value: {property.value}")

Gebruiksgeval 2: Metadata opschonen van een document

Hier zullen we ongewenste metadata opschonen van een PDF-document.

  1. Laad de PDF: Maak een Metadata-object voor het PDF-bestand.
  2. Sanitize Metadata: Verwijder gedetecteerde metadata-pakketten.
  3. Sla het Gepoetste Document Op: Sla het gereinigde document op in een nieuw bestand.
import groupdocs.metadata as gm

def run():
    with gm.Metadata("input.pdf") as metadata:
        # Verwijder gedetecteerde metadata-pakketten en log de verwijderde eigenschappen
        affected = metadata.sanitize()
        print(f"Properties removed: {affected}")
        # Sla de gereinigde PDF op
        metadata.save("output.pdf")

Gebruiksgeval 3: Documentmetadata bijwerken

Dit voorbeeld laat zien hoe je de auteursrechtmetadata van je documenten kunt bijwerken — bijvoorbeeld wanneer een nieuw jaar begint. Het proces omvat drie hoofdstappen:

  1. Laad het Document: Initialiseer een Metadata-object voor het documentbestand.
  2. Stel Nieuwe Eigenschappen In: Werk de auteursrechtmetadata van het document bij.
  3. Sla het Bijgewerkte Document Op: Sla de wijzigingen op in het bestand.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime

def run():
    files = os.listdir(input_dir_path)
    for file in files:
        with gm.Metadata(input_dir_path + file) as metadata:
            if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
                print()
                print(file)

                # Definieer een zoekspecificatie om de auteursrechtseigenschap te vinden
                specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
                # Stel de auteursrechtseigenschap in op een nieuwe waarde
                affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
                print(f"Affected properties: {affected}")
                # Sla het bijgewerkte bestand op
                metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)

Aan de slag met een gratis proefversie

Standaard werkt de bibliotheek in proefmodus zonder een licentie, waardoor je de basisfuncties en functionaliteiten kunt verkennen. Je kunt GroupDocs.Metadata for Python via .NET downloaden van de GroupDocs Releases pagina.

Bovendien kun je een tijdelijke licentie verkrijgen via deze link. De tijdelijke licentie stelt je in staat om de bibliotheek te gebruiken zonder enige beperkingen en om de volledige mogelijkheden te verkennen.

Zie ook

Om dieper in te duiken en meer inzichten te krijgen over GroupDocs.Metadata en zijn functionaliteiten, raadpleeg de volgende bronnen: