Gérer les métadonnées fait partie intégrante de l’automatisation des documents, surtout pour les applications qui travaillent avec différents formats de documents. Dans cet article, nous allons examiner comment gérer les métadonnées dans les applications Python, en nous concentrant sur l’extraction, la modification et la suppression des métadonnées.

Dans ce guide, nous explorerons les sections suivantes :

  1. Qu’est-ce que GroupDocs.Metadata et comment cela aide-t-il ?
  2. Comment installer
  3. Guide de démarrage rapide
  4. Fonctionnalités clés
  5. Cas d’utilisation courants
  6. Commencer avec un essai gratuit
  7. Voir aussi

Qu’est-ce que GroupDocs.Metadata et comment cela aide-t-il ?

GroupDocs.Metadata for Python via .NET est une bibliothèque puissante conçue pour aider les développeurs à gérer les métadonnées dans divers formats de documents dans les applications Python. Bien que Python propose des méthodes natives pour extraire des métadonnées de base telles que la taille du fichier, le type et les attributs, ces méthodes sont insuffisantes lorsqu’il s’agit de métadonnées plus complexes associées à des formats de fichiers spécifiques.

GroupDocs.Metadata comble cette lacune en permettant aux utilisateurs de récupérer, mettre à jour et supprimer les métadonnées des fichiers tels que les PDF, les formats Microsoft Office, les images, les fichiers audio, vidéo et bien d’autres. Il permet également d’accéder à des informations détaillées telles que l’auteur, le titre, les propriétés spécifiques des formats de fichiers, y compris les données de localisation GPS, et bien d’autres. Avec une API simple, GroupDocs.Metadata vous permet de manipuler les métadonnées de manière efficace pour couvrir de nombreux scénarios d’automatisation de documents et de traitement de données.

Comment installer

GroupDocs.Metadata for Python via .NET peut être facilement installé à l’aide de pip. Vous pouvez référencer notre API dans votre projet Python en l’installant avec la commande suivante :

pip install groupdocs-metadata-net

Guide de démarrage rapide

Commencer avec GroupDocs.Metadata for Python via .NET est rapide et simple avec notre projet d’exemples. Voici un guide simple pour vous aider à configurer :

  1. Cloner le dépôt : Clonez le dépôt d’exemples sur votre machine locale.

    git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
    
  2. Naviguer vers le dossier des exemples :

    cd ./GroupDocs.Metadata-for-Python-via-.NET/
    
  3. Installer les packages nécessaires :

    pip install groupdocs-metadata-net
    
  4. Exécuter les exemples :

    python run_examples.py
    

Cela exécutera une série de scripts d’exemples démontrant diverses fonctionnalités de la bibliothèque GroupDocs.Metadata.

Fonctionnalités clés

GroupDocs.Metadata for Python via .NET est équipé d’une gamme de fonctionnalités qui en font une API utile pour les développeurs travaillant avec les métadonnées des documents. Voici quelques-unes des fonctionnalités clés :

  • Ensemble riche de fonctionnalités de gestion des métadonnées : Lire, mettre à jour et supprimer les métadonnées de divers formats de documents.
  • Manipulation des propriétés ciblées : Rechercher, mettre à jour et supprimer des propriétés de métadonnées spécifiques qui répondent à certains critères.
  • Gestion unifiée des propriétés : Utiliser des balises pour une manipulation facile des propriétés de métadonnées courantes de manière cohérente.
  • Prise en charge des documents protégés par mot de passe : Travailler avec des documents sécurisés, assurant la flexibilité même avec des données sensibles.
  • Insight dans les propriétés des documents : Extraire des informations détaillées sur les pages cachées, les signatures numériques, les commentaires des utilisateurs, les révisions, et bien plus encore.
  • Compatibilité avec les normes populaires : Travailler avec les normes de métadonnées leaders telles que IPTC, XMP, EXIF et Image Resources.
  • Gestion des métadonnées multimédias : Manipuler les propriétés de métadonnées natives dans divers formats et extraire des informations techniques à partir de fichiers multimédias.
  • Calcul des statistiques des documents : Calculer des statistiques de documents courantes comme le nombre de mots et le nombre de caractères pour vos documents.
  • Détection du format de fichier : Identifier le format et le type MIME d’un fichier en fonction de sa structure interne.
  • Prise en charge des balises audio : Gérer diverses balises audio, y compris ID3, Lyrics et APE.

Cas d’utilisation courants

Voici quelques cas d’utilisation courants pour GroupDocs.Metadata dans les applications Python, avec des extraits de code correspondants.

Cas d’utilisation 1 : Récupérer les métadonnées d’une image

Dans cet exemple, nous allons récupérer les propriétés de métadonnées d’un fichier image (par exemple, image.jpg) en fonction de critères spécifiques.

  1. Initialiser l’objet Metadata : Créez une nouvelle instance de la classe Metadata avec votre fichier.
  2. Définir les critères de recherche : Utilisez une spécification de recherche pour trouver des propriétés particulières.
  3. Récupérer et afficher les métadonnées : Récupérez les propriétés correspondantes et enregistrez leurs noms et valeurs.
import os
import groupdocs.metadata as gm
from datetime import datetime

def run():
    with gm.Metadata("image.jpg") as metadata:
        # Vérifiez si le format de fichier est connu et que le document n'est pas chiffré
        if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
            # Définir une spécification de recherche pour trouver toutes les propriétés
            specification = gm.search.AnySpecification()
            # Trouver des propriétés en fonction de la spécification de recherche
            properties = metadata.find_properties(specification)
            # Parcourir les propriétés trouvées et imprimer leurs noms et valeurs
            for property in properties:
                # Gérer les types de données complexes en utilisant la propriété interpreted_value
                if not (property.interpreted_value is None):
                    print(f"Nom de la propriété : {property.name}, Valeur de la propriété : {property.interpreted_value}")
                else:
                    print(f"Nom de la propriété : {property.name}, Valeur de la propriété : {property.value}")

Cas d’utilisation 2 : Nettoyer les métadonnées d’un document

Ici, nous allons nettoyer les métadonnées indésirables d’un document PDF.

  1. Charger le PDF : Créez un objet Metadata pour le fichier PDF.
  2. Nettoyer les métadonnées : Supprimez les packages de métadonnées détectés.
  3. Enregistrer le document nettoyé : Enregistrez le document nettoyé dans un nouveau fichier.
import groupdocs.metadata as gm

def run():
    with gm.Metadata("input.pdf") as metadata:
        # Supprimer les packages de métadonnées détectés et enregistrer les propriétés supprimées
        affected = metadata.sanitize()
        print(f"Propriétés supprimées : {affected}")
        # Enregistrer le PDF nettoyé
        metadata.save("output.pdf")

Cas d’utilisation 3 : Mettre à jour les métadonnées du document

Cet exemple montre comment mettre à jour les métadonnées de copyright de vos documents — par exemple, lorsque commence une nouvelle année. Le processus implique trois étapes principales :

  1. Charger le document : Initialisez un objet Metadata pour le fichier de document.
  2. Définir de nouvelles propriétés : Mettez à jour les métadonnées de copyright du document.
  3. Enregistrer le document mis à jour : Enregistrez les modifications dans le fichier.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime

def run():
    files = os.listdir(input_dir_path)
    for file in files:
        with gm.Metadata(input_dir_path + file) as metadata:
            if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
                print()
                print(file)

                # Définir une spécification de recherche pour trouver la propriété de copyright
                specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
                # Définir la propriété de copyright sur une nouvelle valeur
                affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
                print(f"Propriétés affectées : {affected}")
                # Enregistrer le fichier mis à jour
                metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)

Commencer avec un essai gratuit

Par défaut, la bibliothèque fonctionne en mode d’essai sans licence, vous permettant d’explorer ses fonctionnalités de base et ses fonctionnalités. Vous pouvez télécharger GroupDocs.Metadata for Python via .NET depuis la page des versions GroupDocs.

De plus, vous pouvez obtenir une licence temporaire à partir de ce lien. La licence temporaire vous permet d’utiliser la bibliothèque sans aucune restriction et d’explorer pleinement ses capacités.

Voir aussi

Pour approfondir et obtenir plus d’informations sur GroupDocs.Metadata et ses fonctionnalités, consultez les ressources suivantes :