Gestire i metadati è una parte importante dell’automazione dei documenti, soprattutto per le applicazioni che lavorano con diversi formati di documenti. In questo articolo, esamineremo come gestire i metadati nelle applicazioni Python, con un focus sull’estrazione, la modifica e la rimozione dei metadati.
In questa guida esploreremo le seguenti sezioni:
- Cos’è GroupDocs.Metadata e come aiuta?
- Come installare
- Guida rapida
- Funzionalità principali
- Casi d’uso comuni
- Inizia con una prova gratuita
- Vedi anche
Cos’è GroupDocs.Metadata e come aiuta?
GroupDocs.Metadata for Python via .NET è una libreria potente progettata per aiutare gli sviluppatori a gestire i metadati in vari formati di documenti nelle applicazioni Python. Sebbene Python fornisca metodi nativi per estrarre metadati di base come dimensione del file, tipo e attributi, questi metodi sono insufficienti quando si tratta di metadati più complessi associati a formati di file specifici.
GroupDocs.Metadata colma questa lacuna permettendo agli utenti di recuperare, aggiornare e rimuovere i metadati da file come PDF, formati Microsoft Office, immagini, audio, video e molti altri. Consente anche l’accesso a informazioni dettagliate come l’autore, il titolo, le proprietà specifiche dei formati di file, inclusi i dati di posizione GPS e molti altri. Con un’API intuitiva, GroupDocs.Metadata ti consente di manipolare i metadati in modo efficace per coprire molti scenari di automazione dei documenti e di elaborazione dei dati.
Come installare
GroupDocs.Metadata for Python via .NET può essere installato facilmente utilizzando pip. Puoi fare riferimento alla nostra API nel tuo progetto Python installandola con il seguente comando:
pip install groupdocs-metadata-net
Guida rapida
Iniziare con GroupDocs.Metadata for Python via .NET è veloce e semplice con il nostro progetto di esempi. Ecco una guida semplice per aiutarti a configurare:
-
Clona il repository: Clona il repository degli esempi nella tua macchina locale.
git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
-
Naviga nella cartella Esempi:
cd ./GroupDocs.Metadata-for-Python-via-.NET/
-
Installa i pacchetti necessari:
pip install groupdocs-metadata-net
-
Esegui gli esempi:
python run_examples.py
Questo eseguirà una serie di script di esempio che dimostrano le varie funzionalità della libreria GroupDocs.Metadata.
Funzionalità principali
GroupDocs.Metadata for Python via .NET è dotato di una gamma di funzionalità che lo rendono un’API utile per gli sviluppatori che lavorano con i metadati dei documenti. Ecco alcune delle funzionalità principali:
- Ricco set di funzionalità di gestione dei metadati: Leggi, aggiorna e rimuovi i metadati da vari formati di documenti.
- Manipolazione delle proprietà mirate: Cerca, aggiorna e elimina proprietà dei metadati specifiche che soddisfano determinati criteri.
- Gestione unificata delle proprietà: Utilizza tag per la manipolazione semplice delle proprietà dei metadati comuni in modo coerente.
- Supporto per documenti protetti da password: Lavora con documenti che sono protetti, garantendo flessibilità anche con dati sensibili.
- Informazioni sulle proprietà del documento: Estrai informazioni dettagliate su pagine nascoste, firme digitali, commenti degli utenti, revisioni e altro.
- Compatibilità con gli standard popolari: Lavora con gli standard di metadati leader come IPTC, XMP, EXIF e Image Resources.
- Gestione dei metadati multimediali: Manipola le proprietà dei metadati nativi in vari formati e estrai informazioni tecniche dai file multimediali.
- Calcolo delle statistiche dei documenti: Calcola statistiche comuni dei documenti come il conteggio delle parole e il conteggio dei caratteri per i tuoi documenti.
- Rilevamento del formato del file: Identifica il formato e il tipo MIME di un file in base alla sua struttura interna.
- Supporto per i tag audio: Gestisci vari tag audio, inclusi ID3, Lyrics e APE.
Casi d’uso comuni
Di seguito sono riportati alcuni casi d’uso comuni per GroupDocs.Metadata nelle applicazioni Python, insieme ai relativi snippet di codice.
Caso d’uso 1: Estrai i metadati da un’immagine
In questo esempio, recupereremo le proprietà dei metadati di un file immagine (ad esempio, image.jpg
) in base a criteri specifici.
- Inizializza l’oggetto Metadata: Crea una nuova istanza della classe Metadata con il tuo file.
- Definisci i criteri di ricerca: Utilizza una specifica di ricerca per trovare proprietà particolari.
- Recupera e visualizza i metadati: Recupera le proprietà corrispondenti e registra i loro nomi e valori.
import os
import groupdocs.metadata as gm
from datetime import datetime
def run():
with gm.Metadata("image.jpg") as metadata:
# Verifica se il formato del file è noto e il documento non è crittografato
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
# Definisci una specifica di ricerca per trovare tutte le proprietà
specification = gm.search.AnySpecification()
# Trova proprietà in base alla specifica di ricerca
properties = metadata.find_properties(specification)
# Iterare attraverso le proprietà trovate e stampare i loro nomi e valori
for property in properties:
# Gestisci i tipi di dati complessi utilizzando la proprietà interpreted_value
if not (property.interpreted_value is None):
print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
else:
print(f"Property name: {property.name}, Property value: {property.value}")
Caso d’uso 2: Pulisci i metadati da un documento
In questo esempio, puliremo i metadati indesiderati da un documento PDF.
- Carica il PDF: Crea un oggetto Metadata per il file PDF.
- Pulisci i metadati: Rimuovi i pacchetti di metadati rilevati.
- Salva il documento pulito: Salva il documento sanitizzato in un nuovo file.
import groupdocs.metadata as gm
def run():
with gm.Metadata("input.pdf") as metadata:
# Rimuovi i pacchetti di metadati rilevati e registra le proprietà rimosse
affected = metadata.sanitize()
print(f"Properties removed: {affected}")
# Salva il PDF pulito
metadata.save("output.pdf")
Caso d’uso 3: Aggiorna i metadati del documento
Questo esempio dimostra come aggiornare i metadati di copyright dei tuoi documenti, ad esempio quando inizia un nuovo anno. Il processo prevede tre passaggi principali:
- Carica il documento: Inizializza un oggetto Metadata per il file del documento.
- Imposta nuove proprietà: Aggiorna i metadati di copyright del documento.
- Salva il documento aggiornato: Salva le modifiche nel file.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime
def run():
files = os.listdir(input_dir_path)
for file in files:
with gm.Metadata(input_dir_path + file) as metadata:
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
print()
print(file)
# Definisci una specifica di ricerca per trovare la proprietà di copyright
specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
# Imposta la proprietà di copyright su un nuovo valore
affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
print(f"Affected properties: {affected}")
# Salva il file aggiornato
metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)
Inizia con una prova gratuita
Per impostazione predefinita, la libreria funziona in modalità di prova senza una licenza, permettendoti di esplorare le sue funzionalità di base. Puoi scaricare GroupDocs.Metadata for Python via .NET dalla pagina delle versioni di GroupDocs.
Inoltre, puoi acquisire una licenza temporanea da questo link. La licenza temporanea ti consente di utilizzare la libreria senza alcuna restrizione e di esplorare appieno le sue capacità.
Vedi anche
Per approfondire e ottenere maggiori informazioni su GroupDocs.Metadata e le sue funzionalità, consulta le seguenti risorse: