Gestão de metadados é uma parte importante da automação de documentos, especialmente para aplicações que trabalham com diferentes formatos de documentos. Neste artigo, vamos ver como gerir metadados em aplicações Python, com foco na extração, modificação e remoção de metadados.
Neste guia, vamos explorar as seguintes secções:
- O que é GroupDocs.Metadata e como ajuda?
- Como instalar
- Guia de início rápido
- Funcionalidades principais
- Casos de uso comuns
- Começar com uma versão de teste gratuita
- Ver também
O que é GroupDocs.Metadata e como ajuda?
GroupDocs.Metadata for Python via .NET é uma biblioteca poderosa projetada para ajudar os desenvolvedores a gerir metadados em vários formatos de documentos em aplicações Python. Embora o Python forneça métodos nativos para extrair metadados básicos como tamanho do ficheiro, tipo e atributos, estes métodos são insuficientes ao lidar com metadados mais complexos associados a formatos de ficheiros específicos.
GroupDocs.Metadata preenche esta lacuna permitindo aos utilizadores obter, atualizar e remover metadados de ficheiros como PDFs, formatos Microsoft Office, imagens, áudio, vídeo e muitos outros. Também permite o acesso a informações detalhadas como o autor, título, propriedades específicas de formatos de ficheiros, incluindo dados de localização GPS e muitos outros. Com uma API simples, GroupDocs.Metadata permite-lhe manipular metadados de forma eficaz para cobrir muitos cenários de automação de documentos e processamento de dados.
Como instalar
GroupDocs.Metadata for Python via .NET pode ser instalado facilmente utilizando o pip. Pode referenciar a nossa API no seu projeto Python instalando-a com o seguinte comando:
pip install groupdocs-metadata-net
Guia de início rápido
Começar com GroupDocs.Metadata for Python via .NET é rápido e direto com o nosso projeto de exemplos. Aqui está uma guia simples para o ajudar a configurar:
- 
Clonar o Repositório: Clone o repositório de exemplos para a sua máquina local. git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
- 
Navegar para a pasta de Exemplos: cd ./GroupDocs.Metadata-for-Python-via-.NET/
- 
Instalar Pacotes Necessários: pip install groupdocs-metadata-net
- 
Executar os Exemplos: python run_examples.py
Isto executará uma série de scripts de exemplo a demonstrar várias funcionalidades da biblioteca GroupDocs.Metadata.
Funcionalidades principais
GroupDocs.Metadata for Python via .NET está equipado com um conjunto de funcionalidades que o tornam uma API útil para desenvolvedores a lidar com metadados de documentos. Aqui estão algumas das funcionalidades principais:
- Conjunto Rico de Funcionalidades de Gestão de Metadados: Ler, atualizar e remover metadados de vários formatos de documentos.
- Manipulação de Propriedades Alvo: Pesquisar, atualizar e eliminar propriedades de metadados específicas que atendem a certos critérios.
- Gestão Unificada de Propriedades: Utilizar etiquetas para manipulação fácil de propriedades de metadados comuns de forma consistente.
- Suporte para Documentos Protegidos por Palavra-passe: Trabalhar com documentos que estão protegidos, garantindo flexibilidade mesmo com dados sensíveis.
- Visão Geral das Propriedades do Documento: Extrair informações detalhadas sobre páginas ocultas, assinaturas digitais, comentários do utilizador, revisões e muito mais.
- Compatibilidade com Normas Populares: Trabalhar com normas de metadados líderes como IPTC, XMP, EXIF e Recursos de Imagem.
- Gestão de Metadados Multimédia: Manipular propriedades de metadados nativas em vários formatos e extrair informações técnicas de ficheiros multimédia.
- Cálculo de Estatísticas de Documentos: Calcular estatísticas comuns de documentos como contagem de palavras e contagem de caracteres para os seus documentos.
- Detecção de Formato de Ficheiro: Identificar o formato e o tipo MIME de um ficheiro com base na sua estrutura interna.
- Suporte para Etiquetas de Áudio: Gerir várias etiquetas de áudio, incluindo ID3, Letras e APE.
Casos de uso comuns
Abaixo estão alguns casos de uso comuns para GroupDocs.Metadata em aplicações Python, juntamente com os respetivos snippets de código.
Caso de uso 1: Obter metadados de uma imagem
Neste exemplo, vamos buscar propriedades de metadados de um ficheiro de imagem (por exemplo, image.jpg) com base em critérios específicos.
- Inicializar o Objeto de Metadados: Crie uma nova instância da classe Metadata com o seu ficheiro.
- Definir Critérios de Pesquisa: Utilize uma especificação de pesquisa para encontrar propriedades específicas.
- Obter e Exibir Metadados: Recupere as propriedades correspondentes e registe os seus nomes e valores.
import os
import groupdocs.metadata as gm
from datetime import datetime
def run():
    with gm.Metadata("image.jpg") as metadata:
        # Verificar se o formato de ficheiro é conhecido e o documento não está cifrado
        if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
            # Definir uma especificação de pesquisa para encontrar todas as propriedades
            specification = gm.search.AnySpecification()
            # Encontrar propriedades com base na especificação de pesquisa
            properties = metadata.find_properties(specification)
            # Iterar pelas propriedades encontradas e imprimir os seus nomes e valores
            for property in properties:
                # Lidar com tipos de dados complexos utilizando a propriedade interpreted_value
                if not (property.interpreted_value is None):
                    print(f"Nome da propriedade: {property.name}, Valor da propriedade: {property.interpreted_value}")
                else:
                    print(f"Nome da propriedade: {property.name}, Valor da propriedade: {property.value}")
Caso de uso 2: Limpar metadados de um documento
Aqui vamos limpar metadados indesejados de um documento PDF.
- Carregar o PDF: Crie um objeto Metadata para o ficheiro PDF.
- Sanitizar Metadados: Remover pacotes de metadados detetados.
- Guardar o Documento Limpo: Guardar o documento sanitizado num novo ficheiro.
import groupdocs.metadata as gm
def run():
    with gm.Metadata("input.pdf") as metadata:
        # Remover pacotes de metadados detetados e registar as propriedades removidas
        affected = metadata.sanitize()
        print(f"Propriedades removidas: {affected}")
        # Guardar o PDF limpo
        metadata.save("output.pdf")
Caso de uso 3: Atualizar metadados do documento
Este exemplo demonstra como atualizar os metadados de direitos de autor dos seus documentos — como quando começa um novo ano. O processo envolve três passos principais:
- Carregar o Documento: Inicializar um objeto Metadata para o ficheiro de documento.
- Definir Novas Propriedades: Atualizar os metadados de direitos de autor do documento.
- Guardar o Documento Atualizado: Guardar as alterações no ficheiro.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime
def run():
    files = os.listdir(input_dir_path)
    for file in files:
        with gm.Metadata(input_dir_path + file) as metadata:
            if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
                print()
                print(file)
                # Definir uma especificação de pesquisa para encontrar a propriedade de direitos de autor
                specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
                # Definir a propriedade de direitos de autor para um novo valor
                affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
                print(f"Propriedades afetadas: {affected}")
                # Guardar o ficheiro atualizado
                metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)
Começar com uma versão de teste gratuita
Por omissão, a biblioteca funciona em modo de teste sem uma licença, permitindo-lhe explorar as suas funcionalidades e funcionalidades básicas. Pode descarregar GroupDocs.Metadata for Python via .NET da página de lançamentos GroupDocs.
Além disso, pode adquirir uma licença temporária a partir deste link. A licença temporária permite-lhe utilizar a biblioteca sem quaisquer restrições e explorar plenamente as suas capacidades.
Ver também
Para mergulhar mais fundo e obter mais informações sobre GroupDocs.Metadata e as suas funcionalidades, consulte os seguintes recursos: