Zarządzanie metadanymi jest ważną częścią automatyzacji dokumentów, szczególnie dla aplikacji, które pracują z różnymi formatami dokumentów. W tym artykule poznamy, jak zarządzać metadanymi w aplikacjach Python, skupiając się na wyciąganiu, modyfikowaniu i usuwaniu metadanych.

W tym przewodniku przejrzemy następujące sekcje:

  1. Co to jest GroupDocs.Metadata i jak pomaga?
  2. Jak zainstalować
  3. Szybki przewodnik startowy
  4. Główne funkcje
  5. Powszechne przypadki użycia
  6. Rozpocznij z darmową próbą
  7. Zobacz również

Co to jest GroupDocs.Metadata i jak pomaga?

GroupDocs.Metadata for Python via .NET to potężna biblioteka zaprojektowana, aby pomóc programistom zarządzać metadanymi w różnych formatach dokumentów w aplikacjach Python. Chociaż Python oferuje wbudowane metody do wyciągania podstawowych metadanych, takich jak rozmiar pliku, typ i atrybuty, te metody nie radzą sobie z bardziej złożonymi metadanymi związanymi z określonymi formatami plików.

GroupDocs.Metadata wypełnia tę lukę, pozwalając użytkownikom pobierać, aktualizować i usuwać metadane z plików, takich jak PDF, formaty Microsoft Office, obrazy, dźwięk, wideo i wiele innych. Pozwala również na dostęp do szczegółowych informacji, takich jak autor, tytuł, właściwości formatu pliku, w tym dane lokalizacji GPS i wiele innych. Za pomocą prostej API GroupDocs.Metadata możesz efektywnie manipulować metadanymi, aby pokryć wiele scenariuszy automatyzacji dokumentów i przetwarzania danych.

Jak zainstalować

GroupDocs.Metadata for Python via .NET można łatwo zainstalować za pomocą pip. Możesz odwołać się do naszej API w swoim projekcie Python, zainstalowując go za pomocą następującego polecenia:

pip install groupdocs-metadata-net

Szybki przewodnik startowy

Rozpoczęcie pracy z GroupDocs.Metadata for Python via .NET jest szybkie i proste z naszym projektem przykładowym. Oto prosty przewodnik, który pomoże Ci się ustawić:

  1. Sklonuj repozytorium: Sklonuj repozytorium przykładowe do swojej lokalnej maszyny.

    git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
    
  2. Przejdź do folderu Przykłady:

    cd ./GroupDocs.Metadata-for-Python-via-.NET/
    
  3. Zainstaluj niezbędne pakiety:

    pip install groupdocs-metadata-net
    
  4. Uruchom przykłady:

    python run_examples.py
    

To uruchomi serię skryptów przykładowych, demonstrujących różne funkcjonalności biblioteki GroupDocs.Metadata.

Główne funkcje

GroupDocs.Metadata for Python via .NET jest wyposażony w zestaw funkcji, które czynią go przydatnym API dla programistów zajmujących się metadanymi dokumentów. Oto niektóre z głównych funkcji:

  • Zbiorcze funkcje zarządzania metadanymi: Czytaj, aktualizuj i usuwaj metadane z różnych formatów dokumentów.
  • Celowe manipulowanie właściwościami: Szukaj, aktualizuj i usuwaj określone właściwości metadanych, które spełniają określone kryteria.
  • Jednolite zarządzanie właściwościami: Używaj tagów do łatwej manipulacji wspólnymi właściwościami metadanych w spójny sposób.
  • Obsługa dokumentów chronionych hasłem: Pracuj z dokumentami, które są zabezpieczone, zapewniając elastyczność nawet z czułymi danymi.
  • Wgląd w właściwości dokumentu: Wyciągaj szczegółowe informacje o ukrytych stronach, podpisach cyfrowych, komentarzach użytkownika, rewizjach i wielu innych.
  • Kompatybilność z popularnymi standardami: Pracuj z przewodnimi standardami metadanych, takimi jak IPTC, XMP, EXIF i zasoby obrazów.
  • Obsługa metadanych multimedialnych: Manipuluj właściwościami metadanych w różnych formatach i wyciągaj informacje techniczne z plików multimedialnych.
  • Obliczanie statystyk dokumentów: Oblicz powszechne statystyki dokumentów, takie jak liczba słów i liczba znaków dla swoich dokumentów.
  • Wykrywanie formatu pliku: Identyfikuj format i typ MIME pliku na podstawie jego wewnętrznej struktury.
  • Obsługa tagów audio: Zarządzaj różnymi tagami audio, w tym ID3, teksty piosenek i APE.

Powszechne przypadki użycia

Poniżej znajdują się niektóre powszechne przypadki użycia GroupDocs.Metadata w aplikacjach Python wraz z odpowiadającymi fragmentami kodu.

Przypadek użycia 1: Pobierz metadane z obrazu

W tym przykładzie pobierzemy właściwości metadanych pliku obrazu (np. image.jpg) na podstawie określonych kryteriów.

  1. Inicjalizuj obiekt Metadanych: Utwórz nową instancję klasy Metadata z plikiem.
  2. Zdefiniuj kryteria wyszukiwania: Użyj specyfikacji wyszukiwania, aby znaleźć określone właściwości.
  3. Pobierz i wyświetl metadane: Wyciągnij pasujące właściwości i zaloguj ich nazwy i wartości.
import os
import groupdocs.metadata as gm
from datetime import datetime

def run():
    with gm.Metadata("image.jpg") as metadata:
        # Sprawdź, czy format pliku jest znany i dokument nie jest zaszyfrowany
        if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
            # Zdefiniuj specyfikację wyszukiwania, aby znaleźć wszystkie właściwości
            specification = gm.search.AnySpecification()
            # Znajdź właściwości na podstawie specyfikacji wyszukiwania
            properties = metadata.find_properties(specification)
            # Przejdź przez znalezione właściwości i wydrukuj ich nazwy i wartości
            for property in properties:
                # Obsłuż złożone typy danych za pomocą właściwości interpreted_value
                if not (property.interpreted_value is None):
                    print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
                else:
                    print(f"Property name: {property.name}, Property value: {property.value}")

Przypadek użycia 2: Oczyszczanie metadanych z dokumentu

Tutaj oczyszczymy niepożądane metadane z dokumentu PDF.

  1. Załaduj PDF: Utwórz obiekt Metadata dla pliku PDF.
  2. Oczyszcz metadane: Usuń wykryte pakiety metadanych.
  3. Zapisz oczyszczony dokument: Zapisz oczyszczony dokument do nowego pliku.
import groupdocs.metadata as gm

def run():
    with gm.Metadata("input.pdf") as metadata:
        # Usuń wykryte pakiety metadanych i zaloguj usunięte właściwości
        affected = metadata.sanitize()
        print(f"Properties removed: {affected}")
        # Zapisz oczyszczony PDF
        metadata.save("output.pdf")

Przypadek użycia 3: Aktualizacja metadanych dokumentu

Ten przykład pokazuje, jak zaktualizować metadane praw autorskich swoich dokumentów — na przykład, kiedy rozpoczyna się nowy rok. Proces obejmuje trzy główne kroki:

  1. Załaduj dokument: Zainicjalizuj obiekt Metadata dla pliku dokumentu.
  2. Ustaw nowe właściwości: Zaktualizuj metadane praw autorskich dokumentu.
  3. Zapisz zaktualizowany dokument: Zapisz zmiany do pliku.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime

def run():
    files = os.listdir(input_dir_path)
    for file in files:
        with gm.Metadata(input_dir_path + file) as metadata:
            if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
                print()
                print(file)

                # Zdefiniuj specyfikację wyszukiwania, aby znaleźć właściwość praw autorskich
                specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
                # Ustaw właściwość praw autorskich na nową wartość
                affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
                print(f"Affected properties: {affected}")
                # Zapisz zaktualizowany plik
                metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)

Rozpocznij z darmową próbą

Domyślnie biblioteka działa w trybie próbnym bez licencji, co pozwala na eksplorację jej podstawowych funkcji i funkcjonalności. Możesz pobrać GroupDocs.Metadata for Python via .NET z GroupDocs Releases page.

Ponadto możesz nabyć tymczasową licencję z tego linku. Tymczasowa licencja pozwala na używanie biblioteki bez żadnych ograniczeń i pełne eksplorowanie jej możliwości.

Zobacz również

Aby pogłębić wiedzę i uzyskać więcej informacji o GroupDocs.Metadata i jego funkcjonalnościach, odwołaj się do następujących zasobów: