Zarządzanie metadanymi jest ważną częścią automatyzacji dokumentów, szczególnie dla aplikacji, które pracują z różnymi formatami dokumentów. W tym artykule poznamy, jak zarządzać metadanymi w aplikacjach Python, skupiając się na wyciąganiu, modyfikowaniu i usuwaniu metadanych.
W tym przewodniku przejrzemy następujące sekcje:
- Co to jest GroupDocs.Metadata i jak pomaga?
- Jak zainstalować
- Szybki przewodnik startowy
- Główne funkcje
- Powszechne przypadki użycia
- Rozpocznij z darmową próbą
- Zobacz również
Co to jest GroupDocs.Metadata i jak pomaga?
GroupDocs.Metadata for Python via .NET to potężna biblioteka zaprojektowana, aby pomóc programistom zarządzać metadanymi w różnych formatach dokumentów w aplikacjach Python. Chociaż Python oferuje wbudowane metody do wyciągania podstawowych metadanych, takich jak rozmiar pliku, typ i atrybuty, te metody nie radzą sobie z bardziej złożonymi metadanymi związanymi z określonymi formatami plików.
GroupDocs.Metadata wypełnia tę lukę, pozwalając użytkownikom pobierać, aktualizować i usuwać metadane z plików, takich jak PDF, formaty Microsoft Office, obrazy, dźwięk, wideo i wiele innych. Pozwala również na dostęp do szczegółowych informacji, takich jak autor, tytuł, właściwości formatu pliku, w tym dane lokalizacji GPS i wiele innych. Za pomocą prostej API GroupDocs.Metadata możesz efektywnie manipulować metadanymi, aby pokryć wiele scenariuszy automatyzacji dokumentów i przetwarzania danych.
Jak zainstalować
GroupDocs.Metadata for Python via .NET można łatwo zainstalować za pomocą pip. Możesz odwołać się do naszej API w swoim projekcie Python, zainstalowując go za pomocą następującego polecenia:
pip install groupdocs-metadata-net
Szybki przewodnik startowy
Rozpoczęcie pracy z GroupDocs.Metadata for Python via .NET jest szybkie i proste z naszym projektem przykładowym. Oto prosty przewodnik, który pomoże Ci się ustawić:
- 
Sklonuj repozytorium: Sklonuj repozytorium przykładowe do swojej lokalnej maszyny. git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
- 
Przejdź do folderu Przykłady: cd ./GroupDocs.Metadata-for-Python-via-.NET/
- 
Zainstaluj niezbędne pakiety: pip install groupdocs-metadata-net
- 
Uruchom przykłady: python run_examples.py
To uruchomi serię skryptów przykładowych, demonstrujących różne funkcjonalności biblioteki GroupDocs.Metadata.
Główne funkcje
GroupDocs.Metadata for Python via .NET jest wyposażony w zestaw funkcji, które czynią go przydatnym API dla programistów zajmujących się metadanymi dokumentów. Oto niektóre z głównych funkcji:
- Zbiorcze funkcje zarządzania metadanymi: Czytaj, aktualizuj i usuwaj metadane z różnych formatów dokumentów.
- Celowe manipulowanie właściwościami: Szukaj, aktualizuj i usuwaj określone właściwości metadanych, które spełniają określone kryteria.
- Jednolite zarządzanie właściwościami: Używaj tagów do łatwej manipulacji wspólnymi właściwościami metadanych w spójny sposób.
- Obsługa dokumentów chronionych hasłem: Pracuj z dokumentami, które są zabezpieczone, zapewniając elastyczność nawet z czułymi danymi.
- Wgląd w właściwości dokumentu: Wyciągaj szczegółowe informacje o ukrytych stronach, podpisach cyfrowych, komentarzach użytkownika, rewizjach i wielu innych.
- Kompatybilność z popularnymi standardami: Pracuj z przewodnimi standardami metadanych, takimi jak IPTC, XMP, EXIF i zasoby obrazów.
- Obsługa metadanych multimedialnych: Manipuluj właściwościami metadanych w różnych formatach i wyciągaj informacje techniczne z plików multimedialnych.
- Obliczanie statystyk dokumentów: Oblicz powszechne statystyki dokumentów, takie jak liczba słów i liczba znaków dla swoich dokumentów.
- Wykrywanie formatu pliku: Identyfikuj format i typ MIME pliku na podstawie jego wewnętrznej struktury.
- Obsługa tagów audio: Zarządzaj różnymi tagami audio, w tym ID3, teksty piosenek i APE.
Powszechne przypadki użycia
Poniżej znajdują się niektóre powszechne przypadki użycia GroupDocs.Metadata w aplikacjach Python wraz z odpowiadającymi fragmentami kodu.
Przypadek użycia 1: Pobierz metadane z obrazu
W tym przykładzie pobierzemy właściwości metadanych pliku obrazu (np. image.jpg) na podstawie określonych kryteriów.
- Inicjalizuj obiekt Metadanych: Utwórz nową instancję klasy Metadata z plikiem.
- Zdefiniuj kryteria wyszukiwania: Użyj specyfikacji wyszukiwania, aby znaleźć określone właściwości.
- Pobierz i wyświetl metadane: Wyciągnij pasujące właściwości i zaloguj ich nazwy i wartości.
import os
import groupdocs.metadata as gm
from datetime import datetime
def run():
    with gm.Metadata("image.jpg") as metadata:
        # Sprawdź, czy format pliku jest znany i dokument nie jest zaszyfrowany
        if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
            # Zdefiniuj specyfikację wyszukiwania, aby znaleźć wszystkie właściwości
            specification = gm.search.AnySpecification()
            # Znajdź właściwości na podstawie specyfikacji wyszukiwania
            properties = metadata.find_properties(specification)
            # Przejdź przez znalezione właściwości i wydrukuj ich nazwy i wartości
            for property in properties:
                # Obsłuż złożone typy danych za pomocą właściwości interpreted_value
                if not (property.interpreted_value is None):
                    print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
                else:
                    print(f"Property name: {property.name}, Property value: {property.value}")
Przypadek użycia 2: Oczyszczanie metadanych z dokumentu
Tutaj oczyszczymy niepożądane metadane z dokumentu PDF.
- Załaduj PDF: Utwórz obiekt Metadata dla pliku PDF.
- Oczyszcz metadane: Usuń wykryte pakiety metadanych.
- Zapisz oczyszczony dokument: Zapisz oczyszczony dokument do nowego pliku.
import groupdocs.metadata as gm
def run():
    with gm.Metadata("input.pdf") as metadata:
        # Usuń wykryte pakiety metadanych i zaloguj usunięte właściwości
        affected = metadata.sanitize()
        print(f"Properties removed: {affected}")
        # Zapisz oczyszczony PDF
        metadata.save("output.pdf")
Przypadek użycia 3: Aktualizacja metadanych dokumentu
Ten przykład pokazuje, jak zaktualizować metadane praw autorskich swoich dokumentów — na przykład, kiedy rozpoczyna się nowy rok. Proces obejmuje trzy główne kroki:
- Załaduj dokument: Zainicjalizuj obiekt Metadata dla pliku dokumentu.
- Ustaw nowe właściwości: Zaktualizuj metadane praw autorskich dokumentu.
- Zapisz zaktualizowany dokument: Zapisz zmiany do pliku.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime
def run():
    files = os.listdir(input_dir_path)
    for file in files:
        with gm.Metadata(input_dir_path + file) as metadata:
            if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
                print()
                print(file)
                # Zdefiniuj specyfikację wyszukiwania, aby znaleźć właściwość praw autorskich
                specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
                # Ustaw właściwość praw autorskich na nową wartość
                affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
                print(f"Affected properties: {affected}")
                # Zapisz zaktualizowany plik
                metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)
Rozpocznij z darmową próbą
Domyślnie biblioteka działa w trybie próbnym bez licencji, co pozwala na eksplorację jej podstawowych funkcji i funkcjonalności. Możesz pobrać GroupDocs.Metadata for Python via .NET z GroupDocs Releases page.
Ponadto możesz nabyć tymczasową licencję z tego linku. Tymczasowa licencja pozwala na używanie biblioteki bez żadnych ograniczeń i pełne eksplorowanie jej możliwości.
Zobacz również
Aby pogłębić wiedzę i uzyskać więcej informacji o GroupDocs.Metadata i jego funkcjonalnościach, odwołaj się do następujących zasobów: