Керування метаданими є важливою частиною автоматизації документів, особливо для додатків, які працюють з різними форматами документів. У цій статті ми розглянемо, як керувати метаданими в Python додатках, з акцентом на вилучення, зміну та видалення метаданих.
У цьому посібнику ми розглянемо наступні розділи:
- Що таке GroupDocs.Metadata та як воно допомагає?
- Як встановити
- Швидкий початок роботи
- Основні функції
- Поширені випадки використання
- Початок роботи з безкоштовною пробною версією
- Дивіться також
Що таке GroupDocs.Metadata та як воно допомагає?
GroupDocs.Metadata for Python via .NET - це потужна бібліотека, розроблена для допомоги розробникам керувати метаданими в різних форматах документів в Python додатках. Хоча Python надає вбудовані методи для вилучення базових метаданих, таких як розмір файлу, тип та атрибути, ці методи не справляються з більш складними метаданими, пов’язаними з конкретними форматами файлів.
GroupDocs.Metadata заповнює цей прогалин, дозволяючи користувачам отримувати, оновлювати та видаляти метадані з файлів, таких як PDF, формати Microsoft Office, зображення, аудіо, відео та багато інших. Воно також надає доступ до детальної інформації, такої як автор, назва, специфічні властивості форматів файлів, включаючи дані GPS-розташування та багато інших. З простим API, GroupDocs.Metadata дозволяє вам ефективно маніпулювати метаданими для покриття багатьох сценаріїв автоматизації документів та обробки даних.
Як встановити
GroupDocs.Metadata for Python via .NET можна легко встановити за допомогою pip. Ви можете посилатися на наше API в вашому Python проекті, встановивши його за допомогою наступної команди:
pip install groupdocs-metadata-net
Швидкий початок роботи
Початок роботи з GroupDocs.Metadata for Python via .NET швидкий та простий з нашим проектом прикладів. Ось простий посібник, щоб допомогти вам налаштуватися:
-
Клонувати репозиторій: Клонуйте репозиторій прикладів на ваш локальний комп’ютер.
git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
-
Перейти до папки Прикладів:
cd ./GroupDocs.Metadata-for-Python-via-.NET/
-
Встановити необхідні пакети:
pip install groupdocs-metadata-net
-
Запустити приклади:
python run_examples.py
Це виконає серію прикладних скриптів, що демонструють різні функціональні можливості бібліотеки GroupDocs.Metadata.
Основні функції
GroupDocs.Metadata for Python via .NET оснащений широким набором функцій, які роблять його корисним API для розробників, що працюють з метаданими документів. Ось деякі з основних функцій:
- Багатий набір функцій управління метаданими: Читати, оновлювати та видаляти метадані з різних форматів документів.
- Цільове маніпулювання властивостями: Пошук, оновлення та видалення конкретних метаданих, які відповідають певним критеріям.
- Єдине управління властивостями: Використовуйте теги для легкого маніпулювання загальними метаданими властивостями в консистентний спосіб.
- Підтримка документів, захищених паролем: Працюйте з документами, які захищені, забезпечуючи гнучкість навіть з чутливими даними.
- Глибокі знання про властивості документів: Вилучайте детальну інформацію про приховані сторінки, цифрові підписи, коментарі користувачів, ревізії та багато іншого.
- Сумісність з популярними стандартами: Працюйте з провідними стандартами метаданих, такими як IPTC, XMP, EXIF та Image Resources.
- Обробка метаданих мультимедіа: Маніпулюйте вбудованими метаданими властивостями в різних форматах та вилучайте технічну інформацію з мультимедіа файлів.
- Розрахунок статистики документів: Розраховуйте загальні статистичні дані документів, такі як кількість слів та символів для ваших документів.
- Виявлення формату файлу: Визначайте формат та MIME тип файлу на основі його внутрішньої структури.
- Підтримка аудіо тегів: Керуйте різними аудіо тегами, включаючи ID3, Lyrics та APE.
Поширені випадки використання
Нижче наведено деякі поширені випадки використання GroupDocs.Metadata в Python додатках, разом з відповідними фрагментами коду.
Випадок використання 1: Отримати метадані з зображення
У цьому прикладі ми витягнем властивості метаданих з файлу зображення (наприклад, image.jpg
) на основі певних критеріїв.
- Ініціалізувати об’єкт метаданих: Створіть новий екземпляр класу Metadata з вашим файлом.
- Визначити критерії пошуку: Використовуйте специфікацію пошуку для знаходження певних властивостей.
- Отримати та відобразити метадані: Вилучайте відповідні властивості та записуйте їх назви та значення.
import os
import groupdocs.metadata as gm
from datetime import datetime
def run():
with gm.Metadata("image.jpg") as metadata:
# Перевірте, чи формат файлу відомий і документ не зашифрований
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
# Визначте специфікацію пошуку для знаходження всіх властивостей
specification = gm.search.AnySpecification()
# Знайдіть властивості на основі специфікації пошуку
properties = metadata.find_properties(specification)
# Проходьте по знайдених властивостях та друкуйте їх назви та значення
for property in properties:
# Обробляйте складні типи даних, використовуючи властивість interpreted_value
if not (property.interpreted_value is None):
print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
else:
print(f"Property name: {property.name}, Property value: {property.value}")
Випадок використання 2: Очистити метадані з документа
Тут ми очистимо ненужні метадані з PDF документа.
- Завантажити PDF: Створіть об’єкт Metadata для файлу PDF.
- Очистити метадані: Видалити виявлені пакети метаданих.
- Зберегти очищений документ: Зберегти очищений документ у новий файл.
import groupdocs.metadata as gm
def run():
with gm.Metadata("input.pdf") as metadata:
# Видалити виявлені пакети метаданих та записати властивості, які були видалені
affected = metadata.sanitize()
print(f"Properties removed: {affected}")
# Зберегти очищений PDF
metadata.save("output.pdf")
Випадок використання 3: Оновити метадані документа
Цей приклад демонструє, як оновлювати метадані авторських прав ваших документів - наприклад, коли починається новий рік. Процес включає три основні кроки:
- Завантажити документ: Ініціалізуйте об’єкт Metadata для файлу документа.
- Встановити нові властивості: Оновіть метадані авторських прав документа.
- Зберегти оновлений документ: Зберегти зміни у файл.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime
def run():
files = os.listdir(input_dir_path)
for file in files:
with gm.Metadata(input_dir_path + file) as metadata:
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
print()
print(file)
# Визначте специфікацію пошуку для знаходження властивості авторських прав
specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
# Встановити властивість авторських прав на нове значення
affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
print(f"Affected properties: {affected}")
# Зберегти оновлений файл
metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)
Початок роботи з безкоштовною пробною версією
За замовчуванням бібліотека працює в пробному режимі без ліцензії, дозволяючи вам досліджувати її базові функції та можливості. Ви можете завантажити GroupDocs.Metadata for Python via .NET з GroupDocs Releases page.
Крім того, ви можете отримати тимчасову ліцензію з цього посилання. Тимчасова ліцензія дозволяє вам використовувати бібліотеку без будь-яких обмежень та повністю досліджувати її можливості.
Дивіться також
Щоб глибше зрозуміти та отримати більше інформації про GroupDocs.Metadata та його функціональні можливості, зверніться до наступних ресурсів: