Manajemen metadata adalah bagian penting dari otomatisasi dokumen, terutama untuk aplikasi yang bekerja dengan berbagai format dokumen. Dalam artikel ini, kita akan melihat cara mengelola metadata di aplikasi Python, dengan fokus pada mengekstrak, memodifikasi, dan menghapus metadata.
Dalam panduan ini, kita akan menjelajahi bagian-bagian berikut:
- Apa itu GroupDocs.Metadata dan bagaimana cara kerjanya?
- Cara menginstal
- Panduan cepat mulai
- Fitur Utama
- Kasus Penggunaan Umum
- Mulai dengan Uji Coba Gratis
- Lihat Juga
Apa itu GroupDocs.Metadata dan bagaimana cara kerjanya?
GroupDocs.Metadata for Python via .NET adalah perpustakaan kuat yang dirancang untuk membantu pengembang mengelola metadata di berbagai format dokumen dalam aplikasi Python. Walaupun Python menyediakan metode asli untuk mengekstrak metadata dasar seperti ukuran file, tipe, dan atribut, metode-metode ini kurang efektif ketika menangani metadata yang lebih kompleks yang terkait dengan format file tertentu.
GroupDocs.Metadata mengisi celah ini dengan memungkinkan pengguna untuk mengambil, memperbarui, dan menghapus metadata dari file seperti PDF, format Microsoft Office, gambar, audio, video, dan banyak lagi. Ini juga memungkinkan akses ke informasi terperinci seperti penulis, judul, properti khusus format file, termasuk data lokasi GPS, dan banyak lagi. Dengan API yang sederhana, GroupDocs.Metadata memungkinkan Anda memanipulasi metadata secara efektif untuk meliputi banyak skenario otomatisasi dokumen dan pemrosesan data.
Cara menginstal
GroupDocs.Metadata for Python via .NET dapat dengan mudah diinstal menggunakan pip. Anda dapat merujuk API kami dalam proyek Python Anda dengan menginstalnya dengan perintah berikut:
pip install groupdocs-metadata-net
Panduan cepat mulai
Memulai dengan GroupDocs.Metadata for Python via .NET cepat dan mudah dengan proyek contoh kami. Berikut adalah panduan sederhana untuk membantu Anda mengatur:
-
Clone Repository: Clone repository contoh ke mesin lokal Anda.
git clone https://github.com/groupdocs-metadata/GroupDocs.Metadata-for-Python-via-.NET.git
-
Navigasi ke Folder Contoh:
cd ./GroupDocs.Metadata-for-Python-via-.NET/
-
Instal Paket yang Dibutuhkan:
pip install groupdocs-metadata-net
-
Jalankan Contoh:
python run_examples.py
Ini akan mengeksekusi serangkaian skrip contoh yang mendemonstrasikan berbagai fungsi perpustakaan GroupDocs.Metadata.
Fitur Utama
GroupDocs.Metadata for Python via .NET dilengkapi dengan berbagai fitur yang membuatnya menjadi API berguna bagi pengembang yang bekerja dengan metadata dokumen. Berikut adalah beberapa fitur utama:
- Set Rich Metadata Management Features: Baca, perbarui, dan hapus metadata dari berbagai format dokumen.
- Manipulasi Properti Terpilih: Cari, perbarui, dan hapus properti metadata tertentu yang memenuhi kriteria tertentu.
- Manajemen Properti Terunifikasi: Gunakan tag untuk manipulasi properti metadata umum dengan cara yang konsisten.
- Dukungan untuk Dokumen yang Dilindungi Kata Sandi: Bekerja dengan dokumen yang terlindungi, memastikan fleksibilitas bahkan dengan data sensitif.
- Wawasan tentang Properti Dokumen: Ekstrak informasi terperinci tentang halaman tersembunyi, tanda tangan digital, komentar pengguna, revisi, dan banyak lagi.
- Kesesuaian dengan Standar Populer: Bekerja dengan standar metadata terkemuka seperti IPTC, XMP, EXIF, dan Image Resources.
- Penanganan Metadata Multimedia: Manipulasi properti metadata asli dalam berbagai format dan ekstrak informasi teknis dari file multimedia.
- Perhitungan Statistik Dokumen: Hitung statistik dokumen umum seperti hitungan kata dan hitungan karakter untuk dokumen Anda.
- Deteksi Format File: Identifikasi format dan tipe MIME file berdasarkan struktur internalnya.
- Dukung Tag Audio: Kelola berbagai tag audio, termasuk ID3, Lyrics, dan APE.
Kasus Penggunaan Umum
Berikut adalah beberapa kasus penggunaan umum untuk GroupDocs.Metadata di aplikasi Python, bersama dengan potongan kode yang sesuai.
Kasus Penggunaan 1: Ambil metadata dari gambar
Dalam contoh ini, kita akan mengambil properti metadata dari file gambar (misalnya, image.jpg
) berdasarkan kriteria tertentu.
- Inisialisasi Objek Metadata: Buat instance baru kelas Metadata dengan file Anda.
- Tentukan Kriteria Pencarian: Gunakan spesifikasi pencarian untuk menemukan properti tertentu.
- Ambil dan Tampilkan Metadata: Ambil properti yang cocok dan log nama dan nilai mereka.
import os
import groupdocs.metadata as gm
from datetime import datetime
def run():
with gm.Metadata("image.jpg") as metadata:
# Periksa apakah format file diketahui dan dokumen tidak terenkripsi
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
# Tentukan spesifikasi pencarian untuk menemukan semua properti
specification = gm.search.AnySpecification()
# Temukan properti berdasarkan spesifikasi pencarian
properties = metadata.find_properties(specification)
# Iterasi melalui properti yang ditemukan dan cetak nama dan nilai mereka
for property in properties:
# Tangani jenis data kompleks dengan menggunakan properti interpreted_value
if not (property.interpreted_value is None):
print(f"Property name: {property.name}, Property value: {property.interpreted_value}")
else:
print(f"Property name: {property.name}, Property value: {property.value}")
Kasus Penggunaan 2: Bersihkan metadata dari dokumen
Disini kita akan membersihkan metadata yang tidak diinginkan dari dokumen PDF.
- Muat PDF: Buat objek Metadata untuk file PDF.
- Sanitasi Metadata: Hapus paket metadata yang terdeteksi.
- Simpan Dokumen yang Dibersihkan: Simpan dokumen yang disanitasi ke file baru.
import groupdocs.metadata as gm
def run():
with gm.Metadata("input.pdf") as metadata:
# Hapus paket metadata yang terdeteksi dan log properti yang dihapus
affected = metadata.sanitize()
print(f"Properties removed: {affected}")
# Simpan PDF yang dibersihkan
metadata.save("output.pdf")
Kasus Penggunaan 3: Perbarui metadata dokumen
Contoh ini menunjukkan cara memperbarui metadata hak cipta dokumen Anda — misalnya, ketika tahun baru dimulai. Proses melibatkan tiga langkah utama:
- Muat Dokumen: Inisialisasi objek Metadata untuk file dokumen.
- Tetapkan Properti Baru: Perbarui metadata hak cipta dokumen.
- Simpan Dokumen yang Diperbarui: Simpan perubahan ke file.
import os
import groupdocs.metadata as gm
import pathlib
from datetime import datetime
def run():
files = os.listdir(input_dir_path)
for file in files:
with gm.Metadata(input_dir_path + file) as metadata:
if metadata.file_format != gm.common.FileFormat.UNKNOWN and metadata.get_document_info().is_encrypted != True:
print()
print(file)
# Tentukan spesifikasi pencarian untuk menemukan properti hak cipta
specification = gm.search.ContainsTagSpecification(gm.tagging.Tags.legal.copyright)
# Tetapkan properti hak cipta ke nilai baru
affected = metadata.set_properties(specification, gm.common.PropertyValue("Copyright (C) 2011-2025 Your Company. All Rights Reserved."))
print(f"Affected properties: {affected}")
# Simpan file yang diperbarui
metadata.save(output_dir_path + "output" + pathlib.Path(file).suffix)
Mulai dengan Uji Coba Gratis
Secara default, perpustakaan beroperasi dalam mode uji coba tanpa lisensi, memungkinkan Anda untuk menjelajahi fitur dasar dan fungsi. Anda dapat mengunduh GroupDocs.Metadata for Python via .NET dari GroupDocs Releases page.
Selain itu, Anda dapat memperoleh lisensi sementara dari link ini. Lisensi temp memungkinkan Anda menggunakan perpustakaan tanpa batasan dan menjelajahi kemampuannya secara penuh.
Lihat Juga
Untuk mempelajari lebih dalam dan mendapatkan wawasan lebih banyak tentang GroupDocs.Metadata dan fungsi-fungsi, merujuk ke sumber daya berikut: