Tổng quan

Gộp các tệp PDF là yêu cầu thường gặp đối với nhiều lập trình viên, cho dù để hợp nhất báo cáo, biên soạn tài liệu, hay đơn giản hóa việc chia sẻ tệp. Với thư viện GroupDocs.Merger for Python via .NET, các lập trình viên có thể gộp nhiều tệp PDF một cách hiệu quả theo cách lập trình. Bài viết này sẽ hướng dẫn bạn cách gộp các tệp PDF bằng Python, bao gồm các chức năng cần thiết và cung cấp các ví dụ mã thực tế.

Bạn có thể khám phá các phần sau đây để tìm hiểu thêm về quy trình gộp:

Cách gộp các tệp PDF trong Python

Thư viện GroupDocs.Merger for Python via .NET cho phép các lập trình viên dễ dàng gộp các tệp PDF mà không cần sự can thiệp của phần mềm bên thứ ba. Chức năng này rất cần thiết cho các nhiệm vụ như biên soạn nhiều tài liệu thành một tệp duy nhất, điều này nâng cao khả năng quản lý và chia sẻ tài liệu.

Các bước để gộp các tệp PDF

  1. Tải tệp PDF nguồn: Bắt đầu bằng cách tạo một phiên bản của lớp Merger và truyền đường dẫn của tệp PDF nguồn.
  2. Thêm các tệp PDF bổ sung: Sử dụng phương thức join của lớp Merger để thêm các tệp PDF khác mà bạn muốn kết hợp.
  3. Lưu tệp PDF đã gộp: Cuối cùng, gọi phương thức save để chỉ định tên tệp cho tệp PDF đã gộp và lưu kết quả.

Dưới đây là một ví dụ đơn giản về cách gộp hai tệp PDF:

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Ví dụ Sử Dụng Cơ Bản] # NhiềuTàiLiệuHoạtĐộng # Gộp : Pdf")

    # Tạo thể hiện Merger và tải tệp PDF đầu tiên
    with gm.Merger(constants.sample_pdf) as merger:
        print(f"Thông tin tài liệu đã được lấy thành công")
        # Thêm một tệp PDF khác để gộp
        merger.join(constants.sample_pdf)
        # Lưu tệp PDF đã gộp
        merger.save(constants.output_pdf)
        print(f"Gộp đến: {constants.output_pdf}")
    
    print(f"----------------------------------------------------------------------------")

Cách gộp các tệp PDF với bookmark trong Python

Gộp các PDF có chứa bookmark là cần thiết để bảo tồn điều hướng tài liệu. Thư viện GroupDocs.Merger cung cấp tùy chọn để bao gồm bookmark trong quy trình gộp.

Các bước để gộp các tệp PDF với Bookmark

  1. Tải tệp PDF nguồn: Khởi tạo lớp Merger và tải tệp PDF đầu tiên của bạn.
  2. Đặt tùy chọn Bookmark: Tạo đối tượng PdfJoinOptions với cờ use_bookmarks được đặt thành True.
  3. Thêm các tệp PDF bổ sung: Gộp các tệp PDF khác vào hợp nhất trong khi đảm bảo bookmark được bảo tồn.
  4. Lưu tệp PDF đã gộp: Gọi phương thức save để lưu kết quả.

Dưới đây là cách thực hiện điều này trong mã:

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Ví dụ Sử Dụng Cơ Bản] # NhiềuTàiLiệuHoạtĐộng # Gộp # Pdf : GộpPdfSửDụngBookmark")

    # Tạo thể hiện Merger và tải tệp PDF đầu tiên
    with gm.Merger(constants.sample_pdf) as merger:
        print(f"Thông tin tài liệu đã được lấy thành công")
        
        # Khởi tạo PdfJoinOptions với cờ UseBookmarks
        pdf_join_options = gm.domain.options.PdfJoinOptions()
        pdf_join_options.use_bookmarks = True
        
        # Thêm một tệp PDF khác để gộp với bookmark
        merger.join(constants.sample_pdf_bookmarks, pdf_join_options)
        
        # Lưu tệp PDF đã gộp
        merger.save(constants.output_pdf_bookmarks)
        print(f"Gộp đến: {constants.output_pdf_bookmarks}")
    
    print(f"----------------------------------------------------------------------------")

Cách tải chính xác các luồng PDF trong Python

Gộp các tệp PDF từ luồng mở rộng tính linh hoạt của thư viện GroupDocs.Merger, cho phép bạn quản lý nội dung PDF một cách linh hoạt.

Các bước để Tải Luồng PDF

  1. Tải PDF từ luồng: Sử dụng một luồng tệp làm đầu vào cho lớp Merger.
  2. Thực hiện các hoạt động: Khi tài liệu đã được tải từ luồng, bạn có thể tiếp tục với các hoạt động gộp của mình.

Dưới đây là một ví dụ:

from turtle import update
import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Ví dụ Sử Dụng Nâng Cao] # Tải # TảiTàiLiệuTừLuồng")

    # Lấy luồng tệp để tải
    stream = get_file_stream()
    # Gộp các tệp PDF từ luồng
    with gm.Merger(stream) as merger:
        print(f"Tài liệu đã được tải từ luồng thành công")
    
    print(f"----------------------------------------------------------------------------")

def get_file_stream():
    # Tải tệp PDF dưới dạng luồng nhị phân
    file_path = constants.sample_pdf
    return open(file_path, "rb")

Xem thêm

Bạn có thể tải xuống phiên bản dùng thử miễn phí của GroupDocs.Merger for Python via .NET từ đây và nhận giấy phép tạm thời tại Giấy phép Tạm thời để sử dụng thư viện của chúng tôi mà không bị hạn chế.

Ví dụ mã

Dưới đây là một số ví dụ chi tiết hơn minh họa các trường hợp sử dụng khác nhau cho việc gộp PDF bằng thư viện GroupDocs.Merger for Python via .NET.

Ví dụ 1: Gộp cơ bản nhiều tệp PDF

Ví dụ này minh họa cách gộp nhiều tệp PDF thành một.

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Ví dụ Sử Dụng Cơ Bản] # NhiềuTàiLiệuHoạtĐộng # Gộp : Pdf")

    # Tạo một thể hiện Merger và tải tệp PDF đầu tiên
    with gm.Merger(constants.sample_pdf) as merger:
        print(f"Thông tin tài liệu đã được lấy thành công")
        
        # Thêm một tệp PDF khác để gộp
        merger.join(constants.sample_pdf)
        
        # Lưu tệp PDF đã gộp
        merger.save(constants.output_pdf)
        print(f"Gộp đến: {constants.output_pdf}")
    
    print(f"----------------------------------------------------------------------------")

Ví dụ 2: Gộp PDF với Bookmark

Ví dụ này cho thấy cách gộp các tệp PDF trong khi bảo tồn bookmark.

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Ví dụ Sử Dụng Cơ Bản] # NhiềuTàiLiệuHoạtĐộng # Gộp # Pdf : GộpPdfSửDụngBookmark")

    # Tạo một thể hiện Merger và tải tệp PDF đầu tiên
    with gm.Merger(constants.sample_pdf) as merger:
        print(f"Thông tin tài liệu đã được lấy thành công")
        
        # Khởi tạo PdfJoinOptions với cờ UseBookmarks
        pdf_join_options = gm.domain.options.PdfJoinOptions()
        pdf_join_options.use_bookmarks = True
        
        # Thêm một tệp PDF khác để gộp với bookmark
        merger.join(constants.sample_pdf_bookmarks, pdf_join_options)
        
        # Lưu tệp PDF đã gộp
        merger.save(constants.output_pdf_bookmarks)
        print(f"Gộp đến: {constants.output_pdf_bookmarks}")
    
    print(f"----------------------------------------------------------------------------")

Ví dụ 3: Tải luồng PDF

Ví dụ này minh họa cách tải PDF bằng cách sử dụng luồng tệp, cho phép nhập dữ liệu linh hoạt.

from turtle import update
import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Ví dụ Sử Dụng Nâng Cao] # Tải # TảiTàiLiệuTừLuồng")

    # Lấy luồng tệp để tải
    stream = get_file_stream()
    
    # Gộp các tệp PDF từ luồng
    with gm.Merger(stream) as merger:
        print(f"Tài liệu đã được tải từ luồng thành công")
    
    print(f"----------------------------------------------------------------------------")

def get_file_stream():
    # Tải tệp PDF dưới dạng luồng nhị phân
    file_path = constants.sample_pdf
    return open(file_path, "rb")

Xem thêm

Bạn có thể tải xuống phiên bản dùng thử miễn phí của GroupDocs.Merger for Python via .NET từ đây và nhận giấy phép tạm thời tại Giấy phép Tạm thời để sử dụng thư viện của chúng tôi mà không bị hạn chế.