Übersicht

Das Zusammenführen von Word-Dokumenten ist eine häufige Anforderung in vielen Anwendungen, sei es zur Zusammenfassung von Berichten, zur Konsolidierung von Informationen oder einfach zur Vereinfachung des Dokumentenmanagements. In diesem Artikel werden wir untersuchen, wie Sie DOCX-Dateien mit Python und der GroupDocs.Merger-Bibliothek zusammenführen können. Diese leistungsstarke Bibliothek ermöglicht es Entwicklern, Word-Dokumente programmgesteuert zu manipulieren und dabei hohe Leistung und Genauigkeit sicherzustellen.

Dieser Leitfaden deckt Folgendes ab:

Wie man mehrere DOCX-Dateien zusammenführt

Das Zusammenführen mehrerer DOCX-Dateien ist mit der GroupDocs.Merger-Bibliothek unkompliziert. Im Folgenden skizzieren wir die wichtigen Schritte, die an diesem Prozess beteiligt sind:

  1. Importieren Sie das GroupDocs.Merger-Paket: Beginnen Sie mit dem Import der erforderlichen Bibliothek.
  2. Erstellen Sie eine Merger-Instanz: Instanziieren Sie die Merger-Klasse mit dem Pfad zur ersten DOCX-Datei.
  3. Fügen Sie zusätzliche Dokumente hinzu: Verwenden Sie die Methode join, um andere DOCX-Dateien hinzuzufügen, die Sie zusammenführen möchten.
  4. Speichern Sie das zusammengeführte Dokument: Rufen Sie schließlich die Methode save auf, um das zusammengeführte Dokument an einem angegebenen Ausgabepfad zu speichern.

Hier ist ein Python-Codebeispiel, das diese Schritte demonstriert:

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Beispiel Grundlegende Nutzung] # MultipleDocumentOperations # Merge : Docx")

    # Schritt 1: Erstellen Sie ein Merger-Objekt mit dem ersten Dokument
    with gm.Merger(constants.sample_docx) as merger:
        print(f"Dokumentinformationen erfolgreich abgerufen")
        
        # Schritt 2: Fügen Sie eine andere DOCX-Datei zum Zusammenführen hinzu
        merger.join(constants.sample_docx)
        
        # Schritt 3: Speichern Sie das zusammengeführte Dokument
        merger.save(constants.output_docx)
        print(f"Zusammengeführt nach: {constants.output_docx}")
    
    print(f"----------------------------------------------------------------------------")

DOCX-Dokumente ohne Abschnittswechsel zusammenführen

Manchmal erfordert das Zusammenführen von Dokumenten, dass die Inhalte ohne das Einfügen von Abschnittswechseln verbunden werden. Dies kann helfen, den Informationsfluss zwischen den zusammengeführten Dokumenten aufrechtzuerhalten.

  1. Erstellen Sie eine Merger-Instanz: Wie zuvor, initialisieren Sie die Merger-Klasse.
  2. Setzen Sie die Zusammenführungsoptionen: Definieren Sie WordJoinOptions und setzen Sie den mode auf DISABLE_SECTION_BREAKS.
  3. Dokumente zusammenführen: Fügen Sie das zusätzliche Dokument zum Zusammenführen hinzu.
  4. Speichern Sie das Ergebnis: Schreiben Sie die endgültige Ausgabe in eine neue DOCX-Datei.

So können Sie es umsetzen:

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Beispiel Grundlegende Nutzung] # MultipleDocumentOperations # Merge # Word : MergeWordDocumentsWithoutSectionBreaks")

    # Schritt 1: Erstellen Sie ein Merger-Objekt mit dem Quell-Dokument
    with gm.Merger(constants.sample_doc) as merger:
        print(f"Dokumentinformationen erfolgreich abgerufen")
        
        # Schritt 2: Definieren Sie Word-Zusammenführungsoptionen zum Deaktivieren von Abschnittswechseln
        word_join_options = gm.domain.options.WordJoinOptions()
        word_join_options.mode = gm.domain.options.WordJoinMode.DISABLE_SECTION_BREAKS
        
        # Schritt 3: Fügen Sie das Dokument ohne Abschnittswechsel hinzu
        merger.join(constants.sample_doc, word_join_options)
        
        # Schritt 4: Speichern Sie das zusammengeführte Dokument
        merger.save(constants.output_doc_without_section_breaks)
        print(f"Zusammengeführt nach: {constants.output_doc_without_section_breaks}")
    
    print(f"----------------------------------------------------------------------------")

DOCX-Dokumente mit vordefinierten Compliance-Modi zusammenführen

Für spezifische Anwendungsfälle müssen Dokumente möglicherweise bestimmten Standards entsprechen. GroupDocs.Merger ermöglicht es Ihnen, Dokumente mit vordefinierten Compliance-Modi zusammenzuführen, um sicherzustellen, dass die Ausgabe beispielsweise den ISO-Standards entspricht.

  1. Erstellen Sie eine Merger-Instanz: Initialisieren Sie die Merger-Klasse mit Ihrem Basisdokument.
  2. Setzen Sie den Compliance-Modus: Erstellen Sie ein WordJoinOptions-Objekt und setzen Sie die compliance-Eigenschaft.
  3. Dokumente zusammenführen: Fügen Sie das zusätzliche Dokument mit der Methode join hinzu.
  4. Speichern Sie das endgültige Dokument: Speichern Sie es an Ihrem gewünschten Ausgabespeicherort.

Hier ist der Code für diesen Vorgang:

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Beispiel Grundlegende Nutzung] # MultipleDocumentOperations # Merge # Word : MergeWordDocumentsWithPredefinedComplianceMode")

    # Schritt 1: Erstellen Sie ein Merger-Objekt mit dem Dokument
    with gm.Merger(constants.sample_docx) as merger:
        print(f"Dokumentinformationen erfolgreich abgerufen")
        
        # Schritt 2: Definieren Sie Word-Zusammenführungsoptionen mit vordefiniertem Compliance-Modus
        word_join_options = gm.domain.options.WordJoinOptions()
        word_join_options.compliance = gm.domain.options.WordJoinCompliance.ISO_29500_2008_STRICT
        
        # Schritt 3: Fügen Sie ein weiteres Dokument mit Compliance-Modus hinzu
        merger.join(constants.sample_docx, word_join_options)
        
        # Schritt 4: Speichern Sie das zusammengeführte Dokument
        merger.save(constants.output_docx_with_predefined_compliance_mode)
        print(f"Zusammengeführt nach: {constants.output_docx_with_predefined_compliance_mode}")
    
    print(f"----------------------------------------------------------------------------")

DOCX aus Streams zusammenführen

Sie können DOCX-Dateien auch aus im Arbeitsspeicher befindlichen Streams zusammenführen, was nützlich sein kann, wenn Sie mit dynamisch generierten Dokumenten arbeiten.

  1. Erhalten Sie einen Datei-Stream: Öffnen Sie Ihr Dokument im Binärmodus, um den Stream zu erhalten.
  2. Erstellen Sie die Merger-Instanz: Instanziieren Sie die Merger-Klasse mit dem Stream.
  3. Führen Sie die Zusammenführungsoperation durch: Führen Sie die Zusammenführung durch und speichern Sie das Ausgabeergebnis.

So implementieren Sie dies:

from turtle import update
import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Beispiel Erweiterte Nutzung] # Laden # LoadDocumentFromStream")

    # Schritt 1: Erhalten Sie den Dokumentenstream
    stream = get_file_stream()
    
    # Schritt 2: Erstellen Sie eine Merger-Instanz mit dem Stream
    with gm.Merger(stream) as merger:
        print(f"Dokument erfolgreich aus dem Stream geladen")
    
    print(f"----------------------------------------------------------------------------")

def get_file_stream():
    file_path = constants.sample_docx
    return open(file_path, "rb")

Siehe auch

Für weitere Details können Sie die folgenden Ressourcen erkunden:

Sie können auch eine kostenlose Testversion von releases.groupdocs.com herunterladen und eine temporäre Lizenz erwerben, um die Bibliothek ohne Einschränkungen unter Purchase Temporary License auszuprobieren.

Codebeispiele

Hier sind einige zusätzliche Beispiele, die Ihnen helfen, den Zusammenführungsprozess mit der GroupDocs.Merger-Bibliothek für Python zu verstehen:

Word-Dokumente ohne einen neuen Seitenwechsel zusammenführen

Dieses Beispiel zeigt, wie man Dokumente zusammenführt, sodass die letzte Seite des ersten Dokuments direkt von der ersten Seite des nächsten Dokuments gefolgt wird, ohne dass dazwischen eine neue Seite eingefügt wird.

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Beispiel Grundlegende Nutzung] # MultipleDocumentOperations # Merge # Word : MergeWordDocumentsWithoutStartingFromNewPage")

    # Schritt 1: Erstellen Sie ein Merger-Objekt mit dem Dokument
    with gm.Merger(constants.sample_doc) as merger:
        print(f"Dokumentinformationen erfolgreich abgerufen")
        
        # Schritt 2: Definieren Sie Word-Zusammenführungsoptionen für den kontinuierlichen Modus
        word_join_options = gm.domain.options.WordJoinOptions()
        word_join_options.mode = gm.domain.options.WordJoinMode.CONTINUOUS
        
        # Schritt 3: Fügen Sie Dokumente hinzu, ohne eine neue Seite einzufügen
        merger.join(constants.sample_doc, word_join_options)
        
        # Schritt 4: Speichern Sie das zusammengeführte Dokument
        merger.save(constants.output_doc_without_starting_from_new_page)
        print(f"Zusammengeführt nach: {constants.output_doc_without_starting_from_new_page}")
    
    print(f"----------------------------------------------------------------------------")

Mehrere Dokumente mit benutzerdefinierten Zusammenführungsoptionen zusammenführen

Hier erfahren Sie, wie Sie DOCX-Dokumente zusammenführen, während Sie spezifische Zusammenführungsoptionen festlegen, wie z.B. die Compliance mit einem bestimmten ISO-Standard.

import groupdocs.merger as gm
import constants

def run():
    print(f"----------------------------------------------------------------------------")
    print(f"[Beispiel Erweiterte Nutzung] # Merge mit benutzerdefinierten Zusammenführungsoptionen")

    # Schritt 1: Erstellen Sie ein Merger-Objekt mit dem Basisdokument
    with gm.Merger(constants.sample_docx) as merger:
        print(f"Dokumentinformationen erfolgreich abgerufen")
        
        # Schritt 2: Setzen Sie benutzerdefinierte Zusammenführungsoptionen für den vordefinierten Compliance-Modus
        word_join_options = gm.domain.options.WordJoinOptions()
        word_join_options.compliance = gm.domain.options.WordJoinCompliance.ISO_29500_2008_STRICT
        
        # Schritt 3: Fügen Sie ein anderes Dokument mit Compliance-Einstellungen hinzu
        merger.join(constants.sample_docx, word_join_options)
        
        # Schritt 4: Speichern Sie das zusammengeführte Dokument
        merger.save(constants.output_docx_with_predefined_compliance_mode)
        print(f"Zusammengeführt nach: {constants.output_docx_with_predefined_compliance_mode}")
    
    print(f"----------------------------------------------------------------------------")

Siehe auch

Um mehr über GroupDocs.Merger und seine Funktionen zu erfahren, können Sie die folgenden Ressourcen überprüfen:

Kostenlose Testversion und temporäre Lizenz

Sie können eine kostenlose Testversion von GroupDocs.Merger von unserer Releases-Seite herunterladen. Darüber hinaus können Sie eine temporäre Lizenz zu Evaluierungszwecken unter Purchase Temporary License erwerben. Diese temporäre Lizenz ermöglicht es Ihnen, die Bibliothek ohne Einschränkungen auszuprobieren und ihre Fähigkeiten vollständig zu bewerten.