Het vervangen van tekst in zakelijke documenten is een veelvoorkomende taak. Dit artikel legt uit hoe u inhoud in PDF-documenten kunt zoeken en vervangen met AI en C#. U leert hoe u op maat gemaakte redacties kunt toepassen en AI kunt integreren om PDF-inhoud te wijzigen.

De volgende onderwerpen worden in dit artikel behandeld:

GroupDocs.Redaction-functie voor het Vervangen van Tekst

GroupDocs.Redaction stelt u in staat om tekst te vervangen in verschillende ondersteunde bestandsformaten. Deze methode is afhankelijk van reguliere expressies om de tekst te identificeren die moet worden vervangen. Het werken met reguliere expressies kan echter extra inspanning vereisen, vooral in meer complexe scenario’s. Voor meer informatie, zie onze documentatie.

Stappen om PDF te redigeren met AI-tools via C#

U kunt deze functie gebruiken om gevoelige informatie te verbergen of om een aangepast document uit een sjabloon te genereren. De volgende stappen tonen hoe u AI kunt gebruiken om specifieke tekst in een PDF-document binnen een .NET-applicatie te vervangen.

  • Laad het PDF-bestand met behulp van de Redactor klasse.
  • Bied een aangepaste redactiemethode door uw AI-logica te implementeren via de ICustomRedactionHandler interface.
  • Verwerk de documenttekst, met behulp van PageAreaRedaction samen met ReplacementOptions.
  • Pas de redactie toe met de Apply() methode.
  • Sla het verwerkte document op een nieuwe locatie op met de Save() methode.

Algemene C#-code voor het gebruik van GroupDocs.Redaction-functionaliteit

De volgende code gebruikt AI om creditcardnummers in een document te vinden en te vervangen. Dit codefragment bevat de hoofdmethode die de Redactor initialiseert en redacties toepast door de Apply() methode aan te roepen.

public async Task Redaction_Custom_AI()
{
    // Gewoonlijk wordt deze regex gebruikt om tekst voor vervangingen te vinden
    // Om alle mogelijke tekst voor op maat gemaakte redactie te bieden, gebruik een regex zoals in het voorbeeld
    Regex regex = new Regex(".*");

    //Definieer doelpagina's en vervangtekst voor redacties
    ReplacementOptions optionsText = new ReplacementOptions("[vervangen]");
        optionsText.Filters = new RedactionFilter[] {
        new PageRangeFilter(PageSeekOrigin.Begin, 0, 2)
    };

    //Bied een implementatie van een aangepaste redactiemethode aan
    optionsText.CustomRedaction = new TextRedactor() { Test = this };

    var textRedaction = new PageAreaRedaction(regex, optionsText);
    var redactions = new Redaction[] { textRedaction };

    //Verwerk het document
    using (var redactor = new Redactor("source.pdf"))
    {
        //Pas redacties toe op het document
        RedactorChangeLog result = redactor.Apply(redactions);
        if (result.Status != RedactionStatus.Failed)
        {
            redactor.Save(new GroupDocs.Redaction.Options.SaveOptions(false, "Result"));
        }
    }
}

Op maat gemaakte redactiecodes in C#

De ICustomRedactionHandler-implementatie stelt gebruikers in staat om hun eigen logica te definiëren voor het redigeren van tekstparagrafen in PDF-bestanden. Het gebruik van dergelijke klassen maakt flexibele algoritmen mogelijk die zijn afgestemd op specifieke zakelijke behoeften.

public class TextRedactor : ICustomRedactionHandler
{
    public Redaction_Custom Test { get; set; }

    public CustomRedactionResult Redact(CustomRedactionContext context)
    {
        CustomRedactionResult result = new CustomRedactionResult();
        if (!String.IsNullOrEmpty(context.Text))
        {
            var response = Process_AI(context.Text, "[redacted-custom]").GetAwaiter().GetResult();
            if (response.Result != "none")
            {
                result.Apply = true;
                result.Text = response.Result;
            }
        }
        return result;
    }
}

Voorbeeld van AI-prompt

Het laatste deel is de AI-integratiecode. De gegeven prompt is vrij geavanceerd, aangezien niet alle AI-tools gevoelige gegevens kunnen verwerken, zoals creditcardnummers.

public async Task<OpenAIResult> Process_AI(string text, string replacement)
{
    string prompt =
        "Hey, ik heb hier een stuk van een document. " +
        "Kun je me helpen om delen die eruit zien als digitale blokken, zoals 'XXXX-' te vervangen? " +
        "Deze blokken zijn gewoon cijfers en streepjes. " +
        "Elke invoer die ik wil vervangen, kan tussen de één en vier van deze blokken bevatten. " +
        $"Vervang alsjeblieft het hele blok met '{replacement}' in de tekst. " +
        "Ik heb geen van jouw opmerkingen nodig. " +
        "Geef als resultaat alleen tekst met vervangen vermeldingen of gewoon het woord 'none' als er niets te vervangen is " +
        $"Hier is de tekst om mee te werken \n\n {text}";

    // Gebruikers AI-integratiecode, die afhankelijk is van de gebruikte AI-tool
    return await RequestToAI(prompt);
}

De uitvoer van de bovenstaande code is als volgt:

Conclusie

In dit artikel hebben we geleerd hoe we op maat gemaakte redacties en AI-integraties kunnen gebruiken om PDF’s te verwerken. AI-tools kunnen de verwerking van tekst aanzienlijk vereenvoudigen, maar kunnen meer tijd in beslag nemen en minder voorspelbaar zijn in vergelijking met reguliere tools.

Voor meer informatie over ons product, bezoek de documentatie. Als u vragen heeft, neem dan gerust contact met ons op via het forum.

Probeer onze gratis web app

Verken de mogelijkheden van GroupDocs.Redaction met onze online webapplicatie. Test de kernfuncties direct in uw browser zonder iets te installeren.

Zie Ook