Nahrazování textu v obchodních dokumentech je běžný úkol. Tento článek vysvětluje jak najít a nahradit obsah v PDF dokumentech pomocí AI a C#. Naučíte se, jak aplikovat vlastní redakce a integrovat AI pro úpravu obsahu PDF.
Následující témata jsou v tomto článku pokryta:
- Běžný způsob nahrazení textu
- Kroky pro redakci PDF pomocí AI nástrojů přes C#
- Běžný C# kód pro využití funkčnosti GroupDocs.Redaction
- Vlastní redakční C# kód
- Příklad AI promptu
Funkce GroupDocs.Redaction pro nahrazování textu
GroupDocs.Redaction vám umožňuje nahrazovat text v různých podporovaných formátech souborů. Tato metoda se spoléhá na regulární výrazy pro identifikaci textu, který má být nahrazen. Práce s regulárními výrazy však může vyžadovat další úsilí, zejména v složitějších scénářích. Pro více informací si přečtěte naši dokumentaci.
Kroky pro redakci PDF pomocí AI nástrojů přes C#
Tuto funkci můžete použít k skrytí citlivých informací nebo k vygenerování přizpůsobeného dokumentu z šablony. Následující kroky ukazují, jak využít AI k nahrazení konkrétního textu v PDF dokumentu v rámci .NET aplikace.
- Načtěte PDF soubor pomocí třídy Redactor.
- Poskytněte vlastní redakční handler implementací vaší AI logiky prostřednictvím rozhraní ICustomRedactionHandler.
- Zpracujte text dokumentu, využitím PageAreaRedaction spolu s ReplacementOptions.
- Aplikujte redakci pomocí metody Apply().
- Uložte zpracovaný dokument na nové místo pomocí metody Save().
Běžný C# kód pro využití funkčnosti GroupDocs.Redaction
Následující kód používá AI k nalezení a nahrazení čísel kreditních karet v dokumentu. Tento kód obsahuje hlavní metodu, která inicializuje redaktor a aplikuje redakce voláním metody Apply().
public async Task Redaction_Custom_AI()
{
    // Obvykle se tento regex používá k nalezení textu pro nahrazení
    // Pro poskytnutí všech možných textů pro vlastní redakci použijte regex jako v příkladu
    Regex regex = new Regex(".*");
    // Definujte cílové stránky a text pro nahrazení redakcí
    ReplacementOptions optionsText = new ReplacementOptions("[replaced]");
        optionsText.Filters = new RedactionFilter[] {
        new PageRangeFilter(PageSeekOrigin.Begin, 0, 2)
    };
    // Poskytněte implementaci vlastního redakčního handleru
    optionsText.CustomRedaction = new TextRedactor() { Test = this };
    var textRedaction = new PageAreaRedaction(regex, optionsText);
    var redactions = new Redaction[] { textRedaction };
    // Zpracujte dokument
    using (var redactor = new Redactor("source.pdf"))
    {
        // Aplikujte redakce na dokument
        RedactorChangeLog result = redactor.Apply(redactions);
        if (result.Status != RedactionStatus.Failed)
        {
            redactor.Save(new GroupDocs.Redaction.Options.SaveOptions(false, "Result"));
        }
    }
}
Vlastní redakční C# kód
Implementace ICustomRedactionHandler umožňuje uživatelům definovat vlastní logiku pro redakci textových odstavců v PDF souborech. Použití takových tříd umožňuje flexibilní algoritmy přizpůsobené specifickým obchodním potřebám.
public class TextRedactor : ICustomRedactionHandler
{
    public Redaction_Custom Test { get; set; }
    public CustomRedactionResult Redact(CustomRedactionContext context)
    {
        CustomRedactionResult result = new CustomRedactionResult();
        if (!String.IsNullOrEmpty(context.Text))
        {
            var response = Process_AI(context.Text, "[redacted-custom]").GetAwaiter().GetResult();
            if (response.Result != "none")
            {
                result.Apply = true;
                result.Text = response.Result;
            }
        }
        return result;
    }
}
Příklad AI promptu
Poslední část je kód pro integraci AI. Poskytnutý prompt je poměrně sofistikovaný, protože ne všechny AI nástroje mohou zpracovávat citlivé údaje, jako jsou čísla kreditních karet.
public async Task<OpenAIResult> Process_AI(string text, string replacement)
{
    string prompt =
        "Ahoj, mám kousek dokumentu. " +
        "Můžeš mi pomoci vyměnit jakékoli části, které vypadají jako digitální bloky, jako 'XXXX-'? " +
        "Tyto bloky jsou jen čísla a pomlčky. " +
        "Každý záznam, který chci nahradit, může mít kdekoli od jednoho do čtyř z těchto bloků. " +
        $"Prosím, nahraď celé bloky za '{replacement}' v textu. " +
        "Nepotřebuji žádné tvoje komentáře. " +
        "Vrátit jako výsledek pouze text s nahrazenými položkami nebo jen slovo 'none', pokud nebylo co nahradit " +
        $"Zde je text na práci \n\n {text}";
    // Kód pro integraci AI uživatelů, který závisí na použitém AI nástroji
    return await RequestToAI(prompt);
}
Výstup výše uvedeného kódu je následující:
 
 
Závěr
V tomto článku jsme se naučili, jak používat vlastní redakce a integraci AI pro zpracování PDF. Nástroje AI mohou značně zjednodušit zpracování textu, ale mohou zabrat více času a být méně předvídatelné ve srovnání s běžnými nástroji.
Pro více informací o našem produktu navštivte naši dokumentaci. Pokud máte nějaké dotazy, neváhejte se na nás obrátit prostřednictvím fóra.
Vyzkoušejte naši bezplatnou webovou aplikaci
Prozkoumejte možnosti GroupDocs.Redaction pomocí naší online webové aplikace. Otestujte základní funkce přímo ve vašem prohlížeči bez instalace čehokoli.