Zastępowanie tekstu w dokumentach biznesowych jest powszechnym zadaniem. Ten artykuł wyjaśnia jak znaleźć i zastąpić zawartość w dokumentach PDF za pomocą AI i C#. Nauczysz się, jak stosować niestandardowe redakcje i integrować AI w celu modyfikacji zawartości PDF.
W artykule omówiono następujące tematy:
- Zwykły sposób zastępowania tekstu
- Kroki do redagowania PDF za pomocą narzędzi AI przez C#
- Typowy kod C# do użycia funkcji GroupDocs.Redaction
- Niestandardowy kod redakcji C#
- Przykład komunikatu AI
Funkcja GroupDocs.Redaction do Zastępowania Tekstu
GroupDocs.Redaction pozwala na zastępowanie tekstu w różnych obsługiwanych formatach plików. Ta metoda opiera się na wyrażeniach regularnych, aby zidentyfikować tekst, który należy zastąpić. Jednak praca z wyrażeniami regularnymi może wymagać dodatkowego wysiłku, szczególnie w bardziej skomplikowanych scenariuszach. Po więcej informacji zobacz naszą dokumentację.
Kroki do redagowania PDF za pomocą narzędzi AI przez C#
Możesz użyć tej funkcji, aby ukryć wrażliwe informacje lub wygenerować spersonalizowany dokument na podstawie szablonu. Poniższe kroki pokazują, jak użyć AI do zastąpienia konkretnego tekstu w dokumencie PDF w aplikacji .NET.
- Załaduj plik PDF używając klasy Redactor.
- Podaj niestandardowy handler redakcji, implementując swoją logikę AI za pomocą interfejsu ICustomRedactionHandler.
- Przetwórz tekst dokumentu, używając PageAreaRedaction wraz z ReplacementOptions.
- Zastosuj redakcję używając metody Apply().
- Zapisz przetworzony dokument w nowej lokalizacji używając metody Save().
Typowy kod C# do użycia funkcji GroupDocs.Redaction
Poniższy kod używa AI do znajdowania i zastępowania numerów kart kredytowych w dokumencie. Ten fragment kodu zawiera metodę główną, która inicjalizuje Redactor i stosuje redakcje, wywołując metodę Apply().
public async Task Redaction_Custom_AI()
{
// Zwykle to wyrażenie regularne jest używane do znajdowania tekstu do zastąpienia
// Aby podać wszystkie możliwe teksty do niestandardowej redakcji, użyj wyrażenia regularnego, jak w przykładzie
Regex regex = new Regex(".*");
// Zdefiniuj docelowe strony i tekst zastępczy dla redakcji
ReplacementOptions optionsText = new ReplacementOptions("[replaced]");
optionsText.Filters = new RedactionFilter[] {
new PageRangeFilter(PageSeekOrigin.Begin, 0, 2)
};
// Podaj implementację niestandardowego handlera redakcji
optionsText.CustomRedaction = new TextRedactor() { Test = this };
var textRedaction = new PageAreaRedaction(regex, optionsText);
var redactions = new Redaction[] { textRedaction };
// Przetwórz dokument
using (var redactor = new Redactor("source.pdf"))
{
// Zastosuj redakcje do dokumentu
RedactorChangeLog result = redactor.Apply(redactions);
if (result.Status != RedactionStatus.Failed)
{
redactor.Save(new GroupDocs.Redaction.Options.SaveOptions(false, "Result"));
}
}
}
Niestandardowy kod redakcji C#
Implementacja ICustomRedactionHandler umożliwia użytkownikom zdefiniowanie własnej logiki do redagowania akapitów tekstu w plikach PDF. Używanie takich klas umożliwia elastyczne algorytmy dostosowane do specyficznych potrzeb biznesowych.
public class TextRedactor : ICustomRedactionHandler
{
public Redaction_Custom Test { get; set; }
public CustomRedactionResult Redact(CustomRedactionContext context)
{
CustomRedactionResult result = new CustomRedactionResult();
if (!String.IsNullOrEmpty(context.Text))
{
var response = Process_AI(context.Text, "[redacted-custom]").GetAwaiter().GetResult();
if (response.Result != "none")
{
result.Apply = true;
result.Text = response.Result;
}
}
return result;
}
}
Przykład komunikatu AI
Ostatnia część to kod integracji AI. Podany komunikat jest dość złożony, ponieważ nie wszystkie narzędzia AI mogą przetwarzać wrażliwe dane, takie jak numery kart kredytowych.
public async Task<OpenAIResult> Process_AI(string text, string replacement)
{
string prompt =
"Cześć, mam tutaj fragment dokumentu. " +
"Czy możesz mi pomóc zamienić wszelkie części, które wyglądają jak cyfrowe bloki, takie jak 'XXXX-'? " +
"Te bloki to po prostu liczby i myślniki. " +
"Każdy wpis, który chcę zastąpić, może mieć od jednego do czterech takich bloków. " +
$"Proszę zastąpić cały blok '{replacement}' w tekście. " +
"Nie potrzebuję żadnych Twoich komentarzy. " +
"Zwróć jako wynik tylko tekst z zamienionymi wpisami lub po prostu słowo 'none', jeśli nie było nic do zastąpienia " +
$"Oto tekst do przetworzenia \n\n {text}";
// Kod integracji AI użytkownika, który zależy od używanego narzędzia AI
return await RequestToAI(prompt);
}
Wynik powyższego kodu jest następujący:

Podsumowanie
W tym artykule dowiedzieliśmy się, jak stosować niestandardowe redakcje i integracje AI do przetwarzania dokumentów PDF. Narzędzia AI mogą znacznie uprościć przetwarzanie tekstu, ale mogą zająć więcej czasu i być mniej przewidywalne w porównaniu do standardowych narzędzi.
Aby uzyskać więcej informacji o naszym produkcie, odwiedź naszą dokumentację. Jeśli masz jakieś pytania, zapraszamy do kontaktu za pośrednictwem forum.
Wypróbuj naszą darmową aplikację internetową
Przyjrzyj się możliwościom GroupDocs.Redaction korzystając z naszej internetowej aplikacji. Przetestuj podstawowe funkcje bezpośrednio w przeglądarce bez instalowania czegokolwiek.