Mengganti teks dalam dokumen bisnis adalah tugas yang umum. Artikel ini menjelaskan cara menemukan dan mengganti konten dalam dokumen PDF menggunakan AI dan C#. Anda akan belajar cara menerapkan redaksi kustom dan mengintegrasikan AI untuk memodifikasi konten PDF.
Topik-topik berikut dibahas dalam artikel ini:
- Cara biasa untuk mengganti teks
- Langkah-langkah untuk meredaksi PDF menggunakan alat AI via C#
- Kode C# umum untuk menggunakan fungsi GroupDocs.Redaction
- Kode redaksi kustom C#
- Contoh prompt AI
Fitur GroupDocs.Redaction untuk Mengganti Teks
GroupDocs.Redaction memungkinkan Anda untuk mengganti teks dalam berbagai format file yang didukung. Metode ini bergantung pada ekspresi reguler untuk mengidentifikasi teks yang perlu diganti. Namun, bekerja dengan ekspresi reguler dapat memerlukan upaya tambahan, terutama dalam skenario yang lebih kompleks. Untuk informasi lebih lanjut, lihat dokumentasi kami.
Langkah-langkah untuk meredaksi PDF menggunakan alat AI via C#
Anda dapat menggunakan fitur ini untuk menyembunyikan informasi sensitif atau untuk menghasilkan dokumen yang disesuaikan dari template. Langkah-langkah berikut menunjukkan cara menggunakan AI untuk mengganti teks tertentu dalam dokumen PDF dalam aplikasi .NET.
- Muat file PDF menggunakan kelas Redactor.
- Beri penangan redaksi kustom dengan menerapkan logika AI Anda melalui antarmuka ICustomRedactionHandler.
- Proses teks dokumen, menggunakan PageAreaRedaction bersama dengan ReplacementOptions.
- Terapkan redaksi menggunakan metode Apply().
- Simpan dokumen yang diproses ke lokasi baru menggunakan metode Save().
Kode C# umum untuk menggunakan fungsi GroupDocs.Redaction
Kode berikut menggunakan AI untuk menemukan dan mengganti nomor kartu kredit dalam dokumen. Cuplikan kode ini mencakup metode utama yang menginisialisasi Redactor dan menerapkan redaksi dengan memanggil metode Apply().
public async Task Redaction_Custom_AI()
{
// Biasanya, regex ini digunakan untuk menemukan teks untuk penggantian
// Untuk menyediakan semua teks yang mungkin untuk redaksi kustom, gunakan regex seperti di contoh
Regex regex = new Regex(".*");
//Tentukan halaman target dan teks pengganti untuk redaksi
ReplacementOptions optionsText = new ReplacementOptions("[replaced]");
optionsText.Filters = new RedactionFilter[] {
new PageRangeFilter(PageSeekOrigin.Begin, 0, 2)
};
//Beri penangan redaksi kustom
optionsText.CustomRedaction = new TextRedactor() { Test = this };
var textRedaction = new PageAreaRedaction(regex, optionsText);
var redactions = new Redaction[] { textRedaction };
//Proses dokumen
using (var redactor = new Redactor("source.pdf"))
{
//Terapkan redaksi pada dokumen
RedactorChangeLog result = redactor.Apply(redactions);
if (result.Status != RedactionStatus.Failed)
{
redactor.Save(new GroupDocs.Redaction.Options.SaveOptions(false, "Result"));
}
}
}
Kode redaksi kustom C#
Implementasi ICustomRedactionHandler memungkinkan pengguna untuk mendefinisikan logika mereka sendiri untuk meredaksi paragraf teks dalam file PDF. Menggunakan kelas semacam itu memungkinkan algoritme yang fleksibel yang disesuaikan dengan kebutuhan bisnis tertentu.
public class TextRedactor : ICustomRedactionHandler
{
public Redaction_Custom Test { get; set; }
public CustomRedactionResult Redact(CustomRedactionContext context)
{
CustomRedactionResult result = new CustomRedactionResult();
if (!String.IsNullOrEmpty(context.Text))
{
var response = Process_AI(context.Text, "[redacted-custom]").GetAwaiter().GetResult();
if (response.Result != "none")
{
result.Apply = true;
result.Text = response.Result;
}
}
return result;
}
}
Contoh prompt AI
Bagian terakhir adalah kode integrasi AI. Prompt yang diberikan cukup canggih, karena tidak semua alat AI dapat memproses data sensitif, seperti nomor kartu kredit.
public async Task<OpenAIResult> Process_AI(string text, string replacement)
{
string prompt =
"Hai, saya punya sepotong dokumen di sini. " +
"Bisakah Anda membantu saya menukar bagian-bagian yang terlihat seperti blok digital, seperti 'XXXX-'? " +
"Blok ini hanyalah angka dan tanda hubung. " +
"Setiap entri yang ingin saya ganti mungkin memiliki dari satu hingga empat blok ini. " +
$"Silakan ganti seluruh blok dengan '{replacement}' dalam teks. " +
"Saya tidak perlu komentar Anda. " +
"Kembalikan sebagai hasil hanya teks dengan entri yang diganti atau hanya kata 'none' jika tidak ada yang perlu diganti " +
$"Berikut adalah teks untuk diproses \n\n {text}";
// Kode integrasi AI pengguna, yang tergantung pada alat AI yang digunakan
return await RequestToAI(prompt);
}
Output dari kode di atas adalah sebagai berikut:
Kesimpulan
Dalam artikel ini, kita belajar cara menggunakan redaksi kustom dan integrasi AI untuk memproses PDF. Alat AI dapat sangat menyederhanakan pemrosesan teks tetapi mungkin memerlukan lebih banyak waktu dan kurang dapat diprediksi dibandingkan dengan alat biasa.
Untuk informasi lebih lanjut tentang produk kami, kunjungi dokumentasi. Jika Anda memiliki pertanyaan, jangan ragu untuk menghubungi kami melalui forum.
Coba aplikasi web gratis kami
Jelajahi kemampuan GroupDocs.Redaction menggunakan aplikasi web online kami. Uji fitur inti langsung di browser Anda tanpa menginstal apa pun.