การแทนที่ข้อความในเอกสารทางธุรกิจนั้นเป็นงานที่พบได้บ่อย บทความนี้อธิบาย วิธีการค้นหาและแทนที่เนื้อหาในเอกสาร PDF โดยใช้ AI และ C# คุณจะได้เรียนรู้วิธีการใช้การลบข้อมูลแบบกำหนดเองและบูรณาการ AI เพื่อปรับปรุงเนื้อหา PDF
หัวข้อดังต่อไปนี้ถูกรวมอยู่ในบทความนี้:
- วิธีปกติในการแทนที่ข้อความ
- ขั้นตอนการลบ PDF โดยใช้เครื่องมือ AI ผ่าน C#
- โค้ด C# ที่ใช้ฟังก์ชัน GroupDocs.Redaction
- โค้ด C# สำหรับการลบข้อมูลแบบกำหนดเอง
- ตัวอย่างคำสั่ง AI
ฟีเจอร์ GroupDocs.Redaction สำหรับการแทนที่ข้อความ
GroupDocs.Redaction ช่วยให้คุณสามารถแทนที่ข้อความในรูปแบบไฟล์ที่รองรับได้หลายรูปแบบ วิธีนี้อิงจากการใช้ Regular expression เพื่อระบุข้อความที่จำเป็นต้องแทนที่ อย่างไรก็ตาม การทำงานกับ Regular expression อาจต้องการความพยายามเพิ่มเติม โดยเฉพาะในสถานการณ์ที่ซับซ้อนมากขึ้น สำหรับข้อมูลเพิ่มเติม โปรดดูที่ เอกสารของเรา.
ขั้นตอนการลบ PDF โดยใช้เครื่องมือ AI ผ่าน C#
คุณสามารถใช้ฟีเจอร์นี้เพื่อซ่อนข้อมูลที่ละเอียดอ่อน หรือสร้างเอกสารที่กำหนดเองจากเทมเพลต ขั้นตอนด้านล่างจะแสดงวิธีใช้ AI เพื่อแทนที่ข้อความเฉพาะในเอกสาร PDF ภายในแอปพลิเคชัน .NET
- โหลด ไฟล์ PDF โดยใช้คลาส Redactor.
- จัดเตรียมตัวจัดการการลบข้อมูลแบบกำหนดเอง โดยการนำเสนอ logic AI ของคุณผ่านทางอินเตอร์เฟส ICustomRedactionHandler.
- ประมวลผลข้อความในเอกสาร โดยใช้ PageAreaRedaction ร่วมกับ ReplacementOptions.
- ใช้การลบข้อมูล โดยใช้เมธอด Apply().
- บันทึก เอกสารที่ประมวลผลไปยังตำแหน่งใหม่โดยใช้เมธอด Save().
โค้ด C# ที่ใช้ฟังก์ชัน GroupDocs.Redaction
โค้ดด้านล่างนี้ใช้ AI เพื่อค้นหาและแทนที่หมายเลขบัตรเครดิตในเอกสาร โค้ดนี้ประกอบด้วยเมธอดหลักที่เริ่มต้นการทำงานของ Redactor และใช้การลบข้อมูลโดยการเรียกใช้เมธอด Apply().
public async Task Redaction_Custom_AI()
{
    // ปกติแล้ว regex นี้ใช้เพื่อตรวจหาข้อความสำหรับการแทนที่
    // เพื่อมอบข้อความทั้งหมดที่เป็นไปได้สำหรับการลบข้อมูลแบบกำหนดเอง ใช้ regex เช่นในตัวอย่าง
    Regex regex = new Regex(".*");
    // กำหนดหน้าเป้าหมายและข้อความที่แทนที่สำหรับการลบข้อมูล
    ReplacementOptions optionsText = new ReplacementOptions("[replaced]");
        optionsText.Filters = new RedactionFilter[] {
        new PageRangeFilter(PageSeekOrigin.Begin, 0, 2)
    };
    // จัดเตรียมการดำเนินการของตัวจัดการการลบข้อมูลแบบกำหนดเอง
    optionsText.CustomRedaction = new TextRedactor() { Test = this };
    var textRedaction = new PageAreaRedaction(regex, optionsText);
    var redactions = new Redaction[] { textRedaction };
    // ประมวลผลเอกสาร
    using (var redactor = new Redactor("source.pdf"))
    {
        // ใช้การลบข้อมูลกับเอกสาร
        RedactorChangeLog result = redactor.Apply(redactions);
        if (result.Status != RedactionStatus.Failed)
        {
            redactor.Save(new GroupDocs.Redaction.Options.SaveOptions(false, "Result"));
        }
    }
}
โค้ด C# สำหรับการลบข้อมูลแบบกำหนดเอง
การนำเข้า ICustomRedactionHandler ช่วยให้ผู้ใช้สามารถกำหนด logic ของตนเองในการลบย่อหน้าข้อความในไฟล์ PDF การใช้คลาสดังกล่าวจะช่วยให้สามารถสร้างอัลกอริธึมที่ยืดหยุ่นซึ่งปรับแต่งตามความต้องการเฉพาะของธุรกิจ
public class TextRedactor : ICustomRedactionHandler
{
    public Redaction_Custom Test { get; set; }
    public CustomRedactionResult Redact(CustomRedactionContext context)
    {
        CustomRedactionResult result = new CustomRedactionResult();
        if (!String.IsNullOrEmpty(context.Text))
        {
            var response = Process_AI(context.Text, "[redacted-custom]").GetAwaiter().GetResult();
            if (response.Result != "none")
            {
                result.Apply = true;
                result.Text = response.Result;
            }
        }
        return result;
    }
}
ตัวอย่างคำสั่ง AI
ส่วนสุดท้ายคือโค้ดการบูรณาการ AI คำสั่งที่ให้มานั้นค่อนข้างซับซ้อน เนื่องจากไม่เครื่องมือ AI ทุกชนิดสามารถประมวลผลข้อมูลที่ละเอียดอ่อน เช่น หมายเลขบัตรเครดิต
public async Task<OpenAIResult> Process_AI(string text, string replacement)
{
    string prompt =
        "เฮ้ ฉันมีเอกสารชิ้นหนึ่งที่นี่ " +
        "คุณช่วยฉันแทนที่ส่วนที่ดูเหมือนกับบล็อกดิจิทัล เช่น 'XXXX-' ได้ไหม? " +
        "บล็อกเหล่านี้เป็นเพียงตัวเลขและขีดกลาง " +
        "แต่ละรายการที่ฉันต้องการแทนที่อาจมีบล็อกเหล่านี้ตั้งแต่หนึ่งถึงสี่บล็อก " +
        $"โปรดแทนที่บล็อกทั้งหมดด้วย '{replacement}' ในข้อความ " +
        "ฉันไม่ต้องการความคิดเห็นใด ๆ จากคุณ " +
        "ส่งคืนเฉพาะข้อความที่มีรายการที่แทนที่หรือแค่คำว่า 'none' หากไม่มีอะไรที่จะแทนที่ " +
        $"นี่คือข้อความที่จะทำงานด้วย \n\n {text}";
    // รหัสการบูรณาการ AI ของผู้ใช้ ซึ่งขึ้นอยู่กับเครื่องมือ AI ที่ใช้
    return await RequestToAI(prompt);
}
ผลลัพธ์ของโค้ดด้านบนมีดังนี้:
 
 
สรุป
ในบทความนี้ เราได้เรียนรู้วิธีการใช้การลบข้อมูลแบบกำหนดเองและการบูรณาการ AI เพื่อประมวลผล PDF เครื่องมือ AI สามารถทำให้การประมวลผลข้อความง่ายขึ้นมาก แต่บางครั้งอาจใช้เวลามากขึ้นและไม่คาดเดาได้เมื่อเปรียบเทียบกับเครื่องมือปกติ
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับผลิตภัณฑ์ของเรา โปรดไปที่ เอกสาร. หากคุณมีข้อสงสัย โปรดติดต่อเราผ่าน ฟอรั่ม.
ลองใช้แอปเว็บฟรีของเรา
สำรวจความสามารถของ GroupDocs.Redaction โดยใช้ แอปพลิเคชันเว็บออนไลน์. ทดสอบฟีเจอร์หลักได้โดยตรงในเบราว์เซอร์ของคุณโดยไม่ต้องติดตั้งอะไร