החלפת טקסט במסמכי עסקים היא משימה נפוצה. מאמר זה מסביר כיצד למצוא ולהחליף תוכן במסמכי PDF באמצעות בינה מלאכותית ו-C#. תלמד כיצד להחיל מחיקות מותאמות אישית ולשלב בינה מלאכותית כדי לשנות תוכן PDF.
הנושאים הבאים נידונים במאמר זה:
- דרך רגילה להחליף טקסט
- צעדים למחיקת PDF באמצעות כלי AI דרך C#
- קוד C# כלליא להשתמש בפונקציונליות של GroupDocs.Redaction
- קוד מחיקה מותאם אישית ב-C#
- דוגמה להנחיה של AI
תכונת GroupDocs.Redaction להחלפת טקסט
GroupDocs.Redaction מאפשרת לך להחליף טקסט במגוון פורמטי קבצים נתמכים. שיטה זו מתבססת על ביטויים רגולריים כדי לזהות את הטקסט שצריך להחליף. עם זאת, עבודה עם ביטויים רגולריים עשויה לדרוש מאמץ נוסף, במיוחד במקרים מורכבים יותר. למידע נוסף, עיין בתיעוד שלנו.
צעדים למחיקת PDF באמצעות כלי AI דרך C#
אתה יכול להשתמש בתכונה זו כדי להסתיר מידע רגיש או לייצר מסמך מותאם אישית מתוך תבנית. הצעדים הבאים מראים כיצד להשתמש בבינה מלאכותית כדי להחליף טקסט ספציפי במסמך PDF בתוך יישום .NET.
- טען את קובץ ה-PDF באמצעות מחלקת הRedactor.
- ספק מנגנון מחיקה מותאם אישית על ידי יישום הלוגיקה של הבינה המלאכותית שלך דרך ממשק הICustomRedactionHandler.
- עבד את הטקסט במסמך, באמצעות PageAreaRedaction יחד עם ReplacementOptions.
- החל את המחיקה באמצעות המתודולוגיה Apply().
- שמור את המסמך שעובד למיקום חדש באמצעות המתודולוגיה Save().
קוד C# כלליא להשתמש בפונקציונליות של GroupDocs.Redaction
הקוד הבא משתמש בבינה מלאכותית כדי למצוא ולהחליף מספרי כרטיס אשראי במסמך. צניף הקוד הזה כולל את המתודה הראשית שמאתחלת את ה-Redactor ומיישמת מחיקות על ידי קריאה למתודולוגיה Apply().
public async Task Redaction_Custom_AI()
{
    // בדרך כלל, הביטוי הרגולרי הזה משמש כדי למצוא טקסט להחלפה
    // כדי לספק את כל הטקסט האפשרי למחיקה מותאמת, השתמש בביטוי רגולרי כמו בדוגמה
    Regex regex = new Regex(".*");
    //הגדרת דפי יעד וטקסט החלפה עבור מחיקות
    ReplacementOptions optionsText = new ReplacementOptions("[replaced]");
        optionsText.Filters = new RedactionFilter[] {
        new PageRangeFilter(PageSeekOrigin.Begin, 0, 2)
    };
    //ספק מימוש מנגנון מחיקה מותאם אישית
    optionsText.CustomRedaction = new TextRedactor() { Test = this };
    var textRedaction = new PageAreaRedaction(regex, optionsText);
    var redactions = new Redaction[] { textRedaction };
    //עבד את המסמך
    using (var redactor = new Redactor("source.pdf"))
    {
        //החל מחיקות על המסמך
        RedactorChangeLog result = redactor.Apply(redactions);
        if (result.Status != RedactionStatus.Failed)
        {
            redactor.Save(new GroupDocs.Redaction.Options.SaveOptions(false, "Result"));
        }
    }
}
קוד מחיקה מותאם אישית ב-C#
יישום ICustomRedactionHandler מאפשר למשתמשים להגדיר את הלוגיקה שלהם עבור מחיקת פסקאות טקסט במסמכי PDF. השימוש במחלקות כאלה מאפשר אלגוריתמים גמישים המותאמים לצרכים עסקיים ספציפיים.
public class TextRedactor : ICustomRedactionHandler
{
    public Redaction_Custom Test { get; set; }
    public CustomRedactionResult Redact(CustomRedactionContext context)
    {
        CustomRedactionResult result = new CustomRedactionResult();
        if (!String.IsNullOrEmpty(context.Text))
        {
            var response = Process_AI(context.Text, "[redacted-custom]").GetAwaiter().GetResult();
            if (response.Result != "none")
            {
                result.Apply = true;
                result.Text = response.Result;
            }
        }
        return result;
    }
}
דוגמה להנחיה של AI
החלק הסופי הוא קוד שילוב ה-AI. ההנחיה המסופקת היא די מתוחכמת, מכיוון שלא כל כלי הבינה המלאכותית יכולים לעבד נתונים רגישים, כגון מספרי כרטיסי אשראי.
public async Task<OpenAIResult> Process_AI(string text, string replacement)
{
    string prompt =
        "היי, יש לי כאן קטע של מסמך. " +
        "יכול לעזור לי להחליף כל חלק שנראה כמו בלוקים דיגיטליים, כגון 'XXXX-'? " +
        "הבלוקים האלה הם רק מספרים ומקפים. " +
        "כל כניסה שאני רוצה להחליף עשויה להכיל בין בלוק אחד לארבעה. " +
        $"אנא החלף את כל הבלוק עם '{replacement}' בטקסט. " +
        "אני לא צריך שום הערות שלך. " +
        "החזר כתוצאה רק טקסט עם הכניסות המוחלפות או פשוט את המילה 'none' אם לא היה מה להחליף " +
        $"הנה הטקסט לעבוד עליו \n\n {text}";
    // קוד שילוב AI של המשתמש, התלוי בכלי ה-AI שבו משתמשים
    return await RequestToAI(prompt);
}
תוצאת הקוד לעיל היא כדלקמן:
 
 
מסקנה
במאמר זה למדנו כיצד להשתמש במחיקות מותאמות אישית ושילובי בינה מלאכותית כדי לעבד PDF. כלים בינה מלאכותית יכולים לפשט מאוד את עיבוד הטקסט אך עשויים לדרוש יותר זמן ולהיות פחות צפויים בהשוואה לכלים רגילים.
לפרטים נוספים על המוצר שלנו, בקר בתיעוד. אם יש לך שאלות, אל תהסס לפנות אלינו דרך הפורום.
נסה את האפליקציה האינטרנטית שלנו בחינם
גלוש ביכולות של GroupDocs.Redaction באמצעות היישום האינטרנטי שלנו. נסה את הפונקציות המרכזיות ישירות בדפדפן שלך מבלי להתקין דבר.