此版本的新功能

  • [Improvement] 為使用 OCR 時新增對中文和日文語言的支援 (PARSERNET‑2833)
    • GroupDocs.Parser.Options 命名空間中新增了 Languages 類別。
    • GroupDocs.Parser.Options.OcrOptions 現在包含 Languages Languages 屬性,可讓您指定 OCR 語言集合。

這些更新讓您能夠直接透過解析器 API 對包含中文或日文字符的文件執行文字辨識。

使用範例

// Create an instance of Parser class
using (Parser parser = new Parser(documentPath))
{
    OcrOptions ocrOptions = new OcrOptions()
    {
        Language = Language.Jpn   // Set OCR language to Japanese
    };
    TextOptions options = new TextOptions(false, true, ocrOptions);
    TextReader result = parser.GetText(options);
    string text = result.ReadToEnd();
    Console.WriteLine(text);
}

相同的方法可用於中文,只需將 Language = Language.Chn(或在 Languages 中定義的相應列舉值)設定即可。

修復與增強

此 26.2 版未包含任何錯誤修復或其他增強功能。

如何取得更新

  • NuGet – 透過 NuGet 升級至最新的 GroupDocs.Parser 套件:

    Install-Package GroupDocs.Parser -Version 26.2
    

    (or dotnet add package GroupDocs.Parser --version 26.2 for .NET CLI)

  • Direct Download – 從 GroupDocs 釋出網站的 GroupDocs.Parser for .NET 26.2 頁面下載 .NET 組件。

資源