本次发行的新功能

  • [改进] 在使用 OCR 时添加对中文和日文的支持 (PARSERNET‑2833)
    • GroupDocs.Parser.Options 命名空间中引入了新的 Languages 类。
    • GroupDocs.Parser.Options.OcrOptions 现在包含一个 Languages Languages 属性,用于指定 OCR 语言集。

这些更新使您能够直接通过解析器 API 对包含中文或日文字符的文档进行文字识别。

使用示例

// Create an instance of Parser class
using (Parser parser = new Parser(documentPath))
{
    OcrOptions ocrOptions = new OcrOptions()
    {
        Language = Language.Jpn   // Set OCR language to Japanese
    };
    TextOptions options = new TextOptions(false, true, ocrOptions);
    TextReader result = parser.GetText(options);
    string text = result.ReadToEnd();
    Console.WriteLine(text);
}

相同的做法也适用于中文,只需将 Language = Language.Chn(或 Languages 中定义的相应枚举值)设置即可。

修复和增强

本次 26.2 版本未包含 bug 修复或其他增强。

如何获取更新

  • NuGet – 通过 NuGet 将 GroupDocs.Parser 包升级到最新版本:

    Install-Package GroupDocs.Parser -Version 26.2
    

    (或使用 .NET CLI:dotnet add package GroupDocs.Parser --version 26.2

  • 直接下载 – 在 GroupDocs 发布站点的 GroupDocs.Parser for .NET 26.2 页面下载 .NET 程序集。

资源