本次发行的新功能
- [改进] 在使用 OCR 时添加对中文和日文的支持 (PARSERNET‑2833)
- 在
GroupDocs.Parser.Options命名空间中引入了新的Languages类。 GroupDocs.Parser.Options.OcrOptions现在包含一个Languages Languages属性,用于指定 OCR 语言集。
- 在
这些更新使您能够直接通过解析器 API 对包含中文或日文字符的文档进行文字识别。
使用示例
// Create an instance of Parser class
using (Parser parser = new Parser(documentPath))
{
OcrOptions ocrOptions = new OcrOptions()
{
Language = Language.Jpn // Set OCR language to Japanese
};
TextOptions options = new TextOptions(false, true, ocrOptions);
TextReader result = parser.GetText(options);
string text = result.ReadToEnd();
Console.WriteLine(text);
}
相同的做法也适用于中文,只需将 Language = Language.Chn(或 Languages 中定义的相应枚举值)设置即可。
修复和增强
本次 26.2 版本未包含 bug 修复或其他增强。
如何获取更新
-
NuGet – 通过 NuGet 将 GroupDocs.Parser 包升级到最新版本:
Install-Package GroupDocs.Parser -Version 26.2(或使用 .NET CLI:
dotnet add package GroupDocs.Parser --version 26.2) -
直接下载 – 在 GroupDocs 发布站点的 GroupDocs.Parser for .NET 26.2 页面下载 .NET 程序集。