此版本的新功能
- [Improvement] 為使用 OCR 時新增對中文和日文語言的支援 (PARSERNET‑2833)
- 在
GroupDocs.Parser.Options命名空間中新增了Languages類別。 GroupDocs.Parser.Options.OcrOptions現在包含Languages Languages屬性,可讓您指定 OCR 語言集合。
- 在
這些更新讓您能夠直接透過解析器 API 對包含中文或日文字符的文件執行文字辨識。
使用範例
// Create an instance of Parser class
using (Parser parser = new Parser(documentPath))
{
OcrOptions ocrOptions = new OcrOptions()
{
Language = Language.Jpn // Set OCR language to Japanese
};
TextOptions options = new TextOptions(false, true, ocrOptions);
TextReader result = parser.GetText(options);
string text = result.ReadToEnd();
Console.WriteLine(text);
}
相同的方法可用於中文,只需將 Language = Language.Chn(或在 Languages 中定義的相應列舉值)設定即可。
修復與增強
此 26.2 版未包含任何錯誤修復或其他增強功能。
如何取得更新
-
NuGet – 透過 NuGet 升級至最新的 GroupDocs.Parser 套件:
Install-Package GroupDocs.Parser -Version 26.2(or
dotnet add package GroupDocs.Parser --version 26.2for .NET CLI) -
Direct Download – 從 GroupDocs 釋出網站的 GroupDocs.Parser for .NET 26.2 頁面下載 .NET 組件。