Что нового в этом выпуске
- [Improvement] Добавлена поддержка китайского и японского языков при использовании OCR (PARSERNET‑2833)
- В пространстве имён
GroupDocs.Parser.Optionsвведён новый классLanguages. GroupDocs.Parser.Options.OcrOptionsтеперь включает свойствоLanguages Languages, позволяющее указать набор языков OCR.
- В пространстве имён
Эти обновления позволяют выполнять распознавание текста в документах, содержащих китайские или японские символы, напрямую через API парсера.
Пример использования
// Create an instance of Parser class
using (Parser parser = new Parser(documentPath))
{
OcrOptions ocrOptions = new OcrOptions()
{
Language = Language.Jpn // Set OCR language to Japanese
};
TextOptions options = new TextOptions(false, true, ocrOptions);
TextReader result = parser.GetText(options);
string text = result.ReadToEnd();
Console.WriteLine(text);
}
Тот же подход работает для китайского, задав Language = Language.Chn (или соответствующее значение перечисления, определённое в Languages).
Исправления и улучшения
В выпуске 26.2 нет исправлений ошибок или дополнительных улучшений.
Как получить обновление
-
NuGet – Обновите до последней GroupDocs.Parser версии через NuGet:
Install-Package GroupDocs.Parser -Version 26.2(или
dotnet add package GroupDocs.Parser --version 26.2для .NET CLI) -
Direct Download – Скачайте сборки для .NET со страницы GroupDocs.Parser for .NET 26.2 на сайте релизов GroupDocs.