Ми раді повідомити про випуск GroupDocs.Parser for .NET 25.10, доступний з жовтня 2025 року. Це оновлення додає нову можливість витягування таблиць, декілька удосконалень API та критичне виправлення пагінації PDF.

Що нового у цьому випуску

📄 Витягувати таблиці з будь‑якої сторінки (PARSERNET‑2745)

Додано два перегружені методи до GroupDocs.Parser.Parser, які дозволяють отримувати структуру таблиць безпосередньо з документа, без потреби у шаблоні.

  • IEnumerable<PageTableArea> GetTables() – витягує таблиці з усього документа.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – витягує таблиці з конкретної сторінки.

Примітка: PageTableArea представляє виявлену область таблиці разом з її клітинами, посиланням на сторінку та обмежуючим прямокутником.

Приклад – Отримання таблиць з однієї сторінки

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // first page (zero‑based)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iterate over tables
    foreach (var table in tables)
    {
        // work with table.Cells, table.Page, etc.
    }
}

🔧 Переробка API – внутрішній конструктор PageTableArea (PARSERNET‑2743)

Публічний конструктор GroupDocs.Parser.Data.PageTableArea був видалений і тепер є внутрішнім. Екземпляри цього класу створюються виключно движком Parser, запобігаючи випадковому неправильному використанню. Це несумісна назад зміна для тих, хто створював PageTableArea безпосередньо.

🐞 Виправлення – парсинг PDF обмежувався першими 4 сторінками (PARSERNET‑1871)

Тепер парсер правильно обробляє всі сторінки PDF‑документа. Раніше при виклику API парсингу поверталися лише перші чотири сторінки.

Як отримати оновлення

Ресурси