We’re happy to announce the GroupDocs.Parser for .NET 25.10 release, available as of 2025年10月. This update brings a new table‑extraction capability, several API refinements, and a critical fix for PDF pagination.

このリリースの新機能

📄 任意のページからテーブルを抽出 (PARSERNET‑2745)

GroupDocs.Parser.Parser に2つのオーバーロードが追加され、テンプレートを必要とせずにドキュメントからテーブル構造を直接取得できるようになりました。

  • IEnumerable<PageTableArea> GetTables() – ドキュメント全体からテーブルを抽出します。
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – 指定したページからテーブルを抽出します。

Note: PageTableArea は、検出されたテーブル領域とそのセル、ページ参照、バウンディング矩形を表します。

例 – 単一ページからテーブルを取得

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // first page (zero‑based)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iterate over tables
    foreach (var table in tables)
    {
        // work with table.Cells, table.Page, etc.
    }
}

🔧 APIの再設計 – 内部 PageTableArea コンストラクタ (PARSERNET‑2743)

GroupDocs.Parser.Data.PageTableArea の公開コンストラクタが削除され、内部 になりました。このクラスのインスタンスは Parser エンジンによってのみ生成され、誤用を防止します。PageTableArea を直接インスタンス化していた方にとっては後方互換性のない変更です。

🐞 修正 – PDF の解析が最初の4ページに限定されていた問題 (PARSERNET‑1871)

パーサーは現在、PDF ドキュメントのすべてのページを正しく処理します。以前は解析 API を呼び出すと最初の4ページだけが返されていました。

アップデートの取得方法

リソース