We’re happy to announce the GroupDocs.Parser for .NET 25.10 release, available as of October 2025. This update brings a new table‑extraction capability, several API refinements, and a critical fix for PDF pagination.

Co je nového v tomto vydání

📄 Extrahování tabulek z libovolné stránky (PARSERNET‑2745)

Přidány dvě přetížení třídy GroupDocs.Parser.Parser, která umožňují získat strukturu tabulek přímo z dokumentu, aniž byste potřebovali šablonu.

  • IEnumerable<PageTableArea> GetTables() – extrahuje tabulky z celého dokumentu.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – extrahuje tabulky z konkrétní stránky.

Poznámka: PageTableArea představuje detekovanou oblast tabulky spolu s jejími buňkami, odkazem na stránku a ohraničujícím obdélníkem.

Příklad – Získání tabulek z jedné stránky

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // první stránka (nulová indexace)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iterace přes tabulky
    foreach (var table in tables)
    {
        // práce s table.Cells, table.Page, atd.
    }
}

🔧 Předesign API – interní konstruktor PageTableArea (PARSERNET‑2743)

Veřejný konstruktor třídy GroupDocs.Parser.Data.PageTableArea byl odstraněn a nyní je interní. Instance této třídy jsou vytvářeny výhradně enginem Parseru, čímž se zabraňuje náhodnému nesprávnému použití. Jedná se o zpětně nekompatibilní změnu pro všechny, kdo vytvářeli PageTableArea přímo.

🐞 Oprava – parsování PDF omezené na první 4 stránky (PARSERNET‑1871)

Parser nyní správně zpracovává všechny stránky PDF dokumentu. Dříve byly při volání API pro parsování vráceny pouze první čtyři stránky.

Jak získat aktualizaci

Zdroje