Nous sommes heureux d’annoncer la version GroupDocs.Parser for .NET 25.10, disponible depuis octobre 2025. Cette mise à jour apporte une nouvelle fonction d’extraction de tableaux, plusieurs améliorations de l’API et une correction critique de la pagination PDF.

Nouveautés de cette version

📄 Extraire des tableaux depuis n’importe quelle page (PARSERNET‑2745)

Ajout de deux surcharges à GroupDocs.Parser.Parser qui vous permettent d’extraire directement les structures de tableaux d’un document, sans nécessiter de modèle.

  • IEnumerable<PageTableArea> GetTables() – extrait les tableaux du document entier.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – extrait les tableaux d’une page spécifique.

Note : PageTableArea représente une région de tableau détectée avec ses cellules, la référence de la page et le rectangle englobant.

Exemple – Obtenir les tableaux d’une page unique

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // première page (indice zéro)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // itérer sur les tableaux
    foreach (var table in tables)
    {
        // travailler avec table.Cells, table.Page, etc.
    }
}

🔧 Refonte de l’API – constructeur interne PageTableArea (PARSERNET‑2743)

Le constructeur public de GroupDocs.Parser.Data.PageTableArea a été supprimé et est maintenant interne. Les instances de cette classe sont créées exclusivement par le moteur du Parser, évitant ainsi tout usage accidentel. Il s’agit d’un changement rétro‑compatible pour quiconque créait directement un PageTableArea.

🐞 Correction – Analyse PDF limitée aux 4 premières pages (PARSERNET‑1871)

Le parser traite désormais correctement toutes les pages d’un document PDF. Auparavant, seules les quatre premières pages étaient renvoyées lors de l’appel à l’API d’analyse.

Comment obtenir la mise à jour

Ressources