Nos complace anunciar la versión GroupDocs.Parser for .NET 25.10, disponible a partir de octubre de 2025. Esta actualización trae una nueva capacidad de extracción de tablas, varias mejoras de la API y una corrección crítica para la paginación de PDF.

Novedades en esta versión

📄 Extraer tablas de cualquier página (PARSERNET‑2745)

Se añadieron dos sobrecargas a GroupDocs.Parser.Parser que le permiten obtener estructuras de tabla directamente de un documento, sin necesidad de una plantilla.

  • IEnumerable<PageTableArea> GetTables() – extrae tablas de todo el documento.
  • IEnumerable<PageTableArea> GetTables(int pageIndex) – extrae tablas de una página específica.

Nota: PageTableArea representa una región de tabla detectada junto con sus celdas, referencia de página y rectángulo delimitador.

Ejemplo – Obtener tablas de una sola página

using (Parser parser = new Parser(filePath))
{
    int pageIndex = 0;               // primera página (indexado desde cero)
    IEnumerable<PageTableArea> tables = parser.GetTables(pageIndex);

    // iterar sobre las tablas
    foreach (var table in tables)
    {
        // trabajar con table.Cells, table.Page, etc.
    }
}

🔧 Rediseño de la API – constructor interno de PageTableArea (PARSERNET‑2743)

El constructor público de GroupDocs.Parser.Data.PageTableArea se ha eliminado y ahora es interno. Las instancias de esta clase son creadas exclusivamente por el motor del Parser, evitando un uso accidental incorrecto. Este es un cambio incompatibile hacia atrás para quien instanciara PageTableArea directamente.

🐞 Corrección – Análisis de PDF limitado a las primeras 4 páginas (PARSERNET‑1871)

El parser ahora procesa correctamente todas las páginas de un documento PDF. Anteriormente, solo se devolvían las primeras cuatro páginas al llamar a la API de análisis.

Cómo obtener la actualización

Recursos