14 nov 2023

GeoParquet 1.0.0 nuevo formato de datos espaciales


GeoParquet 1.0.0 es un nuevo formato que posibilita un acceso más eficiente a los datos espaciales. Entre otras novedades, establece una serie de estándares para varios aspectos clave en la representación de este tipo de datos. Uno de ellos, es que, al igual que su predecesor Apache Parquet, es un formato de datos orientado a columnas; se permite tener múltiples columnas que contengan datos espaciales (punto, línea y polígono), con la designación de una columna como principal. Otro aspecto destacable se refiere a la forma de codificar la información de geometría o geografía, utilizando una codificación binaria conocida y un texto conocido (WKT).

Este formato también permite una especificación del sistema de referencia espacial compatible con varios sistemas de coordenadas, proporciona información sobre la geometría y naturaleza de las coordenadas utilizadas, e incluye metadatos a dos niveles, los correspondientes al archivo y los de columna, con características adicionales para cada geometría: sistema de referencia espacial, tipo de geometría, resolución de geometría, etc.

Geoparque está comprimido de forma predeterminada, lo que le hace ser más rápido y ligero que otros formatos más extendidos. Esto, junto al hecho de establecer una forma común de codificar y describir datos espaciales, le confiere una significativa ventaja para la creación y el intercambio de datos en la nube, y para el intercambio de datos entre sistemas, sin necesidad de transformaciones intermedias.


Por todo ello, el formato Geoparque está ganando terreno entre las herramientas modernas de gestión de datos como BigQuery, DuckDB, R, Python, GeoPandas, GDAL, etc., que ya utilizaban Parquet de forma eficaz y van incorporando cada vez más capacidades de soporte geoespacial. También, dentro del ecosistema SIG: ArcGIS, FME y QGIS (a partir de la versión 3.28), ya se cuenta con soporte para este formato. Definitivamente, GeoParquet ha supuesto un gran avance para la analítica espacial como muestra la gran acogida que ha tenido por parte de las empresas del sector como Carto, Google BigQuery, Planet, entre otras. Además un nuevo Grupo de Trabajo de OGC de Estándares GeoParquet, está trabajando en promover la adopción de este formato como un estándar de codificación OGC para datos vectoriales nativos en la nube.

La versión 1.0.0, que apareció en agosto de 2023, ya navega hacia el futuro: soporte para coordenadas 3D, partición de datos espaciales que permita la carga de manera eficiente desde el lago de datos, codificación de datos espaciales mediante GeoArrow, índices que agilicen el rendimiento... estas son algunas de las mejoras que se anuncian para la versión 2.0.0. Estaremos atentos.

Publicado por la editora.

No hay comentarios: