21 dic. 2017

Los PID y el ciclo de vida

Hace algún tiempo publicamos una entrada sobre un esquema general para definir Identificadores Persistentes (PID) de objetos geográficos tal y como están establecidos en el marco INSPIRE. En la Conferencia INSPIRE 2017 se presentó una comunicación sobre ese tema y en las JIIDE 2017, otra. Ya tenemos un esquema técnico bien definido en el que el PID de un objeto tendría la forma de una URl formada del siguiente modo:

https://datos.idee.es/recurso/{namespace}/{localId}[/{versionId}]

Perfecto. Pero, además de tener una organización que vele por todo el sistema, hace falta que cada uno de los productores de datos integrados en el sistema, gestione sus identificadores locales (localId) como identificadores persistentes a largo plazo (100 años y más), es decir:
  • No se deben modificar
  • Cuando desaparece un objeto, no se debe reutilizar su PID
Y eso nos lleva a otro problema ¿cuándo desaparece un objeto geográfico?¿cuándo muere? o dicho de otra manera ¿cuándo un cambio de sus atributos significa simplemente que el objeto se ha modificado, pero sigue siendo el mismo y se debe mantener su PID, y cuándo , el cambo es tan profundo y esencial que el objeto resultante es un objeto nuevo que merece un nuevo PID? En el segundo caso habrá que almacenar en algún fichero la relación entre el objeto-sucesor y el objeto-antecesor, pero eso no es complicado.
              
Prometimos una entrada sobre la cuestión y vamos a intentar aportar algo sobre un punto tan peliagudo. Porque lo difícil es decidir cuándo muere un objeto geográfico. Un indicio significativo es que en principio, cuando cambia el objeto, normalmente cambia su nombre; llamamos de manera diferente a lo que distinto. Cuando cambia el trazado de una carretera, por ejemplo, por que se suprime alguna curva peligrosa, se sigue diciendo que es la misma carretera. Pero si se cambia el razado, el firme, el nombre y la categoría, porque se traza una autovía por encima de la antigua carretera nacional, parece claro que el objeto es otro y merece un nuevo nombre y un nuevo PID.
                     
Puede ser útil para intentar llegar a establecer criterios generales, clasificar los objetos geográficos en función de quién o qué los define:
                 
- Objetos naturales, como ríos, montañas, lagos, bosques, cordilleras, accidentes orográficos y costeros. En el caso de objetos sólidos, parece que no cambian si no cambia su posición, es decir si no se destruyen físicamente. Los lagos, lagunas, albuferas y similares desaparecen cuando se secan (son repositorios de agua) y con los ríos pasa lo mismo (son corrientes de agua), pueden varias todos sus atributos, pero no mueren a menos que se sequen.
              
- Objetos artificiales, construidos o levantados por el ser humano, como edificios, puentes, torres, túneles, diques y todo tipo de construcciones. Parece que mueren cuando se reconstruyen o se derriban.
                
- Objetos culturales, definidos por el ser humano pero que no tienen realidad física, como líneas límite, parcelas. Su existencia está reglada por normas y está establecido. Una parcela muere cuando cambia su superficie, una línea límite, cuando se modifica su trazado, un municipio, cuando desaparece.
       
Otro problema es el de los espacios de nombres. Parece que debe haber uno por cada producto de datos, entonces ¿cuándo muere un producto de datos? Habría que decidir entre atributos esenciales (si se modifican, cambia el producto) y contingentes. De los ítems que describen un producto de acuerdo a la norma ISO 19131 de especificaciones: Nombre, tipo de producto (vectorial, ráster, taba alfanumérica, MDT, lídar...), resolución, extensión, catálogo de objetos, esquema UML, CRS, calidad, formas de distribución, metadatos, captura y tratamiento, representación y mantenimiento ¿Cuáles son esenciales?
                
Si un producto de datos es un modelo del mundo real, cambiará el producto cuando cambia el modelo, es decir quizás cuando se modifican el tipo de producto, la resolución, el catálogo de objetos (si se modifican los objetos o las relaciones entre ellos) y el esquema UML (cuando se modifican los objetos o las relaciones entre ellos, no tan solo los atributos).

No sé, no estoy seguro del todo de lo dicho, pero creo que hay que pensar sobre ello y llegar a criterios uniformes y homogéneos.

Salud e interoperabilidad.

Publicado Por Antonio F. Rodríguez. 

No hay comentarios: