23 ago 2013

Más datos, menos infraestructura

Este artículo es una traducción de «One Man’s Public Comment: “More Data, Less Infrastructure”», por Brian Timoney, en el que comenta la situación de la IDE Nacional de los Estados Unidos.
Hagamos un ejercicio mental. Un compañero de la empresa, con toda su buena fe, y sabiendo que eres "el de los mapas", se te acerca y te pide algo aparentemente sencillo.
«¿Dónde puedo conseguir el fichero más actualizado de las fronteras entre estados de EEUU?»
Hay docenas de lugares en los que conseguir un fichero con esos datos - ¿pero el más actualizado? Como quieres seguir pareciendo todo un profesional, buscas disimuladamente en google "shapefile EEUU estados" y ves estas tres entradas:
  1. Un fichero de 163 kB de ESRI, sin fecha
  2. Un fichero de 23 MB de la NOAA, escala 1:2 millones, "Fecha válida: 2012", modificado por última vez en 2007.
  3. Dos opciones dentro del Atlas Nacional: un fichero de 6.8 MB a escala 1:2 millones con fecha de junio de 2005, y otro de 10.6 MB a 1:1 millón con fecha de julio de 2012.
Y esto es, en resumidas cuentas, un problema que debería resolver una IDE nacional, ¿no es cierto?
El FGDC (Comité Federal de Datos Geográficos) publicó recientemente un borrador del Plan Estratégico de la IDE Nacional, abierto a comentarios del público. Y a mí me dijeron que se supone que tengo una opinión al respecto. Así que como buen bloguero, interrumpí reluctante mi descanso veraniego para bajarme el PDF y echar un vistazo. Lo que me encontré fue una combinación del clásico lo-geográfico-es-importante y un texto de agencia de publicidad para una tecnología llamada la Plataforma Geoespacial. Cuando veo diez puntos sobre "El estado futuro deseable de la IDEE", me imagino si acabaremos en algún lugar más cerca de resolver nuestro problema de "las fronteras más actualizadas". Dado que el mal rendimiento del FGDC está documentado, me imagino que mi escepticismo es ampliamente compartido.

¿Infraestructura? Tenemos infraestructura por todos lados

Ya he cubierto en el pasado cómo estamos en una era de inversiones privadas sin precedentes en el paito de infraestructuras de datos espaciales (véase: Google, Apple, Microsoft). Así que cuando leo
«La Infraestructura Nacional de Datos Espaciales va más allá de los datos»
mi reacción es que no deberíamos ir a ningún sitio hasta que no tengamos bien los datos. Mis sospechas sobre la pérdida de miras se hacen mayores cuando leo que
«la iniciativa de Plataforma Geoespacial es un componente crítico para el desarrollo sostenido de la IDE nacional»
¿Y qué es esta Plataforma Geoespacial, exactamente?
«La Plataforma es un entorno de servicios basados en Web de primera generación que proporciona acceso a un conjunto de datos, servicios, aplicaciones y herramientas bien mantenido, de alta disponibilidad y confiabilidad, para su uso por parte de agencias Federales y sus socios Estatales, locales, tribales y regionales.»
Eso de ahí tiene que ser de una agencia de publicidad de las buenas. Lo que quiero decir es que el FGDC debería centrarse únicamente en los datos, y dejar las aplicaciones y herramientas a otros. No me importa pagar la factura del agua todos los meses, pero no necesito que me vendan también el lavabo.

Qué falta

Busca entre las palabras de la propuesta y adivina: ¿qué términos no aparecen?
motor de búsqueda
GitHub
El fracaso de la comunidad geoespacial para optimizar su contenido en buscadores es el porqué cuando buscas tu propia dirección en google, es más fácil encontrarte con una inmobiliaria que con, por ejemplo, los límites de parcelas de tu departamento de SIG local. Para los Profesionales Geoespaciales®, "autoritativo" significa detalle y precisión; para las personas normales, lo que es autoritativo es lo que sale en la primera página de Google cuando buscas algo. Una IDE que no tenga en cuenta este hecho es una de esas cosas Portal/Plataforma-céntrica cuyo destino es la irrelevancia. El paso más importante hacia una infraestructura de datos espaciales este año ha sido GitHub, al añadir soporte para visualizar datos en formato GeoJSON. Aunque originalmente era una plataforma para gestionar código de programación, GitHub ha evolucionado hacia una plataforma que también sirve para compartir los datos.

Una propuesta modesta

¿Qué pinta tiene un conjunto básico de ficheros geoespaciales mantenidos en GitHub? Pues se parece mucho al proyecto Natural Earth de Nathaniel Kelso (web GitHub). Kelso explica su motivación para el proyecto:
«En una época en la que la web está llena de datos geoespaciales, los cartógrafos se ven obligados a perder el tiempo desenredando marañas de datos pobremente atribuidos para poder hacer mapas limpios y legibles.»
Así que mi propuesta es: qué tal si cogemos el 5% del dinero de los contribuyentes que se supone que vamos a dar en mano a una consultora para hacer la Plataforma Geoespacial, y lo usamos para subir una versión de los datos que hay en Natural Earth, pero hecha por el gobierno estadounidense, y actualizada. Y de paso la subimos a GitHub también. De este modo, los usuarios pueden "bifurcar" y "observar" el repositorio, etc, asegurándose de que todo el mundo (el gobierno, sus ciudadanos, y el sector privado ocupado en crear herramientas/interfaces/servicios) trabaja con la versión mejor y más reciente de los datos más autoritativos. En otras palabras: ¿puede el FGDC replicar por una pequeñísima fracción del presupuesto de la IDE Nacional, el trabajo que Kelso y su grupo de voluntarios han hecho pro bono?

La Infraestructura es Fácil, la Cultura es Difícil

Por una parte, el tirar el dinero a un consultor para crear una versión de marca blanca de su plataforma basada en la nube y llamarla la IDE Nacional, es la opción más fácil. Porque la parte difícil no es levantar un portal, es asegurarse de que las entidades a las que "pertenecen" los datos que se ponen en un repositorio autoritativo común, hacen un esfuerzo a largo plazo creíble para mantener los datos importantes actualizados, de manera completa y transparente. Los datos gubernamentales abiertos, precisos y recientes nunca han estado en mayor demanda. Hagamos que ese sea nuestro único objetivo, y de-enfaticemos la parte de "infraestructura", que a estas alturas parece más bien la continuación de dos décadas de beneficios para las grandes consultoras en vez de para los usuarios finales. - Brian Tomoney

Publicado por Iván Sánchez

1 comentario:

Anónimo dijo...

Hace un par de meses publiqué una entrada en el blog de LookingforMaps que creo que guarda relación con el tema: optimizar nuestro contenido geográfico para facilitar que Google pueda mostrarlo en los resultados de las búsquedas.

El enlace ¿nos paramos a pensar cómo la gente llega a nuestros mapas en Internet?