Este artículo es una traducción de «One Man’s Public Comment: “More Data, Less Infrastructure”», por Brian Timoney, en el que comenta la situación de la IDE Nacional de los Estados Unidos.
Hagamos un ejercicio mental.
Un compañero de la empresa, con toda su buena fe, y sabiendo que eres "el de
los mapas", se te acerca y te pide algo aparentemente sencillo.
«¿Dónde puedo conseguir el fichero más actualizado de las
fronteras entre estados de EEUU?»
Hay docenas de lugares en los que conseguir un fichero con esos datos - ¿pero
el más actualizado? Como quieres seguir pareciendo todo un profesional, buscas
disimuladamente en google "shapefile EEUU estados" y ves estas tres entradas:
- Un fichero de 163 kB de ESRI, sin fecha
- Un fichero de 23 MB de la NOAA, escala 1:2 millones, "Fecha válida: 2012",
modificado por última vez en 2007.
- Dos opciones dentro del Atlas Nacional: un fichero de 6.8 MB a escala 1:2
millones con fecha de junio de 2005, y otro de 10.6 MB a 1:1 millón con fecha
de julio de 2012.
Y esto es, en resumidas cuentas, un problema que debería resolver una IDE
nacional, ¿no es cierto?
El FGDC (
Comité Federal de Datos
Geográficos) publicó recientemente un borrador del Plan Estratégico de la
IDE Nacional, abierto a comentarios del público. Y a mí me dijeron que
se supone que
tengo una opinión al respecto. Así que como buen bloguero, interrumpí
reluctante mi descanso veraniego para
bajarme el PDF y echar un vistazo.
Lo que me encontré fue una combinación del clásico lo-geográfico-es-importante
y un texto de agencia de publicidad para una tecnología llamada la Plataforma
Geoespacial. Cuando veo diez puntos sobre "El estado futuro deseable de la
IDEE", me imagino si acabaremos en algún lugar más cerca de resolver nuestro
problema de "las fronteras más actualizadas". Dado que el
mal rendimiento del FGDC está
documentado, me imagino que mi escepticismo es ampliamente compartido.
¿Infraestructura? Tenemos infraestructura por todos lados
Ya he cubierto
en el pasado cómo
estamos en una era de inversiones privadas sin precedentes en el paito de
infraestructuras de datos espaciales (véase: Google, Apple, Microsoft). Así
que cuando leo
«La Infraestructura Nacional de Datos Espaciales va más allá
de los datos»
mi reacción es que no deberíamos ir a ningún sitio hasta que no tengamos bien
los datos.
Mis sospechas sobre la pérdida de miras se hacen mayores cuando leo que
«la iniciativa de Plataforma Geoespacial es un componente
crítico para el desarrollo sostenido de la IDE nacional»
¿Y qué es esta Plataforma Geoespacial, exactamente?
«La Plataforma es un entorno de servicios basados en Web de
primera generación que proporciona acceso a un conjunto de datos, servicios,
aplicaciones y herramientas bien mantenido, de alta disponibilidad y
confiabilidad, para su uso por parte de agencias Federales y sus socios
Estatales, locales, tribales y regionales.»
Eso de ahí tiene que ser de una agencia de publicidad de las buenas.
Lo que quiero decir es que el FGDC debería centrarse únicamente en los datos,
y dejar las aplicaciones y herramientas a otros. No me importa pagar la
factura del agua todos los meses, pero no necesito que me vendan también el
lavabo.
Qué falta
Busca entre las palabras de la propuesta y adivina: ¿qué términos no aparecen?
motor de búsqueda
GitHub
El fracaso de la comunidad geoespacial para optimizar su contenido en
buscadores es el porqué cuando buscas tu propia dirección en google,
es más fácil encontrarte con una inmobiliaria que con, por
ejemplo, los límites de parcelas de tu departamento de SIG local. Para los
Profesionales Geoespaciales®, "autoritativo" significa detalle y precisión;
para las personas normales, lo que es autoritativo es lo que sale en la
primera página de Google cuando buscas algo. Una IDE que no tenga en cuenta
este hecho es una de esas cosas Portal/Plataforma-céntrica cuyo destino es la
irrelevancia.
El paso más importante hacia una infraestructura de datos espaciales este año
ha sido
GitHub, al añadir soporte para
visualizar
datos en formato GeoJSON. Aunque originalmente era una plataforma
para gestionar código de programación, GitHub ha evolucionado hacia una
plataforma que también sirve para
compartir los datos.
Una propuesta modesta
¿Qué pinta tiene un conjunto básico de ficheros geoespaciales mantenidos en
GitHub? Pues se parece mucho al proyecto Natural Earth de Nathaniel Kelso (
web GitHub). Kelso
explica su motivación para el proyecto:
«En una época en la que la web está llena de datos geoespaciales,
los cartógrafos se ven obligados a perder el tiempo desenredando marañas de
datos pobremente atribuidos para poder hacer mapas limpios y
legibles.»
Así que mi propuesta es: qué tal si cogemos el 5% del dinero de los
contribuyentes que se supone que vamos a dar en mano a una consultora para
hacer la Plataforma Geoespacial, y lo usamos para subir una versión de los
datos que hay en Natural Earth, pero hecha por el gobierno estadounidense, y
actualizada. Y de paso la subimos a GitHub también. De este modo, los usuarios
pueden "bifurcar" y "observar" el repositorio, etc, asegurándose de que todo
el mundo (el gobierno, sus ciudadanos, y el sector privado ocupado en crear
herramientas/interfaces/servicios) trabaja con la versión mejor y más reciente
de los datos más autoritativos. En otras palabras: ¿puede el FGDC replicar por
una pequeñísima fracción del presupuesto de la IDE Nacional, el trabajo que
Kelso y su grupo de voluntarios han hecho pro bono?
La Infraestructura es Fácil, la Cultura es Difícil
Por una parte, el tirar el dinero a un consultor para crear una versión de
marca blanca de su plataforma basada en la nube y llamarla la IDE Nacional, es
la opción más fácil. Porque la parte difícil no es levantar un portal, es
asegurarse de que las entidades a las que "pertenecen" los datos que se ponen
en un repositorio autoritativo común, hacen un esfuerzo a largo plazo creíble
para mantener los datos importantes actualizados, de manera completa y
transparente.
Los datos gubernamentales abiertos, precisos y recientes nunca han estado en
mayor demanda. Hagamos que ese sea nuestro único objetivo, y de-enfaticemos la
parte de "infraestructura", que a estas alturas parece más bien la
continuación de dos décadas de beneficios para las grandes consultoras en vez
de para los usuarios finales.
- Brian Tomoney
Publicado por Iván Sánchez