¿El acceso abierto a los datos implica por sí mismo transparencia en el gobierno?

El acceso abierto a grandes cantidades de datos gubernamentales ha generado múltiples expectativas en cuanto a su contribución a una gestión estatal más transparente, cercana y participativa. Cada vez más países crean plataformas de Open Data, liberando información de las diferentes agencias. En el 2013 más de 40 países tenían plataformas de open data gubernamentales, abriendo el acceso a más de 1 millón de conjuntos de datos e impulsando la construcción de aplicaciones usando diversas fuentes. Por su parte Colombia ha definido una política de datos abiertos y una guía para la publicación de la información. Sin embargo, las posibilidades que abre el acceso directo de los ciudadanos a los datos del gobierno en cuanto a la transparencia en la rendición de cuentas y en el diseño participativo de políticas públicas son amplias pero no deben ser sobreestimadas.

Quienes son más entusiastas acerca de la importancia de los datos en la gestión pública también lo son respecto al interés ciudadano por la información. La apertura de datos demanda cada vez más por parte de la ciudadanía. En este sentido nos planteamos la pregunta ¿Implica necesariamente el acceso abierto a los datos una mayor transparencia y participación en la gestión gubernamental? A partir de esta pregunta pueden surgir otras como: ¿Es realmente libre el acceso a los datos para todos los ciudadanos? ¿Qué impide el acceso a algunos de ellos? ¿Qué motiva la búsqueda de información y de qué depende estar bien informado? y más allá de la búsqueda y acceso a la información: ¿Qué permite transformar ésta información en conocimiento y éste conocimiento en acción? Y ¿Qué tipo de información es capaz de incidir en el curso de la gestión pública? Sin pretender dar respuesta a todas estas preguntas buscamos señalar algunos puntos que consideramos importantes para la discusión.

La idea detrás del término Open Data, es que los datos públicamente disponibles pueden ser usados y distribuidos libremente. Estos datos generalmente están sujetos a una licencia que permite su uso sin restricciones o exigiendo atribución y enlace a la fuente original. La política de datos abiertos colombiana tiene en cuenta las excepciones sobre los datos publicados, en los casos en que presenten riesgo para la seguridad o la privacidad de los individuos, además se deja a cada institución la tarea de decidir qué datos son publicables y de priorizar la publicación, aunque se dan algunos lineamientos. En términos generales dos de las características fundamentales del Open Data son: disponibilidad y acceso. Sin embargo, el acceso está condicionado por la heterogeneidad de la ciudadanía. Esta desiguadad en el acceso a la información se ha explicado en función de tres factores: la motivación, las habilidades adquiridas y las oportunidades. En cuanto a las oportunidades, por ejemplo, existe un abanico de situaciones “digitales”; según datos de Banco Mundial mientras que en países como Noruega, Islandia o Bermudas más del 95% de la población tiene acceso a internet, en nueve países, siete de ellos africanos, menos del 2% de la población accede a internet; en Colombia la cifra se estima alrededor del 53% .

Así como son múltiples las situaciones de los ciudadanos-usuarios de los datos, también son múltiples los universos de posibles datos publicables. Es importante pensar cuál es la información que se publica, pues la calidad de los datos y su facilidad de uso determinan el éxito de las iniciativas de Open Government. Es necesario que los datos sean completos, confiables, actualizados y descritos de manera comprensiva. Tener información desactualizada puede ser peor que no tenerla. Los datos publicados deben hacer explícita la frecuencia de actualización, y mantener el histórico cuando sea relevante. Las implementaciones de Estados Unidos y Reino Unido pueden ser un ejemplo para Colombia en este tema, actualizando frecuentemente los datos que lo necesitan e indicando la frecuencia de actualización. Es fundamental que los datos publicados en los sitios de Open Data sean publicados con un reporte acerca de cómo fueron generados y qué procesos se han realizado sobre ellos (i.e. control de cambios). En este aspecto la existencia de fuentes alternativas de información para contrastar la versión oficial puede jugar un papel activo.

En cuanto a las características de los datos mismos también es importante que estos se describan de manera estandarizada y comprensiva. Por ejemplo, la iniciativa de datos abiertos de Estados Unidos (data.gov) define un vocabulario (Project Open Data Metadata Schema v1.1 -ODMS-) basado en DCAT, un vocabulario RDF para describir conjuntos de datos, y especifica que los metadatos estarán disponibles en formato JSON. En la implementación colombiana se define una ficha de descripción de metadatos y un formato de definición de encabezados. Estos metadatos son los presentados a los usuarios en el sitio web, sin embargo no se pueden descargar en un formato estándar, no todos los datos son requeridos y son sólo un subconjunto de los requeridos en ODMS.

De igual forma es necesario que los datos se encuentren interconectados. Tim Berners-Lee define un modelo de 5 estrellas para calificar qué tan conectados están los datos abiertos publicados en la Web:

01_06_datosblog

Los datos publicados en la implementación actual del sitio de Open Data en Colombia están publicados bajo una licencia que permite su uso, distribución y modificación; es una licencia que aplica a todos los datasets divulgados. Los datos son publicados en formatos estructurados, o como enlace externo a otros repositorios. No hay una forma de filtrar los datos por formato, o saber (sin explorar el contenido) la calificación en el modelo de 5 estrellas de cada dataset. En comparación, el sitio web de datos abiertos de Reino Unido utiliza el modelo de 5 estrellas como “openness rating” y la licencia es explícita en la página de descarga de cada conjunto de datos. La implementación de Estados Unidos también especifica la licencia por dataset, usando una licencia estándar para aquellos que no proveen información de licencia, usa el modelo de 5 estrellas en la página de descargas y es posible filtrar los datasets por tipo de archivo.

Aún cuando idealmente los datos cumplan estas características y existe la posibilidad de acceder a datos de calidad, los ciudadanos tiene escasos incentivos para informarse, pues poseen una mínima probabilidad de influir en el curso de los resultados políticos ¿De qué depende que un flujo informativo desemboque en un gobierno participativo? La publicación de los datos debe ir acompañada por la creación de canales de participación política más efectivos y una renovación del proceso de toma de decisiones.

La participación a partir de los datos publicados además requiere un acervo de conocimiento político y técnico. En la rendición de cuentas, por ejemplo, parece imprescindible una ciudadanía formada que tenga una idea mínima del bienestar que el gobierno debería haberle proporcionado y que además sea capaz de atribuir responsabilidades entre los distintos niveles de gobierno por los resultados mostrados en los datos ¿Es entonces la información la que por sí misma empodera a los ciudadanos o son los ciudadanos empoderados quienes buscan la información?

Publicar los datos es un primer paso, pero realizar análisis sobre los datos requiere conocimiento y herramientas, a lo que no todos los ciudadanos tienen acceso. En este sentido implementaciones como la de Kenya, basada en Socrata, provee herramientas para explorar y visualizar los datos de cada dataset. La implementación del gobierno de Minas Gerais, DataViva, sobresale por proveer no sólo diferentes tipos de visualización para cada dataset de manera individual, sino también por organizar de una forma curada los datos y proveer herramientas de análisis avanzadas que permiten integrar varios datasets. Este tipo de herramientas permiten tomar decisiones informadas, disminuyendo la curva de aprendizaje que puede actuar como barrera de entrada para el uso de los datos.

01_06_datosblog2

En la implementación de Colombia es posible ver los datos en forma de tabla, en línea, para algunos datasets, sin embargo no hay muchas herramientas que faciliten el análisis de los datos.

Conclusiones

Hemos señalado algunos aspectos importantes a la hora de pensar la contribución de los datos abiertos a la transparencia y el carácter participativo del gobierno. Colombia ha dado un primer paso en la liberación de datos gubernamentales, conscientes del impulso que estos datos ofrecen a la mejora de la gestión gubernamental, queda mucho por mejorar y aprender de la experiencias propias y de las que se han llevado a cabo en otros lugares, que son cada vez más frecuentes. Se requiere un esfuerzo considerable para organizar los datos, ampliar el número de datasets disponibles y facilitar su aprovechamiento por parte de los ciudadanos. Implementaciones propietarias como Socrata o de código abierto como DataViva pueden impulsar la evolución de la implementación colombiana. Sin embargo, se debe tener en cuenta que no es sólo un problema de plataforma, es necesario definir, o actualizar, políticas y definir procedimientos para asegurar la calidad de los datos y de las posibilidades de acción con base en ellos. Unos datos actualizados, pertinentes, interconectados y con herramientas de visualización que faciliten su análisis se quedan cortos y no tendrán mayor incidencia si no se crean espacios de participación política vinculantes e incentivos a iniciativas ciudadanas que den generación de valor, surjan del acceso a los datos y busquen el bienestar común.

  1. Ingeniero de sistemas de la Universidad Nacional de Colombia y Magister en Ingeniería, área sistemas y computación, Universidad de los Andes, Colombia.
  2. Socióloga de la Universidad Nacional de Colombia y Máster en Democracia y Gobierno de la Universidad Autónoma de Madrid
  3. Open data: Unlocking innovation and performance with liquid information. Mckinsey. 2013. http://www.mckinsey.com/insights/business_technology/open_data_unlocking_innovation_and_performance_with_liquid_information
  4. Unión Internacional de Telecomunicaciones, Informe sobre el Desarrollo Mundial/TIC de las Telecomunicaciones y estimaciones del Banco Mundial. Disponible en http://datos.bancomundial.org/indicador/IT.NET.USER.P2
Sobre el autor
Christian Ariza Porras Christian Ariza Porras (2 Entrada(s))


Magister en Ingeniería. Área: Sistemas y Computación, Universidad de los Andes, Colombia. Líneas de investigación y áreas de interés: Big Data, Linked Data, Semantic Web, Social Search

AVISO LEGAL: Los artículos aquí registrados expresan la opinión de sus autores y colaboradores. Este sitio no representa necesariamente la opinión del DEPARTAMENTO DE INGENIERIA DE SISTEMAS Y COMPUTACION ni de la UNIVERSIDAD DE LOS ANDES.


Tweet about this on TwitterShare on Facebook0Share on Google+0Email this to someonePin on Pinterest0

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

 caracteres disponibles