Los 8 principios básicos de los Datos Abiertos

El concepto de Datos Abiertos cada vez tiene más importancia, se escucha más y más en los diferentes medios, se habla del Linked Open Data, del Open Research Data, etc. Están presentes en ámbitos políticos, estatales, científicos entre otros. Desde su concepción, han sido una gran revolución, pero ¿son todos los datos que se comparten datos abiertos? En este artículo te presentamos los principios básicos que regulan los datos abiertos.

Los 8 principios básicos de los Datos Abiertos

A diciembre del año 2007, 30 defensores del Gobierno Abierto se reunieron en Sebastopol, California, y crearon un conjunto de 8 principios básicos de los datos abiertos. En aquella reunión celebrada entre los días 7 y 8 de diciembre quedaron sentadas las bases para comprender por qué los datos abiertos son esenciales para la democracia y para el gobierno abierto.

Gracias a que Internet es un espacio público, los gobiernos tienen la oportunidad de entender las necesidades de la ciudadanía y por consiguiente, los ciudadanos pueden participar de una forma activa con el gobierno. La información en este caso, se convierte en un instrumento de gran valía para mejorar los asuntos que incumben a la nación.

El grupo reunido en California ofreció un total de ocho principios fundamentales para diferenciar los datos abiertos del gobierno y contribuir a que los gobiernos de todo el mundo fueran más eficaces y más transparentes. Estos son esos principios básicos:

1.-  Completos

Todos los datos públicos se ponen a disposición. Los datos públicos son datos que no están sujetos a limitaciones de privacidad, seguridad o privilegios válidos.

Este principio pretende que para tener una sociedad informada y participativa, es necesario que disponga de toda la información (los datos) que genera el gobierno. Solo de esta forma podremos tomar decisiones como sociedad. Tengamos en cuenta además que de alguna forma los ciudadanos ya hemos pagado por esos datos con nuestros impuestos y podemos con toda propiedad, reclamar que estén disponibles libremente.  

Aquellos datos o recursos informativos que no estén en un formato electrónico (por ejemplo valores de dispositivos de medición analógicos), no pueden estar sujetos a estos principios. No obstante, se recomienda que, en la medida de lo posible, estos datos sean convertidos a un formato digital para que puedan ser compartidos igualmente.

2.- Primarios

Los datos se recogen en la fuente, con el más alto nivel de granularidad, no hay agregaciones o modificaciones.

Los datos abiertos tienen que ser detallados y vírgenes. Esto significa datos en bruto, sin haber pasado por ningún filtro o estar procesados. Además, se debe facilitar información sobre cómo se han obtenido los datos y dónde están los documentos originales a los que hacen referencia, para que así el usuario pueda comprobar si los datos han sido seleccionados y almacenados de forma correcta.

Es frecuente en la administración intentar exponer datos después de haberlos filtrado o agregado según un criterio dado. Este principio pide abstenerse de ello, y que el reutilizador o el ciudadano puedan procesar los datos originales según su conveniencia o interés.

Entendemos que este principio basa su razón en la objetividad y transparencia y exige que no exista ninguna modificación sobre los datos para poder estudiarlos en profundidad.

3.- Oportunos

Los datos se pondrán a disposición tan pronto como sea necesario para preservar el valor de los datos.

Deben estar actualizados en todo momento y a disposición de los usuarios. Hay que dar prioridad a la difusión de datos que sean “time sensitive”.

Por esta razón, en OGoov se ha desarrollado Real Time Open Data (RTOD), un middleware que permite el acceso en tiempo real a contenidos proporcionados por diferentes fuentes a través de un único punto.

La realidad es que la oferta de datos abiertos en tiempo real es bastante escasa y no se adecua a la demanda. Aquí os dejamos un interesante artículo sobre RTOD y el futuro de los datos abiertos y cómo nosotros lo contemplamos.

4.- Accesibles

Los datos están disponibles para la gama más amplia de usuarios con la más amplia gama de propósitos.

Esto significa que hay que tener en cuenta cómo afectan las opciones de preparación y publicación de los datos a personas con discapacidad y cómo pueden afectar a los usuarios de una variedad de plataformas de software y hardware.

Los datos deben publicarse con los estándares y protocolos actuales que marca la industria, a la vez que en formatos alternativos cuando así se requiera para la reutilización de los mismos.

Los datos no son accesibles si sólo pueden obtenerse a través de un formulario web o si las herramientas automatizadas no pueden acceder a los mismos debido a un archivo robots.txt, o cualquier otra política o restricción tecnológica.

Sin embargo, se constata que en general la calidad de los datos abiertos publicados no es alta. De hecho, hay datasets que contienen errores en sus distribuciones, que son incompletos o están poco detallados. Esto imposibilita tanto a la ciudadanía como a reutilizadores hacer un uso práctico de ellos.

Recientemente se ha publicado un estudio que analiza el nivel de madurez de las iniciativas de datos abiertos de los Estados Miembros de la UE. Uno de los indicadores de este estudio es medir la usabilidad de las plataformas. Esto significa si dichas plataformas son funcionales a la hora de facilitar la reutilización de datos que proceden de diversos sectores.

Las notas son menores de las esperadas porque solamente un 44% de los países tiene un nivel óptimo de madurez. España por su parte, se encuentra en el grupo líder en el marco europeo.

5.- Procesables por máquinas

Los datos se estructuran razonablemente para permitir el procesamiento automatizado.

Para que los datos abiertos puedan ser utilizados, tienen que estar debidamente codificados. Los textos libres no son un sustituto de los datos tabulados y estructurados, de la misma forma no es lo mismo la imagen de un texto que el propio texto. De forma práctica esto indica que formatos como el PDF, cualquiera de los gráficos como JPG o PNG o textos no estructurados en un archivo TXT no pueden ser procesados automáticamente y deben ser rechazados como datos abiertos (o deben incluirse alternativas a ellos). Debe documentarse de forma suficiente el formato de los datos publicados  y el significado de los elementos de datos estructurados que se publiquen..

6.- No discriminatorios

Los datos están disponibles a cualquier persona, sin necesidad de registro.

Los datos abiertos deben estar disponibles a cualquier persona sin necesidad de registrarse o identificarse previamente. El acceso anónimo está permitido incluyendo el acceso a través de proxys anónimos.

Algunos organismos públicos requieren de identificación para poder acceder a datos que son públicos. Estos registros e identificaciones son barreras para poder distribuir los contenidos. Por ejemplo, un ayuntamiento que para ofrecer sus datos geoespaciales en el portal de datos abiertos exigiera a sus usuarios el registro estaría violando este principio.

7.- No propietarios

Los datos están disponibles en un formato sobre el cual ninguna entidad tiene el control exclusivo.

Los formatos en que se presenten los datos deben de ser preferiblemente abiertos o al menos incluir entre los publicados formatos abiertos. Los formatos propietarios añaden restricciones innecesarias a quienes los usan. Esto significa que si se van a ofrecer datos en formatos propietarios como Excel o DWG por ejemplo, deberán al mismo tiempo ofrecerse los mismos en formatos abiertos como CSV, ODF, XML, SVG, etc..

Muchos de los datos que pensamos que cumplen con los preceptos de Datos Abiertos se presentan en formatos propietarios o no estructurados y por tanto no son fácilmente reutilizables. Es frecuente encontrar que los formatos abiertos no son utilizados, e incluso son poco conocidos, y muchas compañías no saben ni siquiera que pueden sacar un beneficio económico de ellos.

8.- Libres de licencia

Los datos no están sujetos a ningún derecho de autor, patentes, marcas o regulación. Se permiten restricciones razonables de privacidad y seguridad.

A través de portales de Datos Abiertos, como los desplegados usando la plataforma OGoov, las Administraciones Públicas pueden poner a disposición de la ciudadanía datos que estén en formatos que faciliten la redistribución, reutilización y comercialización de estos datos. Es un principio fundamental que los mismos tengan una licencia abierta como pueden ser la CC0, CC-BY, PDDL, ODC-BY, etc.

Pensad en el siguiente caso: Si un gobierno expone datos de su cartografía, pero cuando los descargas encuentras una cláusula que impide el uso comercial de los mismo implica que la licencia de tales datos no es “abierta” y se estaría violando este principio.

Los datos no pueden estar sujetos a restricciones de derechos de autor o patentes. Sin embargo, debido a que la información gubernamental es un binomio entre registros públicos e información personal, hay que hacer una clara distinción entre las políticas de privacidad y lo que es de dominio público a la hora de exponerlos

Después de ver cuáles son los principios básicos de los Datos Abiertos, la pregunta que subyace bajo todo es ¿hacemos realmente uso de estos datos abiertos? Y si no es así,  ¿Cuáles son los motivos por los que no se explota esta información de la que en teoría disponemos?

Si estáis interesados en conocer la respuesta, os recomendamos este reciente artículo publicado por Política Comunicada con 14 razones fundamentadas que analizan con precisión la actual situación, no le sorprenderá ver que entre las razones más frecuentes está justamente el desconocimiento o el incumplimiento de uno o varios de estos principios básicos que les hemos presentado hoy. Hasta la próxima semana.

Post relacionados

El portal de datos abiertos de la Diputación de Cádiz, soportado por OGoov, galardonado como mejor p... El pasado 24 de Febrero, durante la gala de entrega de premios del Congreso  CNIS 2017, el portal de Datos Abiertos de la Diputación de Cádiz, soportado por OGoov -nuestra solución de Gobierno Abierto- fue reconocido com...
El portal de datos abiertos de la Diputación de Cádiz, soportado por OGoov, galardonado como mejor p... El pasado 24 de Febrero, durante la gala de entrega de premios del Congreso  CNIS 2017, el portal de Datos Abiertos de la Diputación de Cádiz, soportado por OGoov -nuestra solución de Gobierno Abierto- fue reconocido com...
Cómo evaluar el grado de madurez de un proyecto de datos abiertos Los datos abiertos, son una parte fundamental para el desarrollo de muchas de las estrategias establecidas en Europa, sobre cómo deben ser los Estados miembros en el futuro. En artículos anteriores hemos hablado sobre va...
Gobierno Abierto, los casos de uso de OGoov La semana pasada os hablábamos de qué significa realmente el concepto de Gobierno Abierto, hoy queremos explicaros cómo funciona un portal de Gobierno Abierto usando como ejemplo, nuestra Plataforma de Gobierno Abierto O...

Deja un comentario