formularioHidden
formularioRDF
Login

Regístrate

O si lo prefieres...

 

Panel Información

Utilizamos cookies propias y de terceros para mejorar tu experiencia de navegación. Al continuar con la navegación entendemos que aceptas nuestra política de cookies.

¿Qué puedo hacer?

Esta no es la última versión del artículo. Ver última versión

Decálogo Open Data

tipo de documento Artículo de Wiki

Versionado Martin Alvarez Espinar Por Martin Alvarez Espinar

Acerca de este recurso...

Visitas 2385

Valoración +2 Me gusta No me gusta

 

Este decálogo fue extraido de las conclusiones del Día Open Data en Euskadi, que se celebró en Donostia-San Sebastián, el 9 de mayo de 2012. Está en proceso de cambio.

0. Armonización entre Administraciones.

  1. Publicar datos en formatos abiertos y estándares.
  2. Usar esquemas y vocabularios consensuados.
  3. Inventario en un catálogo de datos estructurado.
  4. Datos accesibles desde direcciones web persistentes y amigables.
  5. Exponer un mínimo conjunto de datos relativos al nivel de competencias del organismo y su estrategia de exposición de datos
  6. Compromiso de servicio, actualización y calidad del dato, manteniendo un canal eficiente de comunicación reutilizador <-> AAPP.
  7. Monitorizar y evaluar el uso y servicio mediante métricas.
  8. Datos bajo condiciones de uso no restrictivas y comunes.
  9. Evangelizar y educar en el uso de datos.
  10. Recopilar aplicaciones, herramientas y manuales para motivar y facilitar la reutilización.

 

0. Armonización entre administraciones
Todos los puntos del decálogo se basan en la premisa de que debe existir una armonización entre todas las Administraciones. Todas las iniciativas Open Data deben compartir los mismos principios y definiciones que se listan en el decálogo. Este punto 0 es básico para la interoperabilidad y aprovechamiento eficiente de las sinergias llevadas a cabo por todos los actores Open Data - RISP.
 
1. Publicar datos en formatos abiertos y estándares
Cualquier iniciativa Open Data debería publicar sus conjuntos de datos en formatos abiertos (no-propietarios) y que sean adecuados para permitir la reutilización de los mismos por parte del colectivo reutilizador destinatario, abiertos.
 
2. Usar esquemas y vocabularios consensuados
Además de los formatos abiertos y estándar, la estructura de los datos debería seguir un convenio o unos esquemas definidos, si existieran. Si se crean vocabularios o esquemas de representación de la información específicos, éstos se deberían exponer públicamente para que el colectivo reutilizador pueda interpretar correctamente la información.
 
3. Inventario en un catálogo de datos estructurado
Cualquier iniciativa Open Data debe tener un punto de consulta donde se incluya un inventario con información descriptiva y técnica sobre los conjuntos de datos que se exponen. Los metadatos que informan sobre cada conjunto de datos debería seguir una estructura común y estándar. Asimismo, se deberían compartir las taxonomías de temáticas u otras necesarias -p.e., toponimia- para clasificar los conjuntos de datos dentro de los catálogos.
 
4. Datos accesibles desde direcciones web persistentes y amigables
Tanto las fichas de los conjuntos de datos, como la distribución de la propia información (volcado en un archivo, API de consulta, RSS, etc.) deberían de estar accesibles desde URLs (direcciones web) que persistan en el tiempo y así evitar que se pierdan las referencias en el futuro. Además deben seguir una estructura homogénea y bien definida, con información legible para que los reutilizadores conozcan o "intuyan" el contenido referido por dichas direcciones web. 
 
5. Exponer un mínimo conjunto de datos relativos al nivel de competencias del organismo y su estrategia de exposición de datos
Cada Administración que impulse una iniciativa Open Data debería crear una hoja de ruta donde especifique la estrategia de exposición de los conjuntos de datos y sus prioridades. Inicialmente, debería publicar los conjuntos de mayor interés según las competencias del propio organismo.
 
6. Compromiso de servicio, actualización y calidad del dato, manteniendo un canal eficiente de comunicación reutilizador <-> AAPP
La Administración debe mantener un mínimo de calidad y servicio en su iniciativa Open Data, manteniendo lo expuesto en la estrategia de publicación y comprometiéndose con su colectivo reutilizador. Debe establecer un  canal eficiente de comunicación que permita la interacción bidireccional organismo público - reutilizadores. 
 
7. Monitorizar y evaluar el uso y servicio mediante métricas
La Administración debe crear métricas y evaluar sus indicadores de uso y servicio de la iniciativa Open Data. De esta forma puede monitorizar el funcionamiento y uso, y así analizar si se está cumpliendo el compromiso con la comunidad de reutilizadores y cuales son las potenciales carencias del sistema o de la estrategia.
 
8. Datos bajo condiciones de uso no restrictivas y comunes
Las condiciones de uso deberían ser lo menos restrictivas posible y permitir la reutilización libre, incluso para fines comerciales. Se recomienda la creación y uso de licencias tipo, autodocumentadas y que sean comunes entre distintas administraciones. 
 
9. Evangelizar y educar en el uso de datos
Es necesario educar en el uso de los datos, tanto a los colectivos de reutilización específicos (sector TIC, periodismo, investigación, etc.) como a la sociedad en general y así fomentar el conocimiento y la inquietud por procesar información de una forma autónoma. Evitar el "disgusto" por los datos.
 
10. Recopilar aplicaciones, herramientas y manuales para motivar y facilitar la reutilización
Cualquier iniciativa Open Data debería recopilar ejemplos de uso y herramientas que faciliten y motiven la reutilización de los datos que se publican. 
 

 

Versión: 5

5 comentarios

¿Quieres comentar? Regístrate o inicia sesión

2012/05/15 18:17

Hola,

Entonces, asociado al punto 2 del Decálogo, el nivel 3 como mínimo del documento 'Towards Open Government Metadata' (Open Metadata for Humans)

A mi me parece bien.

Saludos,

Carlos.

 

2012/05/15 12:23

Totalmente de acuerdo Martín.

Efectivamente en caso de que el uso de metadatos abiertos solo aplique al catálogo haría referencia al punto 3 y lo que yo comentaba aplicaría más al punto 2.

Gracias por las aclaraciones!! :)

2012/05/15 11:04

 

Gracias por tus aclaraciones Martín. Aprovecho para desarrollar mejor nuestras dudas, porque parece que no lo habíamos entendido bien.
 
Al leer el documento, lo que nosotros hemos interpretado es que en cada uno de los niveles se expone un problema y cómo solucionarlo. Por ejemplo en el nivel 3 se expone el problema de que los metadatos se opfrezcan en PDF's o DOC's y se recomienda el uso de formatos no propietarios y fácilmente procesables por máquinas (CSV, XML...) 
Ahora bien, por lo que dices lo que nosotros pensábamos que era la descripción del problema, es la definición del nivel en sí, de modo que el 3 hace referencia a la exportación en PDF's y el 4 en formatos reutilizables. En este caso sí que nos parece correcto fijar el nivel 4 como mínimo.
 
Y es que lo que a nosotros nos parece poner el listón demasiado alto es en proponer como mínimo el RDF. Estamos de acuerdo en que la mayoría utilizamos DCAT y cumplimos este requisito, pero solo para el dataset del catálogo, y tal y como se estaba planteando pensábamos que el requisito de metadatos abiertos hacía referencia a todos y cada uno de los conjuntos de datos.
Es decir, con DCAT se definen los metadatos de las fichas de los conjuntos de datos de un catálogo, es decir los metadatos del dataset del catálogo. Pero si p.e. se ofrece un dataset de licitaciones, habría que ofrecer sus metadatos (los campos que lo componen - título, descripción, organismo que lo convoca, fechas...-) también en RDF y es ahí donde lo vemos inviable. No solo por la dificultad interna de realizar esto, sino porque si todavía no hay apenas vocabularios para la gran mayoría de los datasets, mucho menos para exponer sus metadatos.
 
Pensamos por tanto que si el requisito de metadatos abiertos solo va a hacer refencia a los metadatos de los conjuntos de datos y no al resto de datasets, habría que indicarlo.
 
Insisto en que quizás nuestras dudas surjan por no haberlo interpretado bien, ¿cómo lo veis vosotros?

2012/05/15 11:26

Antonio, gracias. Yo estaba pensando únicamente en la definición/uso de los metadatos del catálogo (sus fichas: título, descripción, licencias, etc.), pero has introducido la componente del resto de los metadatos que se utilizan para definir los conjuntos de datos en sí, no sólo el catálogo. Ahí sí que me parece demasiado el nivel 4, "obligar" a utilizar o definir metadatos reutilizables (y procesables automáticamente) para todos. Sería una buena práctica, que muchos hacéis (p.e., publicar un XSD para el XML que generáis con algún volcado de datos) pero quizás difícil en muchos casos.

Creo que con esta perspectiva de gestión de metadatos en general, debería aplicar al punto 2 del decálogo (usar esquemas y vocabularios comunes para representar los conjuntos de datos). 

2012/05/15 09:40

De acuerdo con la propuesta de Carlos Jiménez, se incorporará un matiz en el punto 3 (Inventario de conjuntos de datos estructurado). De acuerdo con el documento elaborado por ISA (Interoperability Solutions for European Public Administrations), 'Towards Open Government Metadata', se propone que todas las administraciones hagan una gestión adecuada de los metadatos usados para definir el catálogo de conjuntos de datos. Como mínimo, se propone que se alcance el Nivel 3 de madurez: Metadatos abiertos para humanos. Esto supone que dichos metadatos se deben documentar para que cualquiera pueda interpretar su significado. 

Mi cuestión es, ¿por qué no recomendar llegar al nivel 4, donde se recomienda publicar metadatos procesables automáticamente? Con el nivel 4 se permitiría, según el documento: [..] users can find, browse, compare, download and use Metadata that better fits their needs and projects. [...] La diferencia con respecto al nivel 3 es que se no sólo se publican para personas, sino también para máquinas. La mayoría de los catálogos se basan en DCAT o similares, por lo tanto ya estarían cumpliendo el nivel 4.

¿Comentarios?