Uso de cookies

GNOSS usa cookies, propias y de terceros, con finalidad principalmente técnica y necesaria para prestación de nuestros servicios y mostrarles contenido relevante. Más información en nuestra política de cookies.

ACEPTA para confirmar que has leído la información y aceptado su instalación. Puedes modificar la configuración de tu navegador.

Publicando datos extraídos de un PDF

Buenas,

Tras unos días de aprendizaje y trabajo, he podido convertir el contenido del PDF con el Presupuesto de Gastos 2012 del Ayuntamiento de Sevilla a formato CSV (valores separados por comas). Con esto se hace sencillo, desde tratar con los datos del Ayuntamiento desde programas de hoja de cálculo, a emplear una serie de herramientas que facilita la visualización comprensiva y la reutilización, como es OpenSpending.

En el post que enlazo pretendo explicar las claves del proceso de trasformación de los datos desde el PDF a formato CSV (valores separados por comas) y su carga en The Data Hub y OpenSpending. Todos los ficheros y transformaciones intermedias que se describen en este post están disponibles para descarga desde el site del proyecto en Github:

https://github.com/fontanon/seville-spending

Espero que la experiencia le pueda ser de utilidad a terceros.

mode_comment comments (0)

Do you want to comment? Sign up or Sign in