Cargando ...
Publicando datos extraídos de un PDF
30/07/2012

Buenas,
Tras unos días de aprendizaje y trabajo, he podido convertir el contenido del PDF con el Presupuesto de Gastos 2012 del Ayuntamiento de Sevilla a formato CSV (valores separados por comas). Con esto se hace sencillo, desde tratar con los datos del Ayuntamiento desde programas de hoja de cálculo, a emplear una serie de herramientas que facilita la visualización comprensiva y la reutilización, como es OpenSpending.
En el post que enlazo pretendo explicar las claves del proceso de trasformación de los datos desde el PDF a formato CSV (valores separados por comas) y su carga en The Data Hub y OpenSpending. Todos los ficheros y transformaciones intermedias que se describen en este post están disponibles para descarga desde el site del proyecto en Github:
https://github.com/fontanon/seville-spending
Espero que la experiencia le pueda ser de utilidad a terceros.
Authors:
Categories:
Tags:
Copyright
- The original license is kept.