tipo de documento Artículo

Artículo

Datos enlazados / Linked data: Formatos de presentación y posicionamiento en buscadores

Acerca de este recurso...

1471

0

Publicado el 18 . 10 . 2011 por Ricardo Alonso Maturana

El enlazado de datos (linked data) es una de las aplicaciones derivadas de los conceptos que componen la Web Semántica. Como es bien sabido, la web es un conjunto de documentos enlazados. Una de las promesas conceptuales de la web semántica, que podemos considerar una realidad incipiente (ver linkeddata.org), es la construcción de una web de datos enlazados, enlaces que pueden construirse y/o seguirse de manera automática por máquinas que comprenden los datos.

 

Muchas páginas web (HTML) se componen dinámicamente desde datos estructurados, habitualmente almacenados en bases de datos. Para que estos datos estén disponibles, respondiendo al exhorto “Raw data now!” de Tim Berners-Lee (algo así como ¡datos en bruto ya!), tenemos 2 posibilidades, ya que puede ser muy difícil su recuperación desde el HTML.  

La primera opción pasa por la incrustación de datos estructurados dentro del código HTMLde las páginas. Aunque es posible construir islas de datos dentro del HTML, lo más habitual es la inserción en el código HTML de microformatosRDFa o microdatos. En particular, los microdatos son la opción de la iniciativa Schema.org, que comparten Google, Microsoft y Yahoo. Como se indica en las páginas de schema.org“…muchas aplicaciones, especialmente buscadores, pueden beneficiarse enormemente del acceso directo a los datos estructurados…”. En otro post comentaremos los posibles motivos de la elecciónde lo que llaman microdatos; aquí nos limitaremos a indicar que se trata más de una creación que de una elección, y que la apuesta de Facebook por la expresión RDF de todos los datos de su plataforma puede tener que ver.

Sean los datos incrustados microdatos, microformatos o RDFa, su propia naturaleza es una ventaja y una desventaja. Como ventaja, incorporan datos que proporcionan información de valor para robots de búsqueda. Si bien no está claro el nivel de importancia de la presencia de dichos datos en los resultados presentados actualmente por los buscadores, parece claro que esperan un beneficio a la hora de indexar y presentar la información.

Como desventaja, la presencia de los datos dentro del HTML obliga a la descarga completa de la página, cuando menos, para obtener unos bytes de datos estructurados. De hecho, esto hace difícil pensar en aplicaciones distintas a los robots de búsqueda, que ya están obligados a leer e interpretar el HTML completo.

Datos enlazados / Linked data: Formatos de presentación y posicionamiento en buscadoresPor el contrario, la segunda opción pasa por servir, exclusivamente, los datos estructurados origen del HTML de la página. Esto puede hacerse por medio de URLs específicas, o solicitando a la misma URL de la página Web un tipo de datos diferente del HTML. El consorcio W3C propuso RDF (Resource Description Framework) como marco estándar de representación de información/datos en la Web, enfocado desde su creación al consumo y enlazado de datos: el uso de URIs (identificadores uniformes de recursos) para identificar objetos o entidades en la Web, la semántica de cada dato expresada desde su definición ontológica, la extensibilidad, etc.

Un práctica recomendada por el W3C (casi obligatoria, diríamos nosotros) es la reutilización de ontologías y vocabularios estándares (comúnmente aceptados) siempre que existan, de modo que la interpretación y enlazado de los datos se facilite.

Sea cual sea la elección, lo que no parece una opción recomendable, ni presente ni futura, es la presentación, para su consumo como datos abiertos, de datos estructurados en formatos propietarios o poco expresivos (XML, XLS, CSV, PDF, JSON), usando además una definición de datos propia. No posibilita el enlace de los datos, y su consumo no es mucho más fácil que si se extrajeran desde un HTML.
 

Editores: Ricardo Alonso Maturana , Editores Watermelon

Etiquetas:

Se respeta la licencia original del recurso.

0 Comentarios

¿Quieres comentar? Regístrate o inicia sesión