Watermelon: la web de datos enlazados en un eterno grafo de conocimiento > web de los datos

    3 resultados

    Artículo

    /

    Publicado el 14.12.2011 por Ricardo Alonso Maturana

    Explotación de metadatos embebidos: posicionamiento, recuperación de la información y generación de contextos

    En artículos anteriores de Watermelon he ido escribiendo algunas entradas sobre la web de los datos y su relación con nuevos sistemas de búsqueda. Estas entradas son:

    Además de las técnicas de posicionamiento tradicionalmente aplicadas al HTML (lo que podemos denominar SEO orgánica), Google, Bing y otros motores de búsqueda recomiendan el uso de metadatos embebidos en el HTML. El uso que dan a estos datos es doble. 

    • Primero, consiguen información más detallada del significado del documento, es decir, más semántica. Los metadatos embebidos definen expresamente que un texto es el nombre de una película, o las calorías de una receta, o el autor de un libro. Esto les permite presentar unos resultados de búsqueda más ajustados, e incluso que cada resultado tenga una presentación enriquecida con precios, valoraciones de los usuarios, autores, etc.
    • Segundo, los más importantes motores de búsqueda están promoviendo verticales de sus servicios, de manera que la búsqueda de recetas, viajes o libros pueda hacerse en páginas específicas. En dichas páginas se presentan facetas de búsqueda (por ejemplo, para filtrar recetas por ingrediente), que solo pueden ser obtenidas desde metadatos semánticos incrustados en el HTML.

    Ninguno de estos motores ha especificado aún el peso que confieren a la existencia de metadatos respecto a los otros parámetros conocidos de posicionamiento, ni siquiera al nivel cualitativo que suelen hacerlo. Sin embargo, la recomendación de uso está ahí y es clara.

    Pasemos ahora al asunto de los formatos. Google declara leer RDFa y microformatos, además de microdatos, el reciente estándar que promueve junto a Bing y Yahoo. Por otra parte, nos consta que indexa y posiciona el contenido RDF asociado al HTML.

    En nuestra opinión, una solución completa en este ámbito, que aporte el máximo valor de posicionamiento, además de las técnicas HTML habituales debería componerse de:

    • RDFa embebido, con vocabularios estándar para expresar las entidades reconocidas por los motores de búsqueda.
    • Microformatos, si la información se refiere a alguna de las entidades de las especificaciones aprobadas (como hCard para personas, o hCalendar para eventos), o a alguno de los más prometedores o exitosos borradores (como hProduct o hRecipe).
    • Microdatos, aún cuando la especificación, por su inmadurez, no llegue a cubrir el total de los datos expresados en los otros formatos.
    • RDF vinculado al HTML, que permita el enlace de datos y la construcción de contextos que enriquezcan la información.

    Esta es la solución que hemos puesto en marcha en www.mismuseos.net, por ejemplo y en otros lugares de GNOSS.

    Reconociendo la importancia del posicionamiento en buscadores de los recursos, el problema de la representación del conocimiento implícito en un recurso quedaría muy incompleta si no consideráramos a la vez otras explotaciones del mismo. Este es el asunto del que se ocupa la Web Semántica.

    La Web semántica incide en el problema de falta de significado comprensible por las máquinas en los documentos Web, que, como consecuencia, dificulta una mejor explotación de los datos y la construcción de una Web de los datos y Web de los datos enlazados. Esta mejora debería verse en aplicaciones o sistemas conocidos, como las búsquedas, asistentes personales o sistemas de recomendación; y en sistemas incipientes o por llegar, como  descubrimiento de datos, análisis de tendencias, estudios emocionales, identidad digital, etc.

    La Web Semántica resultará tanto más útil en la medida en la que las máquinas comprendan de un modo más preciso y profundo el significado de los recursos, lo que depende críticamente de la expresividad de los formatos de representación del conocimiento que utilicemos y, en este sentido, OWL-RDF no tienen competencia. Si lo que queremos es desarrollar un sistema de recuperación de la información eficiente e intuitivo, un sistema de generación de contextos pertinentes y poco ambiguos, o un sistema de recomendación inteligente, los microformatos y microdatos resultarán claramente insuficientes para muchísimas explotaciones verticales. Esto refuerza lo que hemos denominado un poco más arriba “solución completa en este ámbito”, pero en cierto modo invierte el orden de las prioridades: convendrá utilizar un estándar ontológico o vocabulario en primer lugar, para reforzarlo con microdatos y microformatos cuando de comunicarse con los buscadores se trate.

    Imagen vía: https://promocionmusical.es/

    ...

    Artículo

    /

    Publicado el 18.10.2011 por Ricardo Alonso Maturana

    Web semántica, web de los datos y estándares de representación del conocimiento

    La comunidad tecnológica de la Web semántica ha sufrido últimamente 2 polémicas respecto a las tecnologías de soporte. Por un problema de comunicación intrínseco a la profesión de ingeniero, a veces parece que la web semántica sea sólo un conjunto de estándares, y las herramientas generadas en torno a ellos. Desde luego, esto no es así: igual que la Web no es el HTMLXHTMLCSSXML (estándares del W3C) oJavascript (estándar ECMA, mantenido por Mozilla Foundation) que componen sus páginas, la Web semántica no es RDFOWLSPARQL, o Turtle (también estándares del W3C), o cualquier otro acrónimo más o menos conocido.

    La Web semántica incide en el problema de falta de significado comprensible por las máquinas en los documentos Web, que, como consecuencia, dificulta una mejor explotación de los datos, y la construcción de una Web de los datos y Web de los datos enlazados. Esta mejora debería verse en aplicaciones o sistemas conocidos, como las búsquedas, asistentes personales o sistemas de recomendación; y en sistemas incipientes o por llegar, como  descubrimiento de datos, análisis de tendencias, estudios emocionales, identidad digital, etc.

    La primera de las polémicas se plantea en el uso de los estándares y tecnologías para la recuperación y explotación de datos. Según Glen Macdonald, diseñador y product manager de Needlebase (una base de datos de grafos y plataforma de explotación de datos, propiedad de ITA Software, a su vez adquirida por Google en abril de 2011), lo importante no son los estándares, sino proporcionar a los usuarios un interfaz comprensible, y un lenguaje de consulta más sencillo. Siguiendo con su razonamiento, criticaba RDF y SPARQL por poco expresivos para la gente. Es fácil estar de acuerdo con esta opinión, igual que si se refiriera a XHTML, SQL, CSS o Javascript: no son muy expresivos para la gente, aunque han servido para construir la web. En mi opinión, Macdonald confunde, interesadamente, los estándares y tecnologías con la Web semántica, aunque también es cierto que muchos de los desarrollos sobre la Web semántica se han centrado en la tecnología y poco en la gente. Además, Macdonald olvida que la búsqueda y exploración de información son sólo una parte de la Web de los datos: ¿cómo enlazar datos con datos sin estándares? O, echando la vista atrás, ¿cómo se enlazarían documentos con documentos sin un lenguaje de marcas estándar para todos ellos, es decir, sin el estándar HTML?

    La segunda de las polémicas se centra en el modo de expresión de los datos en bruto, origen de la mayoría de las páginas Web dinámicas. Como ya explicamos en un post anterior, una de las opciones pasa por la incrustación de marcas dentro del HTML de las páginas, con 3 posibilidades: microformatos, RDFa y microdatos. La iniciativa Schema.org, apoyada por Bing, Google y Yahoo, propone, desde Junio de 2011, el uso de microdatos, porque “…los microdatos ofrecen el equilibrio entre la posibilidad de ampliación de RDF y la sencillez de los microformatos…”. . En primer luhar, hay que señalar que, desde la comunidad de datos enlazados, se ha recibido Schema.org como algo positivo, ya que es un paso importante hacia la creación de la Web de los datos. Como contribución y esfuerzo complementario, esta comunidad ha creado el sitio Web schema.rdfs.org, para dar soporte al uso y puesta en marcha de Schema.org, especialmente enfocado a los datos enlazados.

    Volviendo a las características enunciadas en los microdatos,  es cierto que la extensibilidad es algo mayor que en los microformatos, pero también que el nivel de sencillez (o dificultad) respecto al RDF o RDFa no es muy diferente.

    Si se compara la extensibilidad con el RDF, llegamos a un problema de estandarización, y de quien controla los estándares. Supongamos que un usuario quiere extender la clase Product de Schema.org, para incluir datos de automóviles: peso, medidas, cilindrada, potencia, etc. Si lo extiende por su cuenta, tiene 2 problemas. Primero, aunque Schema.org podría adoptar su extensión, si ha tenido éxito, pudiera ser que produjeran una propia, para el mismo ámbito. Segundo, y más importante, nadie, ni los robots de búsqueda, entienden a priori la nueva extensión. Podría hacerse una comunicación ad hoc del nuevo formato, externa a Schema.org, y proporcionar la documentación que explique el funcionamiento y la naturaleza de los datos extendidos. La verdad, esto suena a antiguo y, desde el punto de vista técnico y de imagen, sorprende que alguna de las empresas promotoras, tan habitualmente puristas en el uso de estándares abiertos, hayan propuesto esta solución.

    Esto no sucede con RDF, donde, para empezar, los estándares son abiertos, y no propiedad de empresas. Por supuesto que es posible que alguien reinvente la rueda. Sin embargo, la posibilidad de conseguir enlazar datos con datos, si se siguen las recomendaciones de reutilización de vocabularios y ontologías en su publicación, es suficiente premio al esfuerzo, que en realidad no es tal. Además, el vínculo obligatorio entre los datos RDF y una ontología accesible y pública que los defina, consigue una auto-expresión de los datos, y posibilita su comprensión mecanizada.

    La decisión técnica de Schema.org podría tener una explicación de otro tipo, si se piensa en la iniciativa adoptada recientemente por Facebook. Como es sabido, Facebook mantiene una apuesta fortísima de construcción de plataforma, que permita a otras empresas generar más y más desarrollos que complementen la funcionalidad. Pues bien, dando un paso más, Facebook ha implementado la obtención y enlazado de datos en formato RDF, desde las funciones de su API. Esto, además de convertirles de facto en el más importante nodo de datos enlazados, supone un respaldo de primer orden a los estándares de W3C.

    ...

    Artículo

    /

    Publicado el 21.12.2010 por Ricardo Alonso Maturana

    GNOSS, alternativa para los usuarios de Delicious

    ESPAÑOLENGLISH

    En las últimas semanas se han producido comentarios bastante es.pe.cu.la.ti.vos acerca del futuro de Delicious. Distintas filtraciones sobre los planes de Yahoo! –propietario de este popular servicio de marcadores-, llegaron a provocar en algunas personas cierta desconfianza sobre su mantenimiento y, por consiguiente, sobre el destino de los contenidos de sus usuarios. Este estado de opinión se extendió por Internet. La noticia, o lo que fuera, y los consiguientes rumores generados por la comunidad de usuarios de Delicious han tenido la virtud de producir una verdadera avalancha de comentarios, post, tweets…sobre el tema. Finalmente, la fuente oficial sobre este asunto, el blog de Delicious, el pasado 17 de diciembre, en un texto ambiguo, al menos dejaba claro que el servicio continuaba pero que cualquier decisión sobre su futuro dependía de una posible venta.

    En medio de este estado de cosas, Dolors Reig ha escrito un interesante post en el que habla de la utilidad del ‘bookmarking’ y sobre la conveniencia de importar los contenidos subidos a Delicious a otros lugares que ofrezcan un servicio equivalente.

     

    Puedes descargar tus marcadores de Delicious a tu espacio personal en gnoss.com

    Nosotros también creemos que la gente que tiene una buena colección de marcadores debería considerar seriamente esa posibilidad. Por ello, hemos desarrollado una herramienta para que un usuario de gnoss.com pueda descargarse sus marcadores de Delicious e integrarlos en su espacio personal.

    ¿Por qué gnoss.comgnoss.com es un espacio de redes sociales enlazadas que funciona sobre datos estructurados y enlazados; una plataforma web 3.0 pensada para aprender y trabajar que ofrece un amplio conjunto de servicios y utilidades integradas, pensadas para gestionar el conocimiento, trabajar colaborativamente y aprender de manera informal en un entorno de red. Entre estos servicios, los usuarios disponen de la posibilidad de gestionar marcadores que, en primera instancia, permite almacenar sus contenidos y clasificarlos. Este servicio dispone, además, de opciones que mejoran lo ofrecido hasta la fecha por Delicious. Las que enumero a continuación serían este conjunto de funciones avanzadas a las que me acabo de referir :

    • En gnoss.com, los marcadores no solo se etiquetan, también se categorizan, de forma que son más fáciles de recuperar y reutilizar. Esta utilidad facilita su uso en espacios de trabajo normalizados. Además, incrementa la eficacia de las estrategias de recuperación de la información basadas en razonamiento. En la actualidad, el usuario puede utilizar la búsqueda avanzada de gnoss.com; en breve, mejoraremos este servicio con un buscador facetado que permite alcanzar de manera eficaz resultados de búsqueda basados en el razonamiento.
    • Los marcadores se pueden llevar a un espacio de recursos personal –público y/o privado- y además –a diferencia de Delicious- compartir a voluntad con las comunidades de las que el usuario es miembro. Por ejemplo, una url en la que se encuentra un informe de prospectiva puede estar tanto en el espacio personal del usuario como en Innova o Prospectiva, dos comunidades en las que otros usuarios con intereses comunes la pueden disfrutar, comentar, valorar y compartir, a su vez, con otros espacios y redes.
    • Tanto en las comunidades como en el espacio personal de los usuarios de gnoss.com hablamos de algo más que de almacenar ‘bookmarks’: se pueden ‘subir’ todo tipo de archivos (Excel, Word, notas…) e incluso enviar ‘newsletters’ con los contenidos que se quieran destacar.
    • El usuario siempre puede rescatar sus datos para llevarlos donde desee a través de archivos RDF. Los datos en gnoss.com están estructurados y son enlazables. Para comprender las aplicaciones prácticas de este tipo de datos, os recomiendo recuperar el post gnoss.com enlaza sus datos con Freebase. Eso, en la práctica, significa que cuando etiqueto o categorizo cualquier clase de recurso, esos conceptos 'llaman' a sus homólogos en otros lugares de la Linked Open Data Web. En gnoss.com esto ocurre de momento con Freebase, pero ocurrirá con algunos otros lugares en breve.

     

    Consideramos que estas opciones añaden algunas ventajas dignas de consideración al servicio que ya ofrece Delicious. Como decíamos, gnoss.com es una herramienta para educar y trabajar, por eso creemos que puede resultar especialmente útil en entornos corporativos o educativos donde la gestión social del conocimiento y el trabajo colaborativo pueden producir ventajas notables. En ese sentido, nos parece que ofrece un espacio ampliado para la explotación social (educativa o laboral) del 'bookmarking'. Si quieres, ahora mismo puedes probar la aplicación para migrar marcadores de Delicious a gnoss.com.

     

    ENGLISH / ESPAÑOL

    In recent weeks there have been quite spe.cu.la.ti.ve comments about the future of Delicious. Various leaks about plans of Yahoo!- owner of this popular bookmarking service-, caused some suspicion about its maintenance and, therefore, the fate of its users’ contents. This state of opinion was spread over the Internet. The news, or whatever, and the resulting rumors generated by the Delicious user community, produced an avalanche of comments, post, tweets... on the subject. Finally, on December 17th, the official source on this subject, the Delicious blog, published an ambiguous post that at least made it clear that the servicewould continue. But any decision on its future depends on a possible sale.

    Amid this situation, Dolors Reig wrote an interesting post talking about the usefulness of bookmarking and the appropriateness of importing the Delicious content to other sites that offer a similar service.

     

    You can upload your Delicious bookmarks to your personal space on gnoss.com

    We also believe that people who have a good bookmark collection should seriously consider that possibility. Therefore, we developed a tool that allows gnoss.com users to upload their Delicious bookmarks and integrate them into their personal spaces.

    Why gnoss.com? gnoss.com is a space of linked social networks that works on structured and linked data. It’s a web 3.0 platform designed for learning and working that offers a wide range of integrated services and utilities for knowledge management, collaborative work and informal learning in a networking environment.  Among these services, users have the possibility of managing bookmarks, what allows them to store and classify their content. This service has also some options that improve what Delicious has offered so far.  Here is a set of some advanced features I’m talking about:

    • On gnoss.com, bookmarks are not only tagged, they are also categorized, so that they are easier to recover and reuse. This utility facilitates its use in standard workspaces. It also increases the effectiveness of strategies for information retrieval based on reasoning. At present, the user can use the advanced search on gnoss.com. In short, we’ll improve this service with a faceted search engine to achieve search results in an efficient way based on reason.
    • You can take your bookmarks to your personal space for resources- public and/or private-and if you want, you can also share them with the communities you’re a member of, unlike Delicious. For example, an url that contains a certain foresight report can be published on both the user's personal space and in communities, such as Innova or Prospectiva. These are two communities where other users with common interests can participate, comment, rate and share with other spaces and networks.
    • Both in the communities and gnoss.com users’ personal spaces, we’re talking about more than just store bookmarks: you can upload any file type (Excel, Word, notes...) and even send  newsletters with featured content.
    • As a gnoss.com user, you can always recover your data to take them wherever you want through RDF files. The gnoss.com data are structured and are linkable. To understand the practical applications of this data, I recommend that you read the post ‘gnoss.com links its data with Freebase’. In practice, that means that when you tag or categorize any kind of resource, those concepts ‘call’ to their counterparts elsewhere in the Open Linked Data Web. On gnoss.com this is currently happening with Freebase, but it will happen with some other places soon.

     

    We think that these options add some advantages to the existing Delicious service which are worth considering. As mentioned, gnoss.com is a tool to educate and work. So, we believe it can be especially useful in corporate or educational environments where the social knowledge management and collaborative work can produce remarkable benefits. In that sense, we feel that it offers an ample space for social exploitation (educational or employment) of bookmarking. If you want, right now you can test the application to migrate Delicious bookmarks to gnoss.com.

    ...