facetas

Watermelon: la web de datos enlazados en un eterno grafo de conocimiento > Grafos de conocimiento: Web semántica

    sortFiltrar Ordenar
    10 resultados

    Artículo

    /

    Publicado el 8.12.2015 por Equipo GNOSS

    Web Semántica y empresa. Ricardo Alonso Maturana. Entrevista de Corporate Excellence

    En este video realizado por Corporate Excellence, el think tank que agrupa a las principales empresas del país, y que investiga sobre el papel de los intangibles, la comunicación y la responsabilidad social de la empresa, Ricardo Alonso Maturana, fundador y creador de GNOSS reflexiona y explica el movimiento linked data que se está produciendo a nivel internacional y su importancia y transcendencia para en el mundo empresarial.

    El gran volumen de información que se genera cada día hace necesario desarrollar sistemas para la gestión de la información de una manera inteligente. A nivel internacional asistimos a un movimiento hacia la estructuración de datos abiertos y enlazables bajo la tecnología semántica, lo que se conoce como “Linked Open Data”. Linked Data o datos enlazados es una práctica que hace posible transitar de la actual web de documentos a una web de datos representados semánticamente. Permite concebir una organización como una única y global base de datos integrados, portables e interoperables. Datos empresariales que corresponden a contenidos (documentos, imágenes, videos, presentaciones, etc.) y a personas (clientes, proveedores, accionistas, etc.) se enlazan de forma mecánica, pertinente y útil, generando un ecosistema informativo que abre la vía al descubrimiento de nuevo conocimiento, a la aceleración del aprendizaje organizacional, y, aumentar las posibilidades y utilidades de uso de la información si esta se hace pública (Open).

    ...

    Artículo

    /

    Publicado el 8.12.2015 por Equipo GNOSS

    Aplicaciones de la Web Semántica. Ricardo Alonso Maturana

    En este video de 4 minutos, Ricardo Alonso Maturana, CEO de GNOSS incide en la explicación de los aspectos sustanciales de la Web Semántica desde el punto de vista de su posible aplicación para el usuario final.

    Para empezar define el concepto de ONTOLOGÍA en el campo de la Web Semántica. La ontología sería el modo en el que describimos una entidad del mundo: persona, lugar, recurso educativo, obra de arte, proteina, etc. Una ontología, una descripción de las entidades, requiere del consenso y del acuerdo previo. Aquí nos encontramos con la estandarización y normalización llevada a cabo W3C para fijar dichos acuerdos y consensos.

    La Web Semántica es un mundo lleno de promesas. La más sólida hace referencia al hecho de que si los datos "saben lo que son", podrán enlazarse con sentido con otros datos que residen en otros documentos, creando un gran hilo o grafo de conocimiento que nos permita ir navegando por el conocimiento distribuido en miles de documentos (linked data).

    La Web puede concebirse entonces como una gran base de datos global que permite recuperar la información desde intereses y puntos de vista diferentes.

    ...

    Artículo

    /

    Publicado el 8.12.2015 por Equipo GNOSS

    ¿Qué es la Web Semántica? Ricardo Alonso Maturana

    En este video de 7 minutos Ricardo Alonso Maturana, CEO de GNOSS, explica cuales son los fundamentos y principios de la Web Semántica que están en la base del desarrollo de la plataforma semántica y social GNOSS.

    La Web Semántica o Web de Datos es una web donde el modelo de publicación incorpora una serie de etiquetas que no solo permiten a las máquinas comprender el formato de los documentos sino su contenido, es decir, la descripción de las entidades de un documento. Para todos y cada uno de los documentos se genera un archivo RDF (Resource Description Framework) interpretable por una máquina. Las máquinas "comprenden" lo que las entidades significan, sus atributos y propiedades, y pueden enlazarlas conformando un Grafo de Conocimiento. 

    Algunas explotaciones de dicho grafo vendrían dadas por el desarrollo de sistemas más eficaces de recuperación de la información, la generación de contextos pertinentes o sistemas de recomendación. En un mundo donde el problema no es la escasez sino la sobreabundancia de información es preciso que las máquinas nos ayuden a mejorar esta recuperación de la información.

    Con GNOSS el planteamiento era testar y demostrar cómo era posible aplicar estos principios de la Web Semántica a una plataforma de software que diera solución a necesidades del usuario final. Por tanto, no se trata solo de un proyecto de computación o un proyecto de representación de datos siguiendo los estándares de la Web Semántica, sino más bien de un proyecto pensado para hacer cumplir las promesas de la Web Semántica a segmentos o sectores como la educación, la cultura, las universidades, el turismo, la sanidad, la banca, la justicia, etc. De esta forma se desarrollan en GNOSS un conjunto de utilidades con la mirada puesta en las necesidades del usuario final que tienen que ver con la generación de sistemas más eficaces de recuperación de la información (buscadores facetados), de descubrimiento de conocimiento, de generación de contextos pertinentes para la información buscada  y de sistemas de recomendación basados en la explotación del grafo social. Todo ello con el foco en el ahorro de tiempo, y por lo tanto costes, a empresas e instituciones.

    Unimooc aemprende 2013

     

    ...

    Pdf

    /

    Publicado el 7.12.2015 por Equipo GNOSS

    We present a case of exploitation of Linked Data about learning analytics research through innovative end-user applications built on GNOSS, a semantic and social software platform. It allows users to find and discover knowledge from two datasets, Learning Analytics Knowledge (LAK) and Educational Data Mining (EDM), and also reach some related external information thanks to the correlation with other datasets.

    We used four additional datasets, either to supplement information or to generate enriched contexts: Dbpedia, Geonames, DBLP-GNOSS (an index of scientific publications in Computer Science from DBLP) and DeustoTech Publications (publications of the Institute of Technology of the University of Deusto, and more specifically a selection of works by the DeustoTech Learning research unit). The featured applications are: faceted searches, enriched contexts, navigation through graphs and graphic visualization in charts or geographic maps. Faceted searches can be performed on three basic items: scientific publications, researchers (authors of the publications) and organizations in the learning analytics area.

    The search engine enables aggregated searches by different facets and summarization of results for each successive search. Analytics on data are provided firstly through that summarization given for results in every facet, and secondly through dynamic graphic representations for some attributes. Several charts are available to show the distribution of publications depending on different attributes (e.g. per publication type and year or per organization). The search results for organizations and researchers can be visualized in geographic maps.

    ...

    Categorías:

    Pdf

    /

    Publicado el 7.12.2015 por Equipo GNOSS

    Mismuseos.net muestra un caso de uso y consumo de datos enlazados (linked data) de museos, y de su valorización educativa, a través de aplicaciones semánticas pensadas para el usuario final.  Los buscadores facetados, la creación de contextos informativos pertinentes y de sistemas de recomendación proporcionan una mejor experiencia de uso a quien se acerca a la web. La propuesta consiste en crear un grafo unificado que permita expresar todos los datos existentes en los museos en el contexto de una Micro Nube de Datos Enlazados para cultura y educación. Para ello, no solo es preciso limpiar, organizar, unificar, ampliar y hibridar datos en un ámbito de conocimiento específico, sino desarrollar ontologías ampliadas o híbridas pensadas para conectar el mundo educativo y cultural en un ecosistema de conocimiento. El proyecto es accesible a través de la web http://mismuseos.net. Se trata de un proyecto en evolución.

    Mismuseos.net es un catálogo digital semántico compuesto por una colección de siete museos españoles (un Meta-Museo), donde los usuarios pueden navegar a través de más de 17.000 piezas de arte y 2.700 artistas. Los museos incorporados hasta ahora son: Museo Reina Sofía, Museo del Prado, Museo Sorolla, Museo de la Fundación Lázaro Galdiano, Museo del Greco, Museo de Bellas Artes de Bilbao, y Museo de la Biblioteca Nacional (Museo de la Biblioteca Nacional Española). Los conjuntos de datos utilizados proceden del conjunto de datos públicos (Open Data) de los museos españoles enriquecidos y enlazados con datos procedentes de la Linked Open Data Cloud (LOD): Dbpedia, Geonames, Didactalia (proyecto educativo con más de 60.000 recursos educativos en abierto), conformando contextos informativos y educativos de calidad.

    En el paper adjunto (en inglés) se describe en detalle los aspectos más significativos y singulares del proyecto.

     

    ...

    Categorías:

    Artículo

    /

    Publicado el 27.2.2013 por Ricardo Alonso Maturana

    Escenario Linked Open Data en industrias culturales

    La NISO (National Information Standards Organization) es una organización estadounidense sin ánimo de lucro fundada en 1939 dedicada a desarrollar, mantener  y publicar estándares técnicos  y normas técnicas relacionadas con el ámbito de las publices, los datos bibliográficos y la documentación bibliotecaria. Forman parte de esta organización las principales Universidades, Bibliotecas,  empresas tecnológicas , y  sociedades de investigación americanas. (Miembros)

    En septiembre de 2012,  la NISO dedicó su publicación trimestral (ISQ: Information Standards Quartely) a abordar el estado de la cuestión relativa a la aplicación de Linked Open Data en las instituciones de la memoria: museos, archivos y bibliotecas. Más de 60 páginas que compilan interesantes artículos sobre los aspectos teóricos y sobre todo prácticos de la cuestión.

    Todd Carpenter, director ejecutivo de NISO afirmaba:

     “El cambio que está acaeciendo hacia un modelo de datos vinculados (linked data) en bibliotecas y otras instituciones culturales, representa uno de los cambios más profundos que nuestra comunidad está enfrentando. A la vez que altera por completo la forma en que siempre hemos descrito y catalogado la información bibliográfica, ofrece enormes oportunidades para hacer esta información accesible y utilizable en contextos más amplios, en la comunidad  global que supone la web”.

    Este hecho confirma la importancia creciente que la aplicación de la web semántica, concretada en el movimiento linked data  está generando en las Instituciones de la Memoria estadounidenses , en el mundo anglosajón, y en el mundo en general.

    Del conjunto de artículos destacan aquellos que exponen experiencias prácticas que se están llevando a cabo en la aplicación de linked data en el sector cultural:

    • Jane Stevenson en su artículo Linked Lives describe el trabajo  que se está llevando a cabo para estructurar y vincular los datos relativos al conjunto de datos existente en los archivos del Reino Unido.
    • Seth van Hooland, Rubén Verborgh y Rik Van de Walle reflexionan en su artículo Joining the Linked Data Cloud in a Cost-Effective Manner sobre la necesidad de generar mecanismos previos que permitan abrir y vincular los datos de una forma efectiva y eficiente. Para ello muestran cómo herramientas interactivas de uso general de transformación de datos, como Google Refine, pueden ser utilizadas para realizar eficientemente la tarea previa de limpieza y refinamiento de datos necesaria que preceda a la apertura de los datos vinculados.
    • Ted Fons, Penka Jeff, y Linked Richard Wallis debaten en su artículo OCLC's Linked Data Initiative sobre el uso de Schema.org en WorldCat para que los datos de las bibliotecas sean más relevantes y visibles en la web.
    • Antoine Isaac, Clayphan Robina, y Haslhofer Bernhard explican en su artículo In Europeana: Moving to Linked Open Data cómo los metadatos para más de 23 millones de objetos culturales  que se están agregando en la gran iniciativa europea EUROPEANA, se están estructurando basándose en un modelo  con RDF.

    Además de estos artículos, es interesante la presentación que Jon Voss  realiza en su artículo Linked Open Data for Libraries, Archives, and Museums (LODLAM) State of Affairs,  del evento anual que se celebrará en junio de 2013 en Montreal donde se darán cita todos los proyectos relacionados con la aplicación de linked data a las instituciones de la memoria (LODLAM Summit) y será un excepcional escaparate para comprobar las experiencias más novedosas y el grado de avance en esta materia.

    Por último, es destacable dada su clara vinculación con el mundo educativo el trabajo presentado por Thomas Elliott, Sebastian Heath, John Muccigrosso. En este trabajo se informa sobre la creación del Linked Ancient World Data Institute, un organismo encargado de promover y propalar la los recursos digitales culturales-educativos relacionados con las disciplinas de los estudios clásicos gracias a las oportunidades que brinda los datos abiertos y enlazables.

    ...

    Categorías:

    Artículo

    /

    Publicado el 16.12.2011 por Ricardo Alonso Maturana

    ¿Hay alguna iniciativa que relacione la gestión de la identidad con los datos enlazados?

    Recientemente se ha presentado la versión 1.0 de WebID (Web Identification and Discovery: http://www.webidsupport.com/). Es una especificación de autenticación con linked data en su núcleo, producida por un grupo de trabajo del W3C: http://webid.info/spec.

    Existe una aparente contradicción entre un sistema de autorización y un sistema basado en datos enlazados abiertos: "Si pedimos a la gente que se autentique es porque hay algo que proteger, algo que cerrar." Esto no es necesariamente así, ya que se puede usar la autenticación para ser aún más abierto.Por ejemplo, la mayoría de los sitios web son de solo lectura, porque no se puede confiar en todos los usuarios de la web. Pero se podrían usar relaciones de tipo "amigos de amigos" para autorizar la escritura de audencias más amplias que las actuales.

    Una red social global, que además fuera distribuida, requiere que cada persona sea capaz de controlar su identidad, que esa identidad sea enlazable entre sitios, y que sea posible autenticarse globalmente. Con una autenticación distribuida es más sencillo que cada persona proteja sus recursos y defina su privacidad.

    Además, WebID se puede usar, usando un protocolo sencillo como HTTPS, para automatizar la autenticación de robots, que pueden ser agentes trabajando en representación del usuario, ayudándole en sus tareas diarias. 

    La autenticación WebID se basa en la existencia de certificados de usuario. Al igual que ya sucede en GNOSS, se asume que el usuario puede tener varias identidades (personal, trabajo, asociativo, etc.), cada una con su propio certificado.

    ...

    Artículo

    /

    Publicado el 14.12.2011 por Ricardo Alonso Maturana

    Explotación de metadatos embebidos: posicionamiento, recuperación de la información y generación de contextos

    En artículos anteriores de Watermelon he ido escribiendo algunas entradas sobre la web de los datos y su relación con nuevos sistemas de búsqueda. Estas entradas son:

    Además de las técnicas de posicionamiento tradicionalmente aplicadas al HTML (lo que podemos denominar SEO orgánica), Google, Bing y otros motores de búsqueda recomiendan el uso de metadatos embebidos en el HTML. El uso que dan a estos datos es doble. 

    • Primero, consiguen información más detallada del significado del documento, es decir, más semántica. Los metadatos embebidos definen expresamente que un texto es el nombre de una película, o las calorías de una receta, o el autor de un libro. Esto les permite presentar unos resultados de búsqueda más ajustados, e incluso que cada resultado tenga una presentación enriquecida con precios, valoraciones de los usuarios, autores, etc.
    • Segundo, los más importantes motores de búsqueda están promoviendo verticales de sus servicios, de manera que la búsqueda de recetas, viajes o libros pueda hacerse en páginas específicas. En dichas páginas se presentan facetas de búsqueda (por ejemplo, para filtrar recetas por ingrediente), que solo pueden ser obtenidas desde metadatos semánticos incrustados en el HTML.

    Ninguno de estos motores ha especificado aún el peso que confieren a la existencia de metadatos respecto a los otros parámetros conocidos de posicionamiento, ni siquiera al nivel cualitativo que suelen hacerlo. Sin embargo, la recomendación de uso está ahí y es clara.

    Pasemos ahora al asunto de los formatos. Google declara leer RDFa y microformatos, además de microdatos, el reciente estándar que promueve junto a Bing y Yahoo. Por otra parte, nos consta que indexa y posiciona el contenido RDF asociado al HTML.

    En nuestra opinión, una solución completa en este ámbito, que aporte el máximo valor de posicionamiento, además de las técnicas HTML habituales debería componerse de:

    • RDFa embebido, con vocabularios estándar para expresar las entidades reconocidas por los motores de búsqueda.
    • Microformatos, si la información se refiere a alguna de las entidades de las especificaciones aprobadas (como hCard para personas, o hCalendar para eventos), o a alguno de los más prometedores o exitosos borradores (como hProduct o hRecipe).
    • Microdatos, aún cuando la especificación, por su inmadurez, no llegue a cubrir el total de los datos expresados en los otros formatos.
    • RDF vinculado al HTML, que permita el enlace de datos y la construcción de contextos que enriquezcan la información.

    Esta es la solución que hemos puesto en marcha en www.mismuseos.net, por ejemplo y en otros lugares de GNOSS.

    Reconociendo la importancia del posicionamiento en buscadores de los recursos, el problema de la representación del conocimiento implícito en un recurso quedaría muy incompleta si no consideráramos a la vez otras explotaciones del mismo. Este es el asunto del que se ocupa la Web Semántica.

    La Web semántica incide en el problema de falta de significado comprensible por las máquinas en los documentos Web, que, como consecuencia, dificulta una mejor explotación de los datos y la construcción de una Web de los datos y Web de los datos enlazados. Esta mejora debería verse en aplicaciones o sistemas conocidos, como las búsquedas, asistentes personales o sistemas de recomendación; y en sistemas incipientes o por llegar, como  descubrimiento de datos, análisis de tendencias, estudios emocionales, identidad digital, etc.

    La Web Semántica resultará tanto más útil en la medida en la que las máquinas comprendan de un modo más preciso y profundo el significado de los recursos, lo que depende críticamente de la expresividad de los formatos de representación del conocimiento que utilicemos y, en este sentido, OWL-RDF no tienen competencia. Si lo que queremos es desarrollar un sistema de recuperación de la información eficiente e intuitivo, un sistema de generación de contextos pertinentes y poco ambiguos, o un sistema de recomendación inteligente, los microformatos y microdatos resultarán claramente insuficientes para muchísimas explotaciones verticales. Esto refuerza lo que hemos denominado un poco más arriba “solución completa en este ámbito”, pero en cierto modo invierte el orden de las prioridades: convendrá utilizar un estándar ontológico o vocabulario en primer lugar, para reforzarlo con microdatos y microformatos cuando de comunicarse con los buscadores se trate.

    Imagen vía: https://promocionmusical.es/

    ...

    Artículo

    /

    Publicado el 14.6.2010 por Ricardo Alonso Maturana

    Social data; web semántica; y datos abiertos y enlazados: ¡knowledge internet! / Social data, semantic web, opend and linked data: knowledge internet!

    ENGLISH VERSION/ TEXTO EN ESPAÑOL

    El proceso general de digitalización de la realidad está generando una capa de representación de la totalidad de las cosas y personas, pero también, y esto resulta especialmente relevante, de sus relaciones. A, por ejemplo, ‘Juan Rulfo’ y, pongamos, ‘El llano en llamas’ les une el hecho de que el primero es el AUTOR del segundo, lo que queda expresado mediante la proposición: ‘Juan Rulfo es el autor de ‘El llano en llamas’ Como veremos, la web semántica posibilita computar (deducir, razonar, buscar...) con proposiciones de ese tipo, lo que ofrece grandes posibilidades. Cuando disponemos de los datos y de sus relaciones organizados de acuerdo con los lenguajes de la web semántica (de los que he hablado en ¿Mis datos en manos de terceros? Ventajas de expresar contenidos con estándares de la web semántica), decimos que “los datos están estructurados". Por desgracia, la mayor parte de los datos de la web no están expresados de ese modo. Sin embargo también están estructurados, aunque no del modo en el que lo entienden las máquinas. Buena parte del trabajo consiste, precisamente, en convertir nuestros documentos HTML, .doc, etc...en datos estructurados. En cualquier caso y en buena medida, todos nuestros datos los estamos organizando de forma útil para las personas gracias a las redes sociales. De hecho, construir una web más inteligente parece la condición necesaria para manejar y utilizar de manera eficiente esa enorme y creciente cantidad de datos que está produciendo la actividad humana en las redes. A esta clase de datos categorizados y organizados gracias al trabajo social de las redes les llamaremos Social Data.

     

    Social Data

    Habitualmente los Social Data incorporan el punto de vista de las personas que los editan, o bien, dependiendo de su naturaleza, el de un grupo. Esta información que añade información a una información original suele conocerse con el nombre de metadatos. Los Social Data son, por tanto, metadatos construidos gracias al trabajo social en la red de las personas. Las colecciones de metadatos más habituales en las redes sociales son conocidas por el nombre de folksonomías, que expresan el punto de vista personal o la perspectiva personal con relación a una información o documento determinado. En ocasiones, las redes sociales, en especial cuando se trata de redes profesionales, incluyen puntos de vista más normativos para calificar la información: las taxonomías o los tesauros. La acción de asignar un determinado metadato a una información o documento se conoce con el nombre de etiquetar. El etiquetado social es la fuente primaria de producción de Social Data.

     

    Google es demasiado idiota para entender lo que la gente necesita

    Dado que la racionalidad humana tiene un carácter intencional o finalista, los Social Data aportan una información muy relevante a la hora de recuperar la información con una determinada finalidad o intención. Este es el modo general en el que los humanos desean recuperar información, pero no el modo en el que resuelven este problema los sistemas y buscadores. Pensemos por ejemplo en nuestra experiencia de búsqueda y recuperación de información con Google, el buscador más extendido. Google nos ofrece como resultado de una búsqueda una, habitualmente larga, lista de resultados o posibilidades ordenados en función de la relevancia que atribuye a cada uno de ellos. Eso no estaría mal en primera instancia, pero lamentablemente es todo lo que podemos hacer con Google: no podemos hacer una segunda pregunta relacionada con la primera. Imaginemos que me gustaría conocer qué hay sobre ‘buscadores semánticos que utilicen procesamiento del lenguaje natural y, además, lógica borrosa, escrito por mujeres en 2008, en alguna universidad de California o en San Francisco y alrededores’. Podemos intentarlo introduciendo en la barra del buscador "buscador+semántico+procesamiento+del+lenguaje+natural+lógica+borrosa+san+francisco+2008", pero como puede imaginar casi cualquiera el resultado puede resultar sorprendente. En todo caso, a nadie se nos ocurriría utilizar ‘mujer’ o ‘alrededores’ o ‘alguna universidad de california’ como criterio de recuperación de información, porque conociendo a Google no resulta una expectativa razonable.

     

    Google padece el síndrome del savant o del sabio. Es un idiota con algunas capacidades muy desarrolladas, un idiota inteligente capaz de comparar todos los caracteres de un texto con la secuencia que le proponemos, pero incapaz de entender lo que le solicitamos. En nuestro ejemplo, las categorías ‘documentos escritos por mujeres’ o ‘producidos en una universidad de california’ son difícilmente traducibles a una secuencia de caracteres que ofrezca la perspectiva de un conjunto de resultados aceptable. ¿Por qué no podemos interrogar a nuestro buscador sucesivamente, tal y como hacemos en nuestra vida ordinaria, para resolver problemas que requieren manejar grandes cantidades de información? Nuestro cerebro no está diseñado para manejar enormes cantidades de información, sino relativamente poca pero significativa; por eso nuestra razón produce como resultado de nuestras indagaciones largas listas ordenadas por relevancia, sino que opera estableciendo sucesivas condiciones o restricciones crecientes que nos conducen a un resultado o a unos pocos cuyo valor relativo pueda establecerse de un sólo golpe de vista. En una partida de ajedrez, nadie en su sano juicio consideraría una estrategia razonable el ordenar en una lista en función de sus posibilidades de conducir a la victoria, todas las posibles jugadas vinculadas con una posición dada de las fichas. Obviamente lo puede hacer Deep Blue, pero los humanos carecen de esa capacidad para computar. A cambio ‘saben lo que quieren’, lo que les permite considerar sólo la información útil para ese fin. 

     

    Contextos de interpretación de la información que pueden ser entendidos por las máquinas

    Los Social Data añaden un contexto explícito de interpretación a cualquier información o documento, por lo que constituyen el elemento social de la dimensión semántica de la web. La semántica de la web se construye según vemos social o colectivamente y esa información es útil porque las personas no son demasiado diferentes. 

    Una ontología concreta expresa un modo de categorizar, modelar o representar nuestro conocimiento con relación a un campo, entidad u objeto determinado. Lo normal es que las ontologías representen las entidades, que en nuestro lenguaje natural son denotadas mediante los nombres propios y comunes, y sus relaciones. Como lo hacemos en un lenguaje que puede ser ‘comprendido’ por las máquinas, éstas pueden entenderse entre sí (interoperar o intercambiar datos con independencia de los formatos de almacenamiento y de las aplicaciones de gestión), pero también ‘entendernos’ e interactuar con nosotros de manera inteligente; también podemos verlo al revés, gracias a las convenciones de la web semántica nosotros podemos conversar con ellas utilizando nuestras capacidades de un modo natural, esto es, podemos razonar con ellas. ¡Esto representa una gran oportunidad para todos, que se añade a las que ofrecía el etiquetado social!

    En la práctica, hay muchas cosas que necesitan conocer los sistemas, especialmente en el contexto de una red social, para poder comunicarse con sentido con las personas y para que interoperen con otros sistemas. Para que esto sea realmente posible,  precisamos que todos ellos hablen con las mismas palabras, esto es, que utilicen las mismas ontologías. A estas ontologías sobre las que existe un acuerdo (que puede ser universal, muy amplio o...menos amplio) las denominamos vocabularios. Algunos vocabularios de carácter muy general resultan especialmente importantes. Dado que los sistemas funcionan sobre la base de documentos digitalizados y descripciones de personas, las ontologías que representan nuestra idea general de lo que es un recurso o documento digital, las que modelan la descripción de una persona y aquellas que describen un sistema de categorías o tesauro resultan especialmente importantes porque permiten conectar a la mayor parte de las entidades que existen en la webEllas representan del modo más inclusivo a casi cualquier contenido que puede encontrarse en internet y por ello hacen que las máquinas y los sistemas puedan interoperar entre sí con pocas restricciones.

    La web semántica puede definirse como el conjunto de convenciones que hace posible estructurar los datos contenidos en los distintos formatos de documentos (que generalmente están desestructurados, lo que en realidad significa que no pueden interpretarlos las máquinas), con el fin de que tanto las máquinas como las personas puedan interactuar (interoperar) entre sí de un modo más humanizado, intuitivo, eficiente y satisfactorio que lo que sucedía con la web basada en la computación. Es la base para el desarrollo de una web más inteligente y...autoconsciente.

     

    Open Data y Linked Data

    Open Data designa una filosofía y práctica que persigue que determinados datos estén disponibles de forma libre a todo el mundo, sin restricciones de copyright, patentes u otros mecanismos de control. Los datos pueden estar abiertos y, cuando no se utilizan los estándares de la web semántica, no resultar aprovechables por terceros.

    Aún cuando los datos de una determinada aplicación web se expresen de acuerdo con los estándares de la web semántica caben diversas posibilidades:

    • Los datos pueden ser abiertos, pero no estar enlazados
    • Los datos pueden ser enlazados, pero no estar abiertos

    La posibilidad de datos que sean tanto abiertos como enlazados es cada vez más viable, tanto desde el punto de vista tecnológico, como de negocio. La Web Semántica sólo puede funcionar con datos que sean tanto abiertos como enlazados. Nos referimos a esto en un post anterior. En esta entrada, la figura representa el grafo del conjunto de iniciativas y aplicaciones enlazadas que constituyen la Linked Data Web o de la Web de los datos abiertos y enlazados

    Linked Data Web implica una manera de publicar contenidos en la Web que:

    •  favorece la reutilización
    •  reduce la redundancia
    •  maximiza la conectividad (real y potencial)
    •  hace posible el “efecto red” a la hora de añadir valor a los datos

     

    En definitiva:                                                    Linked Data = Open Data + Open Standars

     

    La web semántica tiene ya un tamaño considerable, que irá aumentando a medida en la que se vayan estructurando los datos de más espacios de la web (a la par que se crean espacios con los datos ya estructurados). Los datos estructurados permiten estrategias de búsqueda que en lugar de ordenar una lista de posibles soluciones en función de la relevancia (en lugar de obligar a los humanos a entender la lógica de las máquinas), permite ir razonando hasta localizar el resultado o pequeño número de resultados que responde a las restricciones o condiciones del razonamiento. En definitiva, permiten las búsquedas basadas en el razonamiento o búsquedas facetadas.

    Por otro lado, la web semántica posibilita ofrecer como resultado de una determinada búsqueda el conjunto de contextos relacionados con ella, como por ejemplo personas relacionadas, documentos relacionados, imágenes relacionas, etiquetas o metadatos relacionados, etc…Esto posibilita el poder desarrollar y evolucionar las búsquedas desde la perspectiva humana de la exploración.

    En resumen, Linked Data Web sería:

    •          Base de datos global
    •          Diseñada para que las máquinas ‘hablen’ y ‘piensen’ al modo humano·        
    •          Los objetos que maneja y conecta representan cosas (como personas, películas, imágenes, libros, plantas, etc…, esto es, cualquier cosa que podamos representar mediante una ontología) y no, como ocurre en la web HTML, documentos (páginas web)
    •          Los enlaces representan relaciones entre entidades o 'cosas'
    •          Para ello se precisa de un alto grado de estructuración en las descripciones de esas entidades
    •          Es preciso, por tanto, que la semántica de las cosas sea explícita

    Las tecnologías o estándares asociados con su desarrollo serían: URIs, HTTP, RDF, RDFS/OWL

     

    El siguiente grafo muestra el conjunto de iniciativas que forman parte de la web semántica y sus diferentes grados de interacción

     

     

     

    Imagen: linkeddata.org

     

    www.gnoss.com es un sistema de redes sociales enlazadas cuya ontología se expresa de acuerdo con los estándares de la web semántica. gnoss.com, además de ser un espacio Open Data, es un espacio de Linked Data, esto es, sus datos son enlazables, interpretables y expresables desde cualquier web que trabaje dentro de los estándares de la web semántica. Pero la web semántica son, en el fondo, social data pues la semántica expresa siempre un acuerdo formal o informal entre personas: no hay posibilidades de entendernos sin una idea común acerca del significado de las palabras. Esta semántica se va construyendo, es un ‘work in progress’ que se puede expresar de diferentes modo, pero que finalmente, dentro de la lógica evolutiva de la web semántica, tiende a concretarse en vocabularios estándar. Estos estándares son los que en el corto y medio plazo se irán imponiendo para resolver los profundos problemas de aislamiento a los que nos somete el no hacerlo así. Los sistemas de salud, las administraciones públicas y las grandes corporaciones están asumiendo la necesidad de trabajar con ellos si quieren aprovechar el potencial de sus sistemas y de la relación entre ellos y las personas. Poco a poco lo irán haciendo el resto de las empresas y personas. 

     

    ENGLISH VERSION/ TEXTO EN ESPAÑOL 

     

    The general process of reality digitalization of is creating a layer of representation of all things and people, but also of their relationships, and this is particularly important. For example, ‘Juan Rulfo’ and, let’s say, ‘The Burning Plain and Other Stories’ are linked by the fact that the first one is the author of the second one. This is expressed by the proposition: “Juan Rulfo is the author of The Burning Plain”. As we shall see, the semantic Web enables compute (deduce, reason, search...) with proposals of this kind, which offers great possibilities. When you have the data and their relationships organized according to semantic web languages (I have spoken about them in My data in the hands of others? Advantages of expressing content with semantic web standards), we say that “data are structured”. Unfortunately, most web data are not expressed in that way. However, they are structured too, but not in the way that the machines understand. Much of the work involves specifically converting our HTML, doc, etc. documents into structured data. In any case and to a large extend, we are organizing all our data in a useful way for people thanks to social networks. In fact, building a smarter web seems the necessary condition to efficiently manage and use the huge and growing amount of data that human activity is generating on the networks. This kind of data which are categorized and organized through the social work on social networks will be called Social Data.

     

    Social Data

    Social Data usually incorporate the perspective of people who edit them, or, depending on their nature, that of a group. This information that adds information to original information is generally known as metadata. Therefore, Social Data are metadata built thanks to social work in the people network. The most common metadata collections on social networks are known by the name of folksonomies, which express a personal view or personal perspective in relation to a particular information or document. Social networks, especially when it comes to professional networks, sometimes include regulatory viewpoints to describe the information: taxonomies or thesauri. The action of assigning a particular metadata to some information or to a document is known as tagging. Social tagging is the primary source of Social Data production.


    Google is too stupid to understand what people need

    Given that human rationality has an intentional or finalist nature, the Social Data provide very important information when retrieving information with a specific purpose or intent. This is the general way in which humans want to retrieve information, but not the way in which systems and search engines solve this problem. For instance, let’s consider our experience of information search and retrieval with Google, the most widespread search engine. As a result of a search, Google shows us a typically long list of potential results sorted according to the relevance it gives to each of them. At first, that would not be a bad option, but unfortunately that’s all we can do with Google: we cannot ask a second question related to the first one. Imagine that  you would like to know what’s on ‘semantic search engine using natural language processing, and also fuzzy logic, written by women in 2008 in any university in California or in San Francisco and surroundings’. We can try entering into the search bar: "search+engine+semantic+processing+of+natural+language+fuzzy+logic+san+Francisco+2008". But almost anyone can imagine that the result might be rather surprising. In any case, no one would use ‘woman’ or ‘surroundings’ or ‘any university of california’ as a criterion for information retrieval, because it is not a reasonable expectation when you know Google.

    Google has the savant syndrome. It’s an idiot with some highly developed skills, an intelligent fool that can compare all the characters in a text with the sequence that we are proposing, but unable to understand what we are asking. In our example, the categories ‘documents written by women’ or ‘produced in any university of california’ are difficult to translate into a sequence of characters that offers the prospect of an acceptable result set. Why can’t we query our search engine successively, as we do in our ordinary life, to solve problems that require handling large amounts of information?

    Our brain is not designed to handle huge amounts of information, but relatively small, but significant. That’s why our reason doesn’t produce long lists sorted by relevance as a result from our inquiries, but it operates establishing successive conditions or restrictions that lead to one result or to a few ones of which relative value can be established at a glance. In a game of chess, nobody in his right mind would consider as a reasonable strategy ordering in a list, according to their ability to lead to victory, all the possible moves associated with a given position of the chess pieces. Obviously, Deep Blue can do it, but humans lack the ability to compute. In turn, they ‘know what they want’, what allows them to consider only the relevant information for their purpose.

     

    Contexts of information interpretation that can be understood by machines

    Social Data add an explicit context of interpretation to any information or document, so they are the social element of the semantic dimension of the web. The Semantic Web is built according to social or collectively perspective and that information is useful because people are not too different.

    A specific ontology expresses a way of categorizing, modeling or representing our knowledge in relation to a determined field, entity or object. Ontologies normally represent the entities, which in our natural language are denoted by proper and common names, and their relationships. As we do it in language which can be ‘understood’ by the machines, these ones can understand each other (interoperate or interchange data regardless of storage formats and management applications), but also ‘understand’ us and interact with us intelligently. We can also see the opposite: thanks to the conventions of the Semantic Web, we can talk with them using our skills in a natural way, that is, we can reason with them. This represents a great opportunity for all, in addition to those offered by the social tagging!

    In practice, there are many things systems need to know, especially in the context of a social network, to communicate meaningfully with people and to interoperate with other systems. For this to be really possible, they all must speak the same words, that is, using the same ontologies. These ontologies for which there is an agreement (which may be universal, broad or… narrower) are called vocabularies. Some very general vocabularies are particularly important. As the systems operate on the basis of digital documents and descriptions of people, the following ontologies related to them are specially important because they allow you to connect most of the entities that exist on the web: a) ontologies that represent our general idea about a resource or a digital document, b) the ones that shape the description of a person and c) those that describe a system of categories or thesaurus. They represent the most inclusive way to almost any content that can be found on the Internet. Thus, they make the machines and systems to interoperate with each other with few restrictions.

    The Semantic Web can be defined as the set of conventions that makes it possible to structure the data in different document formats (which are usually unstructured, what actually means that machines can’t interpret them), so that both machines and people can interact (interoperate) with each other in a more humane, intuitive, efficient and satisfying way than what happened with the computer-based web. This is the basis for the development of a more intelligent and… self-aware web.

     

    Open Data and Linked Data

    Open Data means a philosophy and practice that pursues that certain data are freely available to everyone without restrictions of copyright, patents or other control mechanisms. Data can be open but not usable by others, when semantic web standards aren’t used.

    Even when data from a particular web application are expressed in accordance with the standards of the Semantic Web, there are several possibilities:

    • Data can be open, but not be linked
    • Data can be linked, but not be open

     The possibility of data being both open and linked is increasingly viable, both from a technological and business standpoint. The Semantic Web can only work with data that are both open and linked. I referred to this in a previous post. The below figure represents the graph of all the linked initiatives and applications which form the Linked Data Web.

    Linked Data Web involves a way to publish content on the Web that:

    • promotes reuse
    • reduces redundancy
    • maximizes connectivity (real and potential)
    • makes possible the ‘network effect’ when it comes to adding value to data

    In short:  Linked Data = Open Data + Open Standars

    The Semantic Web has already a considerable size, which will increase as data from more web sites get structured (at the same time that spaces with already structured data are being created). Structured data allow search strategies to reason until they reach the result or small number of results according to restrictions or conditions of reasoning, instead of ordering a list of possible solutions depending on the relevance (rather than forcing humans to understand the logic of the machines). In short, they allow searches based on the reasoning or faceted search.

    On the other hand, the semantic web enables to offer as a result of a particular search a context set associated with it, such as related people, documents, images, tags or metadata, etc... This makes it possible to develop and evolve search from the human exploration perspective.

    To sum up, Linked Data Web would be:

    • Global database
    • Disigned for machines to ‘talk’ and ‘think’ the human way.
    • Objects that it manages and connects represent things (like people, movies, images, books, plants, etc…, that is, anything that can be represented by an ontology), but not documents (web pages) as it occurred in the HTML web
    • Links represent relations between entities or ‘things’.
    • This requires a high degree of structure in the descriptions of these entities.
    • Therefore, it is necessary that the semantics of things is explicit.

    Technologies or standards associated with its development would be: URIs, HTTP, RDF, RDFS/OWL

    The following graph shows the set of initiatives that are part of the semantic web and their different degrees of interaction

     

    Image: linkeddata.org
     

     www.gnoss.com is a system of linked social networks whose ontology is expressed in accordance with the standards of the semantic web. gnoss.com, besides being an Open Data space, is a Linked Data space, that is, its data can be linked, interpreted and expressed by any site that works within the standards of the semantic web. But the semantic web is in the background, social data, since the semantics expresses always a formal or informal agreement between people: there is no chance of understanding without a common idea of the meaning of words. This semantics is being built, is a work in progress which can be expressed in different ways, but finally tends to be translated into standard vocabularies, within the evolutionary logic of the Semantic Web. Those standards are the ones that will go imposing in the short and medium term to solve the deep problems of isolation generated when not doing it so. Health systems, public administrations and large corporations are taking the need to work with them if they want to exploit the potential of their systems and the relationship between them and people. The rest of the companies and individuals will be doing it little by little.

     

     

     

    ...

    Artículo

    /

    Publicado el 26.5.2010 por Ricardo Alonso Maturana

    ¿Mis datos en manos de terceros? Ventajas de expresar contenidos con estándares de la web semántica/ My data in third parties’ hands? Advantages of expressing content with semantic web standards

    ENGLISH VERSION/ TEXTO EN ESPAÑOL

    gnoss.com es un espacio de redes sociales que pueden enlazarse Open Data, lo que significa que sus datos están disponibles, para cualquiera que lo desee, en un formato estándar. Para ello, los datos en gnoss se expresan en una clase de ficheros denominados RDF (Resource Description Framework), que son uno de los estándares de W3C para la web semántica. En nuestro caso, un RDF es un modelo semántico de descripción de un recurso concreto cuya forma viene determinada en un lenguaje de marcado o etiquetado denominado OWL (Ontology Web Language).

    Una ontología concreta expresa un modo de categorizar, modelar o representar nuestro conocimiento con relación a un campo, entidad u objeto determinado. Lo normal es que las ontologías representen las entidades, que en nuestro lenguaje natural son denotadas mediante los nombre propios y comunes, y sus relaciones. Como lo hacemos en un lenguaje que puede ser "comprendido" por las máquinas, éstas pueden "entendernos" a nosotros o, visto al revés, nosotros podemos conversar con ellas utilizando nuestras capacidades de un modo natural, esto es, podemos razonar con ellas. ¡Y esto representa una gran oportunidad para todos!

    El problema es que con las ontologías pasa lo mismo que con nuestras palabras: no todo el mundo les atribuye el mismo significado. En el mundo offline casi cualquier acuerdo entre personas termina derivando en una cuestión terminológica. Cuando firmamos un acuerdo o un contrato, nos tomamos mucho tiempo para especificar que significa en concreto cada palabra. De lo contrario, pueden surgir conflictos que precisan de alguien que interprete el texto desde una posición neutral, esto es, que ejerza un arbitraje. Lo mismo pasa casi con cualquier código o sistema de normas. ¡Por eso el lenguaje jurídico se parece tanto al de los informáticos, aunque ellos no lo sepan!

    Con los sistemas y las máquinas sucede lo mismo: si no utilizan la misma ontología, si no atribuyen el mismo significado y relaciones a una entidad, no pueden entenderse; y, si no se entienden, no pueden comunicarse, lo que en términos un poco más técnicos quiere decir que no pueden interoperar. Imaginemos, por ejemplo, que para un sistema la ontología de "persona" (el conjunto mínimo de atributos que permite a un sistema identificar a un humano en concreto) son: nombre, apellido del padre, apellido de la madre y fecha de nacimiento. Parece un descripción muy lógica e intituitiva, pero no se entenderá con otra que la describa en estos términos: nombre, primer apellido, segundo apellido, fecha de nacimiento y mucho menos con una tercera que lo haga de este modo: first name, last name, etc... Los sistemas pueden tener sus datos abiertos, pero como no se entiendan...Para ello se necesitan acuerdos, formas normalizadas de definir una determinada entidad.

    Hay muchas cosas que necesitan conocer los sistemas, especialmente en el contexto de una red social, para poder comunicarse con sentido con las personas: para ser "inteligentes"; y si, además, queremos que se entiendan e interoperen con otros sistemas, precisamos que todos ellos hablen con las mismas palabras, esto es, que utilicen las mismas ontologías. A estas ontologías sobre las que existe un acuerdo (que puede ser universal, muy amplio o...menos amplio) las denominamos vocabularios. Algunos vocabularios de carácter muy general resultan especialmente importantes. Dado que los sistemas funcionan sobre la base de documentos digitalizados y descripciones de personas, las ontologías que representan nuestra idea general de lo que es un recurso o documento digital, las que modelan la descripción de una persona y aquellas que describen un sistema de categorías o tesauro resultan especialmente importantes. Ellas representan del modo más inclusivo a casi cualquier contenido que puede encontrarse en internet y por ello hacen que las máquinas y los sistemas puedan interoperar entre sí. Por supuesto, existen muchas más ontologías y vocabularios, generalmente pertenecientes a dominios más concretos o sectoriales (como las que representan el conjunto de patologías clínicas, por ejemplo). 

     

    ONTOLOGÍA DE GNOSS.COM

    La ontología de gnoss.com la hemos ido construyendo nosotros, lo que quiere decir que no nos hemos fijado en el modo en el que otras personas o grupos entendían tal o cual concepto, objeto o cosa. Responde a nuestra visión del mundo. El problema en este caso radica en que, aunque se trata de una ontología abierta, las personas que la interpreten deben asumir nuestra visión para poder expresar nuestros datos en sus páginas web. Evidentemente se trata de un gran problema. Aunque no paramos de, por así decirlo, "hablar", lo hacemos en un lenguaje privado. Esto suele ser así en los albores de una tecnología, cuando no se conocen bien ni sus límites, ni sus posibilidades.

    En efecto, la web semántica es algo muy nuevo y no existían acuerdos previos sobre cómo describir un tesauro o una patología clínica, del mismo modo que durante muchos años no existía un estándar que regulara el sentido de la rosca de los tornillos. Como es sabido, la estandarización industrial corrió de la mano de una oficina de estandarización (la ISO), pues bien, la de la web corre a cargo de W3C. Somos conscientes de la importancia de trabajar con estándares ontológicos si realmente queremos no sólo que nuestros datos estén abiertos y disponibles, sino que sean de verdad enlazables desde otras aplicaciones.

    Como ya hemos señalado, W3C ha avanzado en la estandarización de algunas ontologías muy generales. Como son muy generales, resultan de aprovechamiento casi universal y por tanto muy útiles para resolver problemas de interoperabilidad de muy amplio espectro. Estas ontologías se refieren a:

    ·           El modo en el que debemos describir a una persona para que los sistemas sepan que se trata de una persona (FOAF).

    ·           El modo en el que deben estar descritos la información y los recursos en una red social, comunidad o grupo de trabajo colaborativo para que puedan ser interpretados y mostrados desde otra; esto es, el modo en el que debemos describir la información para que las redes sociales puedan intercambiar información o interoperar semánticamente sobre la base del conocimiento o interpretación automática de la misma por parte de los sistemas (SIOC).

    ·           El modo en el que organizamos o categorizamos la información (el modo en el que creamos tesauros o taxonomías) (SKOS).

    En gnoss.com estamos migrando nuestra ontología con el fin de expresarla de acuerdo con estos estándares. Este trabajo estará finalizado para principios de junio de 2010 (en una semana aproximadamente), con lo que gnoss.com, además de ser un espacio Open Data, será un espacio de Linking Data, esto es, sus datos serán enlazables, interpretables y expresables desde cualquier web que trabaje dentro de los estándares de la web semántica. Estos estándares son los que en el corto y medio plazo se irán imponiendo para resolver los profundos problemas de aislamiento a los que nos somete el no hacerlo así. Los sistemas de salud, las administraciones públicas y las grandes corporaciones están asumiendo la necesidad de trabajar con ellos si quieren aprovechar el potencial de sus sistemas y de la relación entre ellos y las personas. Poco a poco lo irán haciendo el resto de las empresas y personas. Aparte de poder disponer de mis datos PARA SIEMPRE en forma segura, el hecho de que las máquinas puedan interpretar documentos en “modo casi humano” presenta grandes ventajas cuando de lo que se trata de buscar o rescatar la información o de descubrir relaciones ocultas en ella.

     

    LINKED DATA vs OPEN SOURCE: POR QUÉ LAS ALTERNATIVAS BASADAS EN DATOS ABIERTOS SON SUPERIORES A LAS DE CÓDIGO ABIERTO

    Jon Bishop ofrece en 9 Free Ning Alternatives And Some Open Source Solutions un resumen de las alternativas gratuitas a Ning sobre plataformas de terceros. De muchas de ellas, y de las dificultades de trasladar los contenidos a dichas plataformas ya hemos hablado. El post propone también un conjunto de soluciones Open Source (Código Abierto): BuddyPress [Message from Buddypress]Elgg - [Message from Elgg]; PliggDolphinLovdByLess; InsoshiAstrospaces. Algunas personas han reflexionado, como nosotros, sobre los riesgos de poner los datos en manos de terceros y han llegado a la conclusión de que la solución consiste en ser propietario de la plataforma y de su código.

    Se trata de una alternativa aparentemente razonable porque evitaría esa dependencia  de terceros que tantos quebraderos de cabeza nos puede llegar a dar, como se ha visto. Ahora bien, para empezar, construir una plataforma con algunas de las soluciones Open Source que existen en el mercado y que acabamos de enumerar, siempre será un trabajo y…la comunidad de desarrolladores podría abandonar en algún momento su mantenimiento. Es un riesgo, pero menor que el que supone que nuestros datos se queden en un silo del que no podamos sacarlo, pensarán algunos. Aparte del hecho de que deberemos en algún momento superar la cultura del bricolaje informático, parece necesario expresar con toda claridad algo que con frecuencia queda oculto en el debate OpenSource: el problema no está en el código, está en los datos, en poder interoperar con ellos y no simplemente en tenerlos.

    Mis datos abiertos se pueden expresar en otros lugares, a través de otros ‘frames’ y, sobre todo, pueden conectarse con otros para producir una experiencia de conocimiento más expresiva, evolutiva y extensible. Porque una solución de datos abiertos tiene más extensibilidad, flexibilidad y expresividad que cualquier otra que consideremos. El código es infoestructura y por tanto tratar con él podríamos considerarlo como fontanería o bricolaje de la web. Es el equivalente a la caja de herramientas del Ford T (entonces no había muchos talleres y se asumía que el que se comprara un coche debería dedicar un buen rato a mantenerlo y, eventualmente a repararlo). Hoy día a nadie se le pasa por la cabeza que tendrá que meter mano el el motor de su coche. Pues bien, del mismo modo que no se nos ocurre, cuando compramos un piso, picar la pared  para comprobar de qué están hechas las cañerías, tampoco nos debería preocupar el código, sino sólo el hecho de que nuestros datos estén fácilmente disponibles cuando los necesite y para lo que los necesite.

    Por supuesto, las soluciones menos recomendables son aquellas cuyos datos están cerrados y que, además, no son Open Source (como lamentablemente es el caso de Ning, y…de la mayor parte de las redes sociales, incluidas las muy populares); en segundo lugar, en esta lista que va de menos a más en "recomendabilidad", estarían las redes verticales construidas con Código Abierto; pero sin duda, las mejores o más recomendables serían aquellas cuyos datos están abiertos y pueden ser enlazables, esto es, las soluciones expresadas de acuerdo con los estándares de la web semántica que incluyen, a su vez, sistemas de representación del conocimiento u ontologías que son también estándar.

    gnoss.com representa una solución de esa naturaleza. Es un espacio para alojar redes cuyos datos pueden conectarse con otras redes, por supuesto de las que están albergadas dentro del propio gnoss.com, pero eventualmente también con aquellas otras que estén fuera, pero que compartan la misma ontología. De las que aparecen en la gráfica de abajo, Twine, la solución conceptualmente más próxima a la nuestra, ha sido recientemente comprada por Evri y está en trance de extinción.

    Conviene hacerlo notar una vez más: ¡Son los datos! Si de algo debemos preocuparnos es de ser los absolutos propietarios de los datos; una vez asegurado esto, lo demás debería darnos un poco lo mismo. Las gráficas de abajo expresan con claridad la superioridad de las soluciones Linked Open Data con relación a cualquier otra que podamos considerar y, en particular, las ventajas asociadas con nuestro proyecto.

    Open Linked Data es la solución más escalable y flexible.

      

    Y la más expresiva y extensible

    • Expresividad: es la medida de capacidad de un lenguaje para definir la semántica de un dominio de conocimiento, esto es, para representar conceptos y relaciones entre conceptos.
    • Extensibilidad: es la medida de capacidad de un lenguaje para permitir el futuro crecimiento de un sistema, es decir, la inclusión de nuevos conceptos y relaciones, y del esfuerzo requerido en el sistema para implementar la extensión.


    Información relacionada:

    -Si te quieres ir de Ning, deberías conocer por qué una solución Open Data puede resultar superior

    -Usabilidad débil y usabilidad fuerte

    Los gráficos de este post poseen Copyright de RIAM Intelearning Lab. 

     

    ENGLISH VERSION/ TEXTO EN ESPAÑOL


    gnoss.com is a space of social networks that can be Open Data linked, which means that their data are available to anyone who wants in a standard format. To this end, GNOSS data are expressed in a file type called RDF (Resource Description Framework), which are one of the W3C standards for the semantic web. In our case, a RDF is a semantic model for describing a particular resource whose form is determined by a marking or tagging language called OWL (Web Ontology Language).

    A specific ontology expresses a way of categorizing, modeling or representing our knowledge in relation to a field, an entity or an object. Ontologies normally represent the entities, which in our natural language are denoted by proper and common names, and their relationships. As we do so in a language that can be ‘understood’ by machines, they can ‘understand’ us. From the opposite perspective, we can talk with them using our skills in a natural way, that is, we can reason with them. And this is a great opportunity for everyone!

    The problem is that what happens with ontologies is similar to what happens with our words: not everyone gives them the same meaning. In the offline world, almost any agreement between people ends up drifting into a question of terminology. When we sign an agreement or contract, we take a long time to specify what each word means in particular. Otherwise, some conflicts that require someone to interpret the text from a neutral position may arise, ie someone who acts as an arbitrator. The same thing happens with almost any code or set of standards. That is why legal language is so much like the computer one, although they don’t know it!

    The same thing happens with systems and machines: if they don’t use the same ontology, if they don’t give the same meaning and relations to an entity, they can’t understand each other. And if they don’t understand each other, they can’t communicate, what in some more technical terms means that they can’t interoperate. Imagine, for example, that the ontology of "person" (the minimum set of attributes that allows a system to identify a particular human) for a system includes: name, father’s surname, mother’s surname and date of birth. It seems a very logical and intuitive description, but it won’t be understood by another one that describes it in these terms: name, first surname, second surname, date of birth, and even less with a third one that to does it this way: first name, last name, etc... The systems can have their data open, but if they don’t understand each other... It requires agreements, standard ways to define a particular entity.

    There are many things that systems need to know, especially in the context of a social network, to communicate meaningfully with people: to be ‘smart’. And if we also want them to understand other systems and interoperate with them, we need all them to speak the same words, that is, to use the same ontologies. In practice, there are many things systemes need to know, especially in the context of a social network, to communicate meaningfully with people and to interoperate with other systems. For this to be really possible, they all must speak the same words, that is, using the same ontologies. These ontologies for which there is an agreement (which may be universal, broad or… narrower) are called vocabularies. Some very general vocabularies are particularly important. As the systems operate on the basis of digital documents and descriptions of people, the following ontologies related to them are specially important because they allow you to connect most of the entities that exist on the web: a) ontologies that represent our general idea about a resource or a digital document, b) the ones that shape the description of a person and c) those that describe a system of categories or thesaurus. They represent the most inclusive way to almost any content that can be found on the Internet. Thus, they make the machines and systems to interoperate with each other. Of course, there are many other ontologies and vocabularies, usually with more specific or sectorial domains (such as those representing the set of clinical pathologies, for example).

     

    ONTOLOGY OF GNOSS.COM

    We have been building the ontology of gnoss.com ourselves, which means that we haven’t looked at the way other people or groups understand this or that concept, object or thing. It reflects our worldview. The problem here is that, although it is an open ontology, the people who interpret it must take our vision in order to express our data on their websites. Obviously this is a big problem. Although we do not stop ‘talking’, so to speak, we do it in a private language. This is usually the case at the dawn of a technology, when nor its limits, not it possibilities are well understood.

    In fact, the semantic web is something very new and there were no previous agreements on how to describe a thesaurus or a clinical pathology, just as for years there was no standard to regulate the direction of the screw threads. As is known, the industrial standardization went hand in hand with an office for standardization (ISO). Well, that one of the web depends on W3C. We understand the importance of working with ontological standards if we really want not only that our data are open and available, but also really linkable from other applications.

    Como ya hemos señalado, W3C ha avanzado en la estandarización de algunas ontologías muy generales. Como son muy generales, resultan de aprovechamiento casi universal y por tanto muy útiles para resolver problemas de interoperabilidad de muy amplio espectro. Estas ontologías se refieren a:

    As already noted, W3C has made progress in the standardization of some very general ontologies. As they are very general, they have almost universal utilization, therefore they are very useful for resolving interoperability issues in a very wide range. These ontologies refer to:

    • The way we should describe a person so that systems know that it is a person (FOAF).
    • The way in which information and resources must be written on a social network, community or collaborative workgroup, so they can be interpreted and displayed on another network, in other words, the way we should describe information so that social networks can exchange information and interoperate semantically on the basis of knowledge or automatic interpretation of that information by systems (SIOC).
    • The way we organize or categorize information (the way we create thesauri or taxonomies) (SKOS).

    In gnoss.com, we are migrating our ontology in order to express it in accordance with those standards. This work will be completed in early June 2010. Then gnoss.com, besides being an Open Space Data, will become a Linking Data space, that is, its data can be linked, interpreted and expressed by any website that works within the standards of the Semantic Web. Those standards are the ones that will go imposing in the short and medium term to solve the deep problems of isolation generated when not doing it so. Health systems, public administrations and large corporations are taking the need to work with them if they want to exploit the potential of their systems and the relationship between them and people. The rest of the companies and individuals will be doing it little by little. Apart from having your data available FOREVER and securely, the fact that machines can read documents in an ‘almost human way’ has great advantages when you are seeking or retrieving information or trying to discover hidden relationships in it.

     

    LINKED DATA vs OPEN SOURCE: WHY THE ALTERNATIVES BASED ON DATA ARE SUPERIOR TO THE OPEN SOURCE ONES

    Jon Bishop offers a summary of the free alternatives to Ning on third parties’ platforms in 9 Free Ning Alternatives And Some Open Source Solutions. We have already talked about many of them and the difficulties of transferring the content to such platforms. The post proposes a set of Open Source solutions: BuddyPress [Message from Buddypress]Elgg - [Message from Elgg]; PliggDolphinLovdByLess; InsoshiAstrospaces. Some people have thought about the risks of putting data in third parties’ hands and have come to the conclusion that the solution is to own the platform and its code.

    This seems a reasonable alternative because it would avoid the dependence on third parties that can give us so many headaches, as we have seen. But to start with, building a platform with some of the just listed existing Open Source solutions will always mean some work and ... the community of developers might leave at some point its maintenance. It’s a risk, but lower than that assuming that our data could stand in a silo from which we cannot remove it, some people will think. Apart from the fact that we should overcome the culture of computer DIY at some point, it seems necessary to clearly express something that is often hidden in the Open Source debate: the problem is not in the code but in the data, in being possible to interoperate with them and not just having them.

    My open data can be expressed in other sites, through others frames and, especially, they can connect with others to produce a more expressive, evolutionary and extensible knowledge experience. This is so because open data solutions have more extensibility, flexibility and expressivity than any other solution you can take into account. The code is ‘infostructure’ and therefore we could consider that dealing with it as plumbing or DIY on the Web. It’s equivalent to the toolbox of the Ford T (by then there weren’t many workshops and it was assumed that someone we bought a car should spend some time to maintain it and possibly repair it). Today nobody thinks about handling with his car engine. Well, just as we don’t think about chipping the walls of a newly bought apartment to check what the pipes are made of, we shouldn’t either be concerned about the code, but only that our data are readily available when needed.

    Of course, the least suitable solutions are those which data are closed and, moreover, are not Open Source (as it is unfortunately the case of Ning, and... most social networks, including the most popular ones). Secondly, that list would contain the vertical Open Source networks, ordered by advisability (from least to most advisable). But without any doubt, the best or most desirable ones would be those which data are open and can be linked, i.e., solutions expressed according to the semantic web standards including, in turn, knowledge representation systems or ontologies that are also standard.

    gnoss.com representa una solución de esa naturaleza. Es un espacio para alojar redes cuyos datos pueden conectarse con otras redes, por supuesto de las que están albergadas dentro del propio gnoss.com, pero eventualmente también con aquellas otras que estén fuera, pero que compartan la misma ontología. De las que aparecen en la gráfica de abajo, Twine, la solución conceptualmente más próxima a la nuestra, ha sido recientemente comprada por Evri y está en trance de extinción.

    gnoss.com represents a solution of this nature. It is a space to host networks which data can connect to other networks, if they are hosted inside the gnoss.com of course, but possibly also to others that are outside but share the same ontology. Of those that appear in the chart below, Twine, the solution conceptually closer to ours, was recently purchased by Evri and is on the verge of extinction.

    It is to notice once again: It’s the data! If we should be concerned about something, it is about being absolute owners of the data. Once this is assured, we shouldn’t care too much about the rest. The graphics below clearly express the superiority of the Linked Open Data solutions with respect to any other that we can consider and, in particular, the advantages associated with our project.

     

    Open Linked Data is a more scalable and flexible solution.

      

    And the most expressive and extensible one.

     

    • Expressiveness: the extent of the capacity of language to define the semantics of a domain of knowledge, that is, the capacity to represent concepts, and relationships between concepts.
    • Extensibility: is the measure of the capacity of a language to enable future growth of a system, that is, the inclusion of new concepts and relationships, and the effort required in the system to implement the extension.



    Related information:

    - If you want to leave Ning, you should know why an Open Data solution can be superior.

    Weak usability and strong usability.

     

    The graphics on this post have RIAM Intelearning Lab Copyright. 

     

     

    ...