Recursos

    sortFiltrar Ordenar
    2 resultados

    Artículo

    /

    Publicado el 14.6.2010 por Ricardo Alonso Maturana

    Social data; web semántica; y datos abiertos y enlazados: ¡knowledge internet! / Social data, semantic web, opend and linked data: knowledge internet!

    ENGLISH VERSION/ TEXTO EN ESPAÑOL

    El proceso general de digitalización de la realidad está generando una capa de representación de la totalidad de las cosas y personas, pero también, y esto resulta especialmente relevante, de sus relaciones. A, por ejemplo, ‘Juan Rulfo’ y, pongamos, ‘El llano en llamas’ les une el hecho de que el primero es el AUTOR del segundo, lo que queda expresado mediante la proposición: ‘Juan Rulfo es el autor de ‘El llano en llamas’ Como veremos, la web semántica posibilita computar (deducir, razonar, buscar...) con proposiciones de ese tipo, lo que ofrece grandes posibilidades. Cuando disponemos de los datos y de sus relaciones organizados de acuerdo con los lenguajes de la web semántica (de los que he hablado en ¿Mis datos en manos de terceros? Ventajas de expresar contenidos con estándares de la web semántica), decimos que “los datos están estructurados". Por desgracia, la mayor parte de los datos de la web no están expresados de ese modo. Sin embargo también están estructurados, aunque no del modo en el que lo entienden las máquinas. Buena parte del trabajo consiste, precisamente, en convertir nuestros documentos HTML, .doc, etc...en datos estructurados. En cualquier caso y en buena medida, todos nuestros datos los estamos organizando de forma útil para las personas gracias a las redes sociales. De hecho, construir una web más inteligente parece la condición necesaria para manejar y utilizar de manera eficiente esa enorme y creciente cantidad de datos que está produciendo la actividad humana en las redes. A esta clase de datos categorizados y organizados gracias al trabajo social de las redes les llamaremos Social Data.

     

    Social Data

    Habitualmente los Social Data incorporan el punto de vista de las personas que los editan, o bien, dependiendo de su naturaleza, el de un grupo. Esta información que añade información a una información original suele conocerse con el nombre de metadatos. Los Social Data son, por tanto, metadatos construidos gracias al trabajo social en la red de las personas. Las colecciones de metadatos más habituales en las redes sociales son conocidas por el nombre de folksonomías, que expresan el punto de vista personal o la perspectiva personal con relación a una información o documento determinado. En ocasiones, las redes sociales, en especial cuando se trata de redes profesionales, incluyen puntos de vista más normativos para calificar la información: las taxonomías o los tesauros. La acción de asignar un determinado metadato a una información o documento se conoce con el nombre de etiquetar. El etiquetado social es la fuente primaria de producción de Social Data.

     

    Google es demasiado idiota para entender lo que la gente necesita

    Dado que la racionalidad humana tiene un carácter intencional o finalista, los Social Data aportan una información muy relevante a la hora de recuperar la información con una determinada finalidad o intención. Este es el modo general en el que los humanos desean recuperar información, pero no el modo en el que resuelven este problema los sistemas y buscadores. Pensemos por ejemplo en nuestra experiencia de búsqueda y recuperación de información con Google, el buscador más extendido. Google nos ofrece como resultado de una búsqueda una, habitualmente larga, lista de resultados o posibilidades ordenados en función de la relevancia que atribuye a cada uno de ellos. Eso no estaría mal en primera instancia, pero lamentablemente es todo lo que podemos hacer con Google: no podemos hacer una segunda pregunta relacionada con la primera. Imaginemos que me gustaría conocer qué hay sobre ‘buscadores semánticos que utilicen procesamiento del lenguaje natural y, además, lógica borrosa, escrito por mujeres en 2008, en alguna universidad de California o en San Francisco y alrededores’. Podemos intentarlo introduciendo en la barra del buscador "buscador+semántico+procesamiento+del+lenguaje+natural+lógica+borrosa+san+francisco+2008", pero como puede imaginar casi cualquiera el resultado puede resultar sorprendente. En todo caso, a nadie se nos ocurriría utilizar ‘mujer’ o ‘alrededores’ o ‘alguna universidad de california’ como criterio de recuperación de información, porque conociendo a Google no resulta una expectativa razonable.

     

    Google padece el síndrome del savant o del sabio. Es un idiota con algunas capacidades muy desarrolladas, un idiota inteligente capaz de comparar todos los caracteres de un texto con la secuencia que le proponemos, pero incapaz de entender lo que le solicitamos. En nuestro ejemplo, las categorías ‘documentos escritos por mujeres’ o ‘producidos en una universidad de california’ son difícilmente traducibles a una secuencia de caracteres que ofrezca la perspectiva de un conjunto de resultados aceptable. ¿Por qué no podemos interrogar a nuestro buscador sucesivamente, tal y como hacemos en nuestra vida ordinaria, para resolver problemas que requieren manejar grandes cantidades de información? Nuestro cerebro no está diseñado para manejar enormes cantidades de información, sino relativamente poca pero significativa; por eso nuestra razón produce como resultado de nuestras indagaciones largas listas ordenadas por relevancia, sino que opera estableciendo sucesivas condiciones o restricciones crecientes que nos conducen a un resultado o a unos pocos cuyo valor relativo pueda establecerse de un sólo golpe de vista. En una partida de ajedrez, nadie en su sano juicio consideraría una estrategia razonable el ordenar en una lista en función de sus posibilidades de conducir a la victoria, todas las posibles jugadas vinculadas con una posición dada de las fichas. Obviamente lo puede hacer Deep Blue, pero los humanos carecen de esa capacidad para computar. A cambio ‘saben lo que quieren’, lo que les permite considerar sólo la información útil para ese fin. 

     

    Contextos de interpretación de la información que pueden ser entendidos por las máquinas

    Los Social Data añaden un contexto explícito de interpretación a cualquier información o documento, por lo que constituyen el elemento social de la dimensión semántica de la web. La semántica de la web se construye según vemos social o colectivamente y esa información es útil porque las personas no son demasiado diferentes. 

    Una ontología concreta expresa un modo de categorizar, modelar o representar nuestro conocimiento con relación a un campo, entidad u objeto determinado. Lo normal es que las ontologías representen las entidades, que en nuestro lenguaje natural son denotadas mediante los nombres propios y comunes, y sus relaciones. Como lo hacemos en un lenguaje que puede ser ‘comprendido’ por las máquinas, éstas pueden entenderse entre sí (interoperar o intercambiar datos con independencia de los formatos de almacenamiento y de las aplicaciones de gestión), pero también ‘entendernos’ e interactuar con nosotros de manera inteligente; también podemos verlo al revés, gracias a las convenciones de la web semántica nosotros podemos conversar con ellas utilizando nuestras capacidades de un modo natural, esto es, podemos razonar con ellas. ¡Esto representa una gran oportunidad para todos, que se añade a las que ofrecía el etiquetado social!

    En la práctica, hay muchas cosas que necesitan conocer los sistemas, especialmente en el contexto de una red social, para poder comunicarse con sentido con las personas y para que interoperen con otros sistemas. Para que esto sea realmente posible,  precisamos que todos ellos hablen con las mismas palabras, esto es, que utilicen las mismas ontologías. A estas ontologías sobre las que existe un acuerdo (que puede ser universal, muy amplio o...menos amplio) las denominamos vocabularios. Algunos vocabularios de carácter muy general resultan especialmente importantes. Dado que los sistemas funcionan sobre la base de documentos digitalizados y descripciones de personas, las ontologías que representan nuestra idea general de lo que es un recurso o documento digital, las que modelan la descripción de una persona y aquellas que describen un sistema de categorías o tesauro resultan especialmente importantes porque permiten conectar a la mayor parte de las entidades que existen en la webEllas representan del modo más inclusivo a casi cualquier contenido que puede encontrarse en internet y por ello hacen que las máquinas y los sistemas puedan interoperar entre sí con pocas restricciones.

    La web semántica puede definirse como el conjunto de convenciones que hace posible estructurar los datos contenidos en los distintos formatos de documentos (que generalmente están desestructurados, lo que en realidad significa que no pueden interpretarlos las máquinas), con el fin de que tanto las máquinas como las personas puedan interactuar (interoperar) entre sí de un modo más humanizado, intuitivo, eficiente y satisfactorio que lo que sucedía con la web basada en la computación. Es la base para el desarrollo de una web más inteligente y...autoconsciente.

     

    Open Data y Linked Data

    Open Data designa una filosofía y práctica que persigue que determinados datos estén disponibles de forma libre a todo el mundo, sin restricciones de copyright, patentes u otros mecanismos de control. Los datos pueden estar abiertos y, cuando no se utilizan los estándares de la web semántica, no resultar aprovechables por terceros.

    Aún cuando los datos de una determinada aplicación web se expresen de acuerdo con los estándares de la web semántica caben diversas posibilidades:

    • Los datos pueden ser abiertos, pero no estar enlazados
    • Los datos pueden ser enlazados, pero no estar abiertos

    La posibilidad de datos que sean tanto abiertos como enlazados es cada vez más viable, tanto desde el punto de vista tecnológico, como de negocio. La Web Semántica sólo puede funcionar con datos que sean tanto abiertos como enlazados. Nos referimos a esto en un post anterior. En esta entrada, la figura representa el grafo del conjunto de iniciativas y aplicaciones enlazadas que constituyen la Linked Data Web o de la Web de los datos abiertos y enlazados

    Linked Data Web implica una manera de publicar contenidos en la Web que:

    •  favorece la reutilización
    •  reduce la redundancia
    •  maximiza la conectividad (real y potencial)
    •  hace posible el “efecto red” a la hora de añadir valor a los datos

     

    En definitiva:                                                    Linked Data = Open Data + Open Standars

     

    La web semántica tiene ya un tamaño considerable, que irá aumentando a medida en la que se vayan estructurando los datos de más espacios de la web (a la par que se crean espacios con los datos ya estructurados). Los datos estructurados permiten estrategias de búsqueda que en lugar de ordenar una lista de posibles soluciones en función de la relevancia (en lugar de obligar a los humanos a entender la lógica de las máquinas), permite ir razonando hasta localizar el resultado o pequeño número de resultados que responde a las restricciones o condiciones del razonamiento. En definitiva, permiten las búsquedas basadas en el razonamiento o búsquedas facetadas.

    Por otro lado, la web semántica posibilita ofrecer como resultado de una determinada búsqueda el conjunto de contextos relacionados con ella, como por ejemplo personas relacionadas, documentos relacionados, imágenes relacionas, etiquetas o metadatos relacionados, etc…Esto posibilita el poder desarrollar y evolucionar las búsquedas desde la perspectiva humana de la exploración.

    En resumen, Linked Data Web sería:

    •          Base de datos global
    •          Diseñada para que las máquinas ‘hablen’ y ‘piensen’ al modo humano·        
    •          Los objetos que maneja y conecta representan cosas (como personas, películas, imágenes, libros, plantas, etc…, esto es, cualquier cosa que podamos representar mediante una ontología) y no, como ocurre en la web HTML, documentos (páginas web)
    •          Los enlaces representan relaciones entre entidades o 'cosas'
    •          Para ello se precisa de un alto grado de estructuración en las descripciones de esas entidades
    •          Es preciso, por tanto, que la semántica de las cosas sea explícita

    Las tecnologías o estándares asociados con su desarrollo serían: URIs, HTTP, RDF, RDFS/OWL

     

    El siguiente grafo muestra el conjunto de iniciativas que forman parte de la web semántica y sus diferentes grados de interacción

     

     

     

    Imagen: linkeddata.org

     

    www.gnoss.com es un sistema de redes sociales enlazadas cuya ontología se expresa de acuerdo con los estándares de la web semántica. gnoss.com, además de ser un espacio Open Data, es un espacio de Linked Data, esto es, sus datos son enlazables, interpretables y expresables desde cualquier web que trabaje dentro de los estándares de la web semántica. Pero la web semántica son, en el fondo, social data pues la semántica expresa siempre un acuerdo formal o informal entre personas: no hay posibilidades de entendernos sin una idea común acerca del significado de las palabras. Esta semántica se va construyendo, es un ‘work in progress’ que se puede expresar de diferentes modo, pero que finalmente, dentro de la lógica evolutiva de la web semántica, tiende a concretarse en vocabularios estándar. Estos estándares son los que en el corto y medio plazo se irán imponiendo para resolver los profundos problemas de aislamiento a los que nos somete el no hacerlo así. Los sistemas de salud, las administraciones públicas y las grandes corporaciones están asumiendo la necesidad de trabajar con ellos si quieren aprovechar el potencial de sus sistemas y de la relación entre ellos y las personas. Poco a poco lo irán haciendo el resto de las empresas y personas. 

     

    ENGLISH VERSION/ TEXTO EN ESPAÑOL 

     

    The general process of reality digitalization of is creating a layer of representation of all things and people, but also of their relationships, and this is particularly important. For example, ‘Juan Rulfo’ and, let’s say, ‘The Burning Plain and Other Stories’ are linked by the fact that the first one is the author of the second one. This is expressed by the proposition: “Juan Rulfo is the author of The Burning Plain”. As we shall see, the semantic Web enables compute (deduce, reason, search...) with proposals of this kind, which offers great possibilities. When you have the data and their relationships organized according to semantic web languages (I have spoken about them in My data in the hands of others? Advantages of expressing content with semantic web standards), we say that “data are structured”. Unfortunately, most web data are not expressed in that way. However, they are structured too, but not in the way that the machines understand. Much of the work involves specifically converting our HTML, doc, etc. documents into structured data. In any case and to a large extend, we are organizing all our data in a useful way for people thanks to social networks. In fact, building a smarter web seems the necessary condition to efficiently manage and use the huge and growing amount of data that human activity is generating on the networks. This kind of data which are categorized and organized through the social work on social networks will be called Social Data.

     

    Social Data

    Social Data usually incorporate the perspective of people who edit them, or, depending on their nature, that of a group. This information that adds information to original information is generally known as metadata. Therefore, Social Data are metadata built thanks to social work in the people network. The most common metadata collections on social networks are known by the name of folksonomies, which express a personal view or personal perspective in relation to a particular information or document. Social networks, especially when it comes to professional networks, sometimes include regulatory viewpoints to describe the information: taxonomies or thesauri. The action of assigning a particular metadata to some information or to a document is known as tagging. Social tagging is the primary source of Social Data production.


    Google is too stupid to understand what people need

    Given that human rationality has an intentional or finalist nature, the Social Data provide very important information when retrieving information with a specific purpose or intent. This is the general way in which humans want to retrieve information, but not the way in which systems and search engines solve this problem. For instance, let’s consider our experience of information search and retrieval with Google, the most widespread search engine. As a result of a search, Google shows us a typically long list of potential results sorted according to the relevance it gives to each of them. At first, that would not be a bad option, but unfortunately that’s all we can do with Google: we cannot ask a second question related to the first one. Imagine that  you would like to know what’s on ‘semantic search engine using natural language processing, and also fuzzy logic, written by women in 2008 in any university in California or in San Francisco and surroundings’. We can try entering into the search bar: "search+engine+semantic+processing+of+natural+language+fuzzy+logic+san+Francisco+2008". But almost anyone can imagine that the result might be rather surprising. In any case, no one would use ‘woman’ or ‘surroundings’ or ‘any university of california’ as a criterion for information retrieval, because it is not a reasonable expectation when you know Google.

    Google has the savant syndrome. It’s an idiot with some highly developed skills, an intelligent fool that can compare all the characters in a text with the sequence that we are proposing, but unable to understand what we are asking. In our example, the categories ‘documents written by women’ or ‘produced in any university of california’ are difficult to translate into a sequence of characters that offers the prospect of an acceptable result set. Why can’t we query our search engine successively, as we do in our ordinary life, to solve problems that require handling large amounts of information?

    Our brain is not designed to handle huge amounts of information, but relatively small, but significant. That’s why our reason doesn’t produce long lists sorted by relevance as a result from our inquiries, but it operates establishing successive conditions or restrictions that lead to one result or to a few ones of which relative value can be established at a glance. In a game of chess, nobody in his right mind would consider as a reasonable strategy ordering in a list, according to their ability to lead to victory, all the possible moves associated with a given position of the chess pieces. Obviously, Deep Blue can do it, but humans lack the ability to compute. In turn, they ‘know what they want’, what allows them to consider only the relevant information for their purpose.

     

    Contexts of information interpretation that can be understood by machines

    Social Data add an explicit context of interpretation to any information or document, so they are the social element of the semantic dimension of the web. The Semantic Web is built according to social or collectively perspective and that information is useful because people are not too different.

    A specific ontology expresses a way of categorizing, modeling or representing our knowledge in relation to a determined field, entity or object. Ontologies normally represent the entities, which in our natural language are denoted by proper and common names, and their relationships. As we do it in language which can be ‘understood’ by the machines, these ones can understand each other (interoperate or interchange data regardless of storage formats and management applications), but also ‘understand’ us and interact with us intelligently. We can also see the opposite: thanks to the conventions of the Semantic Web, we can talk with them using our skills in a natural way, that is, we can reason with them. This represents a great opportunity for all, in addition to those offered by the social tagging!

    In practice, there are many things systems need to know, especially in the context of a social network, to communicate meaningfully with people and to interoperate with other systems. For this to be really possible, they all must speak the same words, that is, using the same ontologies. These ontologies for which there is an agreement (which may be universal, broad or… narrower) are called vocabularies. Some very general vocabularies are particularly important. As the systems operate on the basis of digital documents and descriptions of people, the following ontologies related to them are specially important because they allow you to connect most of the entities that exist on the web: a) ontologies that represent our general idea about a resource or a digital document, b) the ones that shape the description of a person and c) those that describe a system of categories or thesaurus. They represent the most inclusive way to almost any content that can be found on the Internet. Thus, they make the machines and systems to interoperate with each other with few restrictions.

    The Semantic Web can be defined as the set of conventions that makes it possible to structure the data in different document formats (which are usually unstructured, what actually means that machines can’t interpret them), so that both machines and people can interact (interoperate) with each other in a more humane, intuitive, efficient and satisfying way than what happened with the computer-based web. This is the basis for the development of a more intelligent and… self-aware web.

     

    Open Data and Linked Data

    Open Data means a philosophy and practice that pursues that certain data are freely available to everyone without restrictions of copyright, patents or other control mechanisms. Data can be open but not usable by others, when semantic web standards aren’t used.

    Even when data from a particular web application are expressed in accordance with the standards of the Semantic Web, there are several possibilities:

    • Data can be open, but not be linked
    • Data can be linked, but not be open

     The possibility of data being both open and linked is increasingly viable, both from a technological and business standpoint. The Semantic Web can only work with data that are both open and linked. I referred to this in a previous post. The below figure represents the graph of all the linked initiatives and applications which form the Linked Data Web.

    Linked Data Web involves a way to publish content on the Web that:

    • promotes reuse
    • reduces redundancy
    • maximizes connectivity (real and potential)
    • makes possible the ‘network effect’ when it comes to adding value to data

    In short:  Linked Data = Open Data + Open Standars

    The Semantic Web has already a considerable size, which will increase as data from more web sites get structured (at the same time that spaces with already structured data are being created). Structured data allow search strategies to reason until they reach the result or small number of results according to restrictions or conditions of reasoning, instead of ordering a list of possible solutions depending on the relevance (rather than forcing humans to understand the logic of the machines). In short, they allow searches based on the reasoning or faceted search.

    On the other hand, the semantic web enables to offer as a result of a particular search a context set associated with it, such as related people, documents, images, tags or metadata, etc... This makes it possible to develop and evolve search from the human exploration perspective.

    To sum up, Linked Data Web would be:

    • Global database
    • Disigned for machines to ‘talk’ and ‘think’ the human way.
    • Objects that it manages and connects represent things (like people, movies, images, books, plants, etc…, that is, anything that can be represented by an ontology), but not documents (web pages) as it occurred in the HTML web
    • Links represent relations between entities or ‘things’.
    • This requires a high degree of structure in the descriptions of these entities.
    • Therefore, it is necessary that the semantics of things is explicit.

    Technologies or standards associated with its development would be: URIs, HTTP, RDF, RDFS/OWL

    The following graph shows the set of initiatives that are part of the semantic web and their different degrees of interaction

     

    Image: linkeddata.org
     

     www.gnoss.com is a system of linked social networks whose ontology is expressed in accordance with the standards of the semantic web. gnoss.com, besides being an Open Data space, is a Linked Data space, that is, its data can be linked, interpreted and expressed by any site that works within the standards of the semantic web. But the semantic web is in the background, social data, since the semantics expresses always a formal or informal agreement between people: there is no chance of understanding without a common idea of the meaning of words. This semantics is being built, is a work in progress which can be expressed in different ways, but finally tends to be translated into standard vocabularies, within the evolutionary logic of the Semantic Web. Those standards are the ones that will go imposing in the short and medium term to solve the deep problems of isolation generated when not doing it so. Health systems, public administrations and large corporations are taking the need to work with them if they want to exploit the potential of their systems and the relationship between them and people. The rest of the companies and individuals will be doing it little by little.

     

     

     

    ...

    Artículo

    /

    Publicado el 10.6.2010 por Ricardo Alonso Maturana

    Remixing Social and Search: el futuro de las estrategias de búsqueda y recuperación de la información

    ENGLISH VERSION/ TEXTO EN ESPAÑOL

    Todavía hoy, nuestra experiencia corriente de búsqueda tiene que ver con la presentación en una simple lista de contenidos ordenados de acuerdo con un cierto criterio de relevancia. Por otro lado, la experiencia de búsqueda en redes sociales es, por lo general, insuficiente cuando no pobre.

    El pasado 5 de mayo, en el marco de la Web 2.0 Expo celebrado en San Francisco, Matt Maclaurin, director del FUSE Lab de Microsoft realizó una conferencia titulada: FUSE Labs: Remixing Social Search. No fue la única que se interrogaba sobre la futura naturaleza de las búsquedas en internet, pero sí, a mi jucio, la mejor de todas en este campo concreto. Lamentablemente no colgó la presentación, por lo que no puede encontrarse entre la documentación del Congreso.

    En gnoss.com estamos trabajando en el desarrollo de soluciones de descubrimiento, exploración y recuperación de información que van un paso más allá de lo que podemos denominar 'experiencia Google'. El objetivo es construir soluciones de recuperación y búsqueda de información que exploten las enormes posibilidades derivadas del crecimiento acelerado de la web social. Estamos investigando y trabajando sobre los modos en los que pueden relacionarse la web social y las estrategias de búsqueda basadas en ella, lo que podemos llamar #SOCIAL and #SEARCH;  y ello con el objetivo de descubrir nuevas estrategias que conecten la web de los datos (lo que será la web semántica) con su desarrollo social.

    Aunque resulta difícil establecer con exactitud en qué consistirá nuestra experiencia de búsqueda dentro de no tanto tiempo, no lo es tanto describir cuáles serán algunos de sus aspectos fundamentales. Probablemente, el más relevante de todos ellos tendrá que ver con el hecho de que el proceso de descubrimiento y exploración de la información será menos documental y más social, más inteligente, razonado y restrictivo y, sobre todo, más contextual y personal. 

    La riqueza social de la web precisa de nuevos modos de descubrir y presentar la información, de nuevas herramientas que provean de vistas y perspectivas de lo que ocurre y nos interesa en los espacios sociales en los que participamos, que nos ofrezcan, en suma, nuevos modos de acceder, agregar, categorizar y presentar, todo ello del modo más automático posible, la información cuando exploramos nuestras redes sociales; que faciliten, por último, el descubrimiento de información, junto con sus contextos, mediante procesos de inferencia y razonamiento, en lugar de ofrecer como resultado desmesuradas listas ordenadas por relevancia.

     

    #SEARCH y #SOCIAL

    Llamaremos #SEARCH a nuestra experiencia corriente de búsqueda y recuperación de información tal y como está construida de un modo general en la actualidad. #SEARCH designa lo que antes hemos denominado la “experiencia google”. Por su parte, #SOCIAL designará nuestra experiencia de vida digital entendida de la manera habitual en la que la gente la desarrolla en entornos digitales tales como Facebook, Tuenti, Twitter, Flickr o gnoss.com

    Indudablemente, #SEARCH hace referencia de manera inmediata a un aspecto esencial de nuestra experiencia de la web. Hasta hace relativamente poco tiempo la experiencia común de la web estaba determinada por la satisfacción que producía en el usuario su experiencia de búsqueda.

    En los últimos años, sin embargo, la web social ha incorporado una dimensión nueva a nuestra experiencia común de internet. Para muchas personas, #SOCIAL representa ahora su experiencia cotidiana de la web, una experiencia en muchos casos más intensa y continuada que la que puede ofrecer #SEARCH. El acelerado crecimiento y evolución de #SOCIAL está ligado de manera muy profunda al  modo en el que las personas se enfrentan y resuelven los procesos de búsqueda, exploración, descubrimiento y recuperación de la información.

    El concepto de #SOCIALSEARCH está en el fondo de todos los proyectos que se están replanteando la experiencia humana con la tecnología. Matt Maclaurin consideraba, en la conferencia a la que nos hemos referido, que sin duda va a ser uno de los conductores tecnológicos de los próximos 3 años; sin embargo ¿a qué nos referimos exactamente con él? ¿A buscar información y documentación en nuestras redes sociales? ¿A buscar información y documentación a través de nuestra red social, por ejemplo preguntando o suscribiéndome a lo que hacen determinadas persona o grupos de trabajo? ¿O bien a suscribirme a conceptos o ideas, como puede ser un #hastag, en el marco de una red social? ¿A buscar personas o amigos con intereses parecidos o conexos con los nuestros en sitios como Delicious o GNOSS, en los cuáles los usuarios muestran información etiquetada y organizada sobre sus hallazgos en internet?

    A diferencia de lo que ocurre con #SEARCH, en  #SOCIAL los contenidos y datos llevan incorporados un contexto social, que los caracteriza y enriquece y que, además, puede funcionar muy bien como criterio de búsqueda. Esta nueva clase de búsquedas sociales requieren de herramientas que incluyan procedimientos de interrogación y razonamiento humanos, más sofisticados e inteligentes que los que funcionaban en #SEARCH, como son los que proporciona la web semántica. En efecto, estamos fusionando o remezclando nuestras experiencias de búsqueda, exploración y descubrimiento de conocimiento con nuestra vida social en la red. En este nuevo escenario, #SEARCH necesita de #SOCIAL para crear y dar sentido a los datos. En el futuro, #SOCIAL y #SEARCH no serán actividades separadas: #SEARCH buscará en #SOCIAL y #SOCIAL dará sentido e interpretará a #SEARCH. Por último, #SEARCH necesita de #SOCIAL para generar contextos, especialmente, contextos personales de trabajo y aprendizaje. 

     

    Conectividad social e integración de la información

    Los siguientes gráficos muestran la relación entre la conectividad social y la conectividad de la semántica de la información (del modo en el que los humanos "acordamos" una interpretación común de las cosas) en el marco más amplio de la evolución de la web. Como se ve, la fusión de  #SOCIAL and #SEARCH aparece como una construcción inevitable en ese marco más amplio (se trata del mismo fenómeno que es observable en evolución de los lenguajes naturales: ¿cómo, si no, resulta posible que un grupo humano grande o muy grande haya llegado a interpretaciones tan comunes acerca del uso de las palabras?)

     

     

    La segunda figura abunda en esta idea de conectividad entre personas e información conforme avanzamos colectivamente en los procesos de digitalización de la información. En la parte correspondiente a la tercera década de la web, se muestra un grafo con algunos de los proyectos que están colaborando en la construcción de la web semántica abriendo y enlazando sus datos.

     

     

     

     

     

     

    ENGLISH VERSION/ TEXTO EN ESPAÑOL

    Even today, our common search experience has to do with the presentation in a simple list of contents sorted according to some relevance criterion. On the other hand, the search experience on social networks is usually insufficient if not poor.

    On 5th May, in the context of the Web 2.0 Expo in San Francisco, Matt Maclaurin, director of the FUSE Lab at Microsoft held a conference called: FUSE Labs: Remixing Social Search. It was not the only one who wondered about the future nature of Internet search, but, in my opinion, it was the best of all in this particular field. Unfortunately he didn’t upload his presentation, so it can’t be found among the documents of the Conference 

    In  gnoss.com, we are working on developing solutions for discovery, exploration and retrieval of information that go a step beyond what can be called 'Google experience’. The aim is to build search and retrieval information solutions that exploit the enormous opportunities arising from the rapid growth of the social web. We are investigating and working on ways of relating the social web and search strategies based on it. This is what we can call #SOCIAL and #SEARCH; all that with the aim of finding out new strategies to connect the web of data (what the semantic web will became) with its social development.

    Although it is difficult to establish exactly what our search experience will involve in not so long, it isn’t so much to describe what some of its basic aspects will be. The most important of all them will probably have to do with the fact that the process of discovery and exploration of information will become less documentary and more social, more intelligent, reasoned and restrictive and, above all, more contextual and personal.

    The social wealth of the Web requires new ways of discovering and presenting information and also new tools that provide views and perspectives of what is happening and what we are concerned with in the social spaces where we participate. In short, we need that it offers new ways to access, add, categorize and present information as automatically as possible when exploring our social networks. Finally, it has to facilitate the discovery of information, along with their contexts, through processes of inference and reasoning instead of offering results of enormous lists sorted by relevance.

     

    #SEARCH and #SOCIAL

    We’ll call #SEARCH to our common experience of search and retrieval of information as it is built in general way at present. #SEARCH designates what we have previously named the ‘Google experience’. For its part, #SOCIAL designates our digital life experience understood in the usual way in which people develops it in digital environments such as Facebook, Tuenti, Twitter, Flickr or gnoss.com

    Undoubtedly, #SEARCH refers to an essential aspect of our web experience. Until relatively recently, the common experience on the web was determined by the satisfaction that the search experience produced in the user.

    However, in recent years, the social web has added a new dimension to our common experience of the Internet. For many people, #SOCIAL  now represents their everyday experience of the Web, which is often a more intense and continuous experience than the one that #SEARCH can offer. The rapid growth and evolution of #SOCIAL is linked in a very deep way to the way in which people face and solve the process of search, exploration, discovery and retrieval of information.

    The #SOCIALSEARCH concept lies at the bottom of all projects that are redefining the human experience with technology. Matt Maclaurin considered at the conference commented above that it is certainly going to be one of the technological drivers of the next three years. But what do we mean exactly with that? To seek information and documentation in our social networks? To search for information and documentation through our social network, for example asking or subscribing to what certain people or workgroups do? Or to subscribe to concepts or ideas, such as a # hastag, in the context of a social network? To find people or friends with common or related interests in places like Delicious or GNOSS, where users show tagged and organized information about their findings on the Internet?

     

    In this new context, #SEARCH needs #SOCIAL to create and give meaning to data. In the future, #SOCIAL and #SEARCH will not be separate activities: #SEARCH will look for information in #SOCIAL, and #SOCIAL will give meaning and will interpret #SEARCH. Finally, #SEARCH needs #SOCIAL to generate contexts, especially personal learning and work contexts.

    Unlike what happens with #SEARCH, in #SOCIAL data and content carry a social context that characterizes and enriches them, and it also can work very well as a search criterion. This new kind of social search requires tools that include query procedures and human reasoning, more sophisticated and intelligent than those which worked in  #SEARCH, such as those provided by the semantic web. In fact, we are merging or remixing our search, exploration and knowledge discovery experiences with our social life on the Net. In this new scenario, #SEARCH needs #SOCIAL to create and give meaning to data. In the future, #SOCIAL and #SEARCH won’t be separate activities: #SEARCH will look for information in #SOCIAL and #SOCIAL will interpret and give meaning to #SEARCH. Finally, #SEARCH needs #SOCIAL to generate contexts, especially personal contexts of work and learning.

     

     

    Social connectivity and integration of information

    The following charts show the relationship between the social connectivity and the connectivity of the semantic information (the way in which humans ‘agreed’ a common understanding of things) in the broadest context of the evolution of the web. As shown, the fusion of #SOCIAL and #SEARCH appears as an inevitable construction in that broader context (this is the same phenomenon that can be observed in the evolution of natural languages: otherwise, how is it possible that a large or very large human group has come to so common interpretations about the use of words?).

     

     

    The second figure goes on about this idea of connectivity between people and information as we move forward collectively in the process of information digitalization. The share of the third decade of the Web shows a graph with some of the projects that are collaborating to build the semantic web opening and linking their data.

     Figure 2. Evolution of web tools from web 1.0 to 3.0

     

     

    ...