tipo de documento Artículo

Artículo

Human-Computer Information Retrieval: Buscadores Facetados, la siguiente generación de buscadores basados en razonamiento

Acerca de este recurso...

1700

0

Publicado el 5 . 10 . 2011 por Ricardo Alonso Maturana

La experiencia de búsqueda habitual funciona… a menudo. Basada en un cuadro de texto para buscar, consigue una lista de resultados, ordenados por una teórica relevancia, que satisfacen, en general, las expectativas del usuario. Sin embargo, hay casos, a menudo en búsquedas de mucho valor en entornos específicos (catálogos, entornos empresariales), en que este funcionamiento es insuficiente: ¿Qué ocurre si el usuario no sabe exactamente lo que busca? ¿Con qué herramientas cuenta el usuario para refinar su búsqueda?

Los buscadores de Internet (Google, Bing y otros) obtienen un conjunto de resultados con un recall (fracción de documentos relevantes recuperados) próximo a 1, ya que todo el conjunto de documentos relevantes estará, seguramente, entre los documentos recuperados. Sin embargo, la precisión (fracción de documentos recuperados que son relevantes) puede llegar a ser baja o muy baja, ya que los documentos relevantes pueden estar acompañados por cientos o miles de resultados irrelevantes.

Estos buscadores solucionan su falta de precisión ordenando el conjunto de resultados por una relevancia precalculada y definida por sus algoritmos, adivinando las intenciones de la persona que busca. Desde luego, son muy buenos en esa adivinación, pero tal vez no les interese tanto mejorar la precisión de los resultados: sus ingresos en publicidad pueden depender de ello.

En cuanto al refinado de la búsqueda, estos buscadores ofrecen en el cuadro de texto un autocompletado con sugerencias, y cuentan con la habilidad e interés del usuario a la hora de añadir palabras en el cuadro de texto.

Durante los últimos años, la confluencia de estudios en las áreas de IR (Information Retrieval) y HCI (Human Computer Interaction) ha generado un área de estudio específica, HCIR (Human–Computer Information Retrieval *), que se ocupa de las técnicas de recuperación de información que introducen la inteligencia humana en el proceso de búsqueda. Algunas de las ideas generadas, que ya se están aplicando en los buscadores más avanzados, son:

  • Dar la responsabilidad y el control de la búsqueda a la persona. Le requiere esfuerzo, pero se le recompensa.
  • No adivinar las intenciones, sino mejorar la comunicación.
  • Soportar refinamiento y exploración.
  • Responder con un conjunto de resultados ordenado y adecuado, lo que incluye ofrecer diferentes formas de presentación según el tipo de resultados: listas, mosaicos, mapas, timeline, etc.
  • Extender los resultados y la información con contextos, que son, a su vez, resultados de otras búsquedas.

Una de las propuestas concretas es el uso, como interfaz, de buscadores facetados. Han sido pioneros, en el uso de este tipo de interfaz, sitios web como Amazon o Ebay. Por su parte, Google ha presentado, durante los últimos meses, buscadores facetados en áreas específicas, como recetas o viajes, aunque sin sumarización.

Los buscadores facetados se caracterizan por:

Human-Computer Information Retrieval: Buscadores Facetados, la siguiente generación de buscadores basados en razonamiento

  1. Ofrecer una sumarización basada en propiedades que caracterizan específicamente a los resultados mostrados. Por ejemplo, si se trata de mostrar obras de arte, podrían ser autor, museo, época, estilo, escuela, técnica, etc.
  2. Cada posible valor de la propiedad es una opción de refinamiento de la búsqueda. Por ejemplo, una vez buscadas obras de arte sobre caballos, se dispone de una lista con estilos. Eligiendo uno de ellos, Barroco, se obtendrían 33 cuadros. De ellos, observamos que uno de los autores es Velázquez, con lo que llegamos a 3 cuadros: recall y precisión.
  3. Las opciones de refinamiento ofrecen resultados posibles. En el ejemplo anterior, no es posible elegir como autor a Goya, ya que ninguna de sus obras correspondería al estilo barroco. Es un defecto frecuente de algunos sistemas de búsqueda la posibilidad de combinar opciones de búsqueda que no devuelven resultados.

Este tipo de interfaz requiere de una correcta identificación de las propiedades de los datos a mostrar como facetas. En GNOSS, las facetas no están predefinidas en el desarrollo o definición del sistema, sino que los administradores de las comunidades GNOSS pueden:

  • Añadir campos nuevos a un conjunto de datos. Por ejemplo, en la ficha de la obra de arte, el precio (si se usara en una galería comercial).
  • Crear un nuevo tipo de conjunto de datos. Por ejemplo, una ficha biográfica de autores de obras de arte.
  • Decidir sobre que propiedades de la información son facetas para los usuarios. Por ejemplo, el precio, como un rango, podría ser una nueva faceta de búsqueda, en el caso de una galería de arte. En el caso de la ficha biográfica de autores, el nombre no es una faceta, aunque se pueda buscar por él, pero sí lo son país, estilo, época, escuela, etc.

Si bien no es necesario el uso de estándares de la web semántica para la realización de un buscador facetado, la expresividad y extensibilidad de los datos, que dichos estándares proporcionan, facilitan la construcción de sistemas de búsqueda para humanos.

En definitiva, estos sistemas de búsqueda ofrecen el siguiente paso en la búsqueda (web) documental, ofreciendo capacidad de exploración y descubrimiento aplicable en colaboración, creatividad, innovación, toma de decisiones y mejoras sociales. Algunas de las áreas de aplicación son: búsquedas móviles, sistemas de colaboración en salud y bienestar, registro sanitario electrónico, ciencia de la ciencia, búsqueda en redes sociales para mejorar la seguridad, análisis de logs en el área Energética, biodiversidad, patrones de modelos climáticos, búsqueda en mapas, búsqueda narrativa, búsquedas temporales,…

 

* Marchionini, G. (2006). Toward Human-Computer Information Retrieval Bulletin, Junio/Julio 2006. Bulletin of the American Society for Information Science.

0 Comentarios

¿Quieres comentar? Regístrate o inicia sesión