Análisis de buscadores semánticos

De Casiopea
Revisión del 21:57 24 nov 2008 de Javiera (discusión | contribs.)
(difs.) ← Revisión anterior | Revisión actual (difs.) | Revisión siguiente → (difs.)

Estudio de las visualizaciones en la recuperación de resultados y respuestas de buscadores denominados como semánticos. Se trata de proyectos que actualmente están en constante cambio y desarrollo. Todos los buscadores observados poseen una gran cantidad de información en sus bases de datos, sin embargo ninguno se dedica a recuperar información específica de algún tema, por lo que todos optan por entregar los resultados de forma tradicional como listado, con algunas variaciones en las respuestas directas a las consultas ingresadas.

A continuación un resumen de las características rescatables dentro de la visualización de resultados, tomándo en cuenta que los resultados en este caso son sitios web o referencias, no se trata de artefactos como es el caso de este proyecto.

Resultados sindice 1.jpg

1. El listado de resultados tiene dos visualizaciones, la primera que muestra el link directo, más fecha y el número de tripletas localizadas que cohinciden con las palabras ingresadas en la consulta.

Resultados sindice 2.jpg

Al desplegarse el listado no se pierde la información de los demás resultados. El despliegue de información corresponde a una especificación de las inferencias realizadas para dicho resultado.
2. Se explicita la temática de los RDF encontrados o inferencias. Sin embargo, la mayoría de las personas no comprende como funciona la web semántica por lo que es difícil que sea de utilidad que se le hable de "RDF"; sí es de ayuda plantear la temática que tiene el resultado escogido.
3. Muestra las categorías dentro de las cuales está catalogado el resultado escogido. Sin embargo éstas categorías no son navegables por lo que sólo sirven de referencia.

Resultados swse 1.jpg

4. Agrupación de los resultados en clusters. Se puede visualizar los resultados en un listado tradicional y a la vez dirigirse a un cluster específico que en este caso se refiere a temáticas donde están los elementos agrupados. No son transversales, es decir, un elemento sólo puede estar contenido en un cluster.

True knowledge 1.jpg

5. Lo primero que entrega el sistema como respuesta en un texto en lenguaje natural, sea exitosa o no la búsqueda.
6. Se entrega a la persona la posibilidad de elegir la inferencia más acertada a su pregunta, el problema radica en que sólo se pude elegir una inferencia y de forma binaria, es decir, está bien o está mal. No existe manera de modificar una inferencia para que sea más acertiva.

Resultados watson.jpg

7. Especificación del tipo de resultado mediante un ícono, dependiendo si se trata de un objeto individual o una clase. Sin embargo en ninguna parte se especifica en qué consiste una clase. En la visualización sólo es el ícono lo que diferencia ambos tipos y no alcanza a ser un elemento potente visualmente como para hacer evidente tal diferencia.
8. Especificación de categorías y la fuente de dónde proviene la recuperación de la información.

Watson graph.jpg

9. Categorías o facetas que se vinculan al objeto como atributos. Estos atributos son navegables.
10. Especificación de la relación o vínculo entre objeto y los respectivos atributos. Estas relaciones no son modificables.

Conclusiones
En general todos los sistemas entregan visualizaciones convencionales para los resultados, agregando pequeñas variaciones para determinar la parte semántica, sin emargo son pequeñas innovaciones que la mayoría de las veces resultan ser tan sutiles que no alcanzan a ser de real utilidad al momento de elegir un resultado u otro. Estas variaciones tienen la función de hacer más fácil y rápida la comprensión de la persona que está buscando en la gran lista uniforme de resultados lo que necesita. Lo más probable es que no lea todo el texto a pesar de que cada elemento es preciso en palabras como para que se comprenda facilmente de que se trata cada uno. Para ello es bueno entregar los mismos resultados en agrupaciones como clusters, categorías, etc. Agrupaciones o atributos que pueden evidenciar de mejor forma un panorama de la totalidad de elementos arrojados como respuestas.

El proyecto que más se acerca a un dialogo con las personas que ingresan consultas es el proyecto True Knowledge. Consiste en un motor de búsqueda semántico que pretende contestar las preguntas (tal cual) de los usuarios. Se incentiva el ingreso de una pregunta que puede ser contestada por el sistema con un o no, o bien entregar las posibles respuestas que corresponden a inferencias complejas de acuerdo al significado de la información contenida en su base de datos.
Cada palabra es reconocida por el sistema como clase o sub-clases que pueden corresponder a lugares, personas, eventos, etc. Este sistema está actualmente en estado beta. El principal objetivo de este proyecto es que se genere un diálogo en lenguaje natural entre las personas y el motor de búsqueda mediante preguntas y respuestas. El sistema declara las inferencias realizadas y la persona tiene la posibilidad de enriquecer con sus propios conocimientos nuevas clases e incluir nuevos términos en ellas.

Motores de búsqueda analizados:

True Knowledge

Watson

SWSE

Sindice