Sistemas de Búsqueda Semántica

De Casiopea

Proyecto de Titulación Diseño Gráfico
Javiera González Cancino

Otras versiones del estudio:


Diseño De Interacción para un Explorador Patrimonial

Modelo de diálogo para un sistema semántico de recuperación de la información

  • Infografia busqueda.jpg

Introducción

Este estudio tiene como objetivo crear un modelo de diálogo transparente y dinámico entre las personas y los sistemas de búsqueda. Se plantea un proceso que consta de dos pasos mediante la especificación del lenguaje natural, en la cual el sistema se alimenta de la información especificada por las personas. La idea es transparentar el proceso que realiza el sistema para entregar resultados a partir de las palabras ingresadas por las personas mediante claves visuales, ya que a partir de esta comprensión se podrán refinar mejor las consultas búsquedas. Las claves para que se genere un diálogo entre la persona y el sistema corresponde al manejo y refinación de la consulta, por lo que es necesario convenir un lenguaje apropiado para ambas partes. Para ello se debe tener en cuenta la importancia de la consulta como una primera instancia en la cual la persona manifiesta su intención o necesidad de información y luego cómo entrega el sistema dicha información de manera clara y obedeciendo a los requerimientos semánticos requeridos en la consulta. Se definen directrices gráficas para hacer visible el funcionamiento de la recuperación de información y la posibilidad de que las personas intervengan el proceso de recuperación para su afinación semántica.

Directrices claves del modelo

Este modelo se define mediante dos directrices claves:

Analizador Semántico

Etiquetas facetadas
El modelo de interacción consiste en un ciclo de dos o tres pasos: la consulta, la recepción y examinación de los resultados y la reformulación de la consulta.[1] Se plantean 8 pasos en el proceso de la recuperación de información

  1. La necesidad de una persona por información
  2. Elección de un motor de búsqueda
  3. Formulación de una consulta
  4. Envío de la consulta al Sistema
  5. Recepción de la información mediante items (generalmente un listado)
  6. La persona escanea, evalúa e interpreta los resultados
  7. Termina el proceso o
  8. Reformula la consulta retornándo al paso 4

El valor que tiene el funcionamiento de la web semántica es la capacidad de determinar el significado de las cosas gracias a las relaciones realizadas (gracias a ontologías) que disponen a las cosas dentro de un contexto.

El Analizador semántico corresponde a un paso anterior a ésto dentro del proceso de recuperación de información en los motores de búsqueda. Pretende que las personas especifiquen el significado de los términos ingresados en su consulta (Entre el paso 3 y 4) para recibir inmediatamente resultados más acertivos.
Los metadatos como etiquetas o tags que son agregadas a artefactos han sido un elemento potente dentro de la web en los últimos años principalmente utilizado en las redes sociales. La etiquetación mediante términos libres del lenguaje han permitida mejorar la encontrabilidad de los artefactos. El valor que toman estas etiquetas se debe a su masificación y al uso de éstos términos en un contexto del lenguaje en ciertos círculos sociales.[2] De ello nace el término folksonomía atribuído a Thomas Vander Wal. Sin embargo cada término puede poseer diferentes significados y es éste punto del que se hace cargo la semántica . Para el modelo de diálogo se ha planteado un sistema en el cual cada etiqueta que posee un elemento es anidada a una faceta predeterminada para ayudar a su encontrabilidad y a la especificación de ese término.
Esto permite que los elementos que están aislados puedan ser localizados por vías no jerárquicas sino por agrupaciones semánticas. Luego se plantea la directriz que potencia la eficacia del reconocimiento semántico de los términos con que se da cabida al diálogo. Esta es la especificación del significado de cada término mediante facetas (igualmente predeterminadas) que explicitan a qué se refiere cada palabra mediante cuatro clases: Temática, Persona, Lugar, Fecha.

Módulo inferencias

Transparencia del proceso
Lo primero es plantear una zona de potencial diálogo textual donde la persona en una primera instancia ingresa el requerimiento de información para después recibir las inferencias realizadas por el sistema que pueden ser corregidas, añadidas, modificadas, etc. La idea es que las personas intervengan en el proceso de recuperación de la información aportando refinaciones semánticas enriqueciendo al sistema de nuevas relaciones entre los objetos. Dicha zona de diálogo es similar al planteamiento de Vigotsky de una Zone of Proximal Development o ZDP en el aprendizaje de las personas. Vigotsky plantea que existe una zona en el aprendizaje de una persona que se ubica entre el nivel de desarrollo que posee y el potencial nivel de desarrollo que puede alcanzar con la ayuda de un sujeto con más capacidades.[3] En este caso es la zona donde se alberga la retroalimentación del aprendizaje entre la persona y el sistema como el modelo de scaffolding o andamiaje en el cual el desarrollo de una actividad se da colaborativamente entre dos sujetos con diferentes niveles de conocimiento, en este caso el sistema posee la información y la persona el lenguaje semántico que enriquece las vías para su recuperación; ambas partes se complementan y potencian la recuperación de la información mediante relaciones semánticas.

El diálogo es potencialmente textual y semántico. La interfaz procura entregar herramientas para que la persona interactúa miesntras el sistema trabaja. Cada acción realizada desencadena un cambio en la recuperación de la información.


Diagrama modelo color.jpg

La Información en web Semántica

Estados de la informacion.jpg

La web semántica consiste en una nueva extensión de la web, en la cual la principal ambición ha sido el acceso a la información más acertada respecto de los significados.
Las personas son las que poseen la cualidad de otorgar dichos significados a las palabras y objetos que están en la web por lo que el diálogo con los sistemas debiera refinarse a este lenguaje.
El lenguaje posee tres dimensiones la dimensión Sintáctica, la Semántica y la Pragmática. [4] La web hasta poco tiempo atrás procesa los contenidos de forma sintáctica relacionando y rescatando signos de forma individual por palabras claves.
Sin embargo las múltiples relaciones que tienen las palabras permiten generar diferentes significads que son mucho más complejos que las palabras por sí solas.
La Semántica se hace cargo de la relación que existe entre los signos y de los significados que permite la conjugación de ellos, permitiendo conceptos complejos como contextos o circunstancias.
La información entonces no es sólo datos que están guardados, la información se expresa en lenguajes por lo que es indispensable tener en cuenta el comportamiento de éste para el desarrollo de sistemas que trabajan con la informacón misma. Es necesario tener entendimiento de los estados de la información, como Bases de Datos en un principio para ser almacenada, y luego debe ser recuperada mediante relaciones que la saquen a flote y ubicarla relacionada e integrada a un contexto que será el que de valor al elemento.

Los estados de la Información

Proceso mediante el cual la información comienza siendo sólo un Dato o elementos individuales y aislados hasta llegar a transformarse en información contextualizada gracias a relaciones con otros elementos que permiten una comprensión mayor del elemento y su significado.


La Recuperación de la información en Web Semántica

Proceso de búsqueda en la web semántica

El proceso de búsqueda comienza cuando una persona tiene una intención por encontrar información acerca de algún tema, el interés por esta información desencadena en una intención la cuál se traduce en una frase. Esta frase es ingresada al sistema de búsqueda mediante la escritura, sin embargo para este proceso deberían formularse frases semánticas, es decir que cada palabra de esa frase es reconocida por su sentido y el sentido general que otorgan las relaciones de dichas palabras, es decir el sentido de la frase. La frase corresponde al modo de comunicación entre la persona y el sistema es por ello que gran parte del éxito de una operación o proceso recae en la correcta proposición de frase. El sistema toma esta frase y comienza a generar inferencias mediante axiomas y ecuaciones lógicas, para luego buscar en las bases de datos y traer la información requerida. Este modo de generar inferencias se da gracias a las Ontologías que refieren directamente al sentido de cada concepto las relaciones existentes con otros. Este lenguaje es llamado OWL y corresponde a un lenguaje de marcado para publicar y compartir datos usando ontologías en la World Wide Web. Tiene como objetivo facilitar un modelo de marcado construido sobre RDF y codificado en XML.[5]

Existen varias Ontologías que ya son utilizadas por convensión para especificar a que clase corresponde un término. Es decir, si una palabra o frase se refiere a una persona o una entidad o un lugar.
Algunos ejemplos son:[6]

  • FOAF Para describir a las personas, su relación con otras y sus actividades.
  • Geospatial que describe la posición física de los objetos.
  • Geonames permite agregar información georeferenciable.
  • SIOC describe información de comunidades on line
  • Semantic Media Wiki permite describir la información de Wikipedia

“gracias a las ontologías y las relaciones que establecen entre distintos componentes, las computadoras podrán entender el significado de la semántica asociada a una web siguiendo los links especificados por las ontologías.”[7]

Una vez generadas las inferencias se arrojan los resultados a la persona jerarquizados según los parámetros de búsqueda y en la visualización que haya determinado el sistema o el mismo usuario.


Funcionamiento del lenguaje en la web semántica

Para que el sistema reconozca semánticamente el contenido la información debe estar programada en el lenguaje determinado para ello. Las inferencias que realice el sistema o los datos que reconozca lo hará mediante el reconocimiento de las llamadas URIs o Universal Resource Identifier. Éstas se estructuran en tripletas de información, cada tripleta contiene tres URIs para describir un concepto. Existen varios formatos para publicar la información, el más conocido hasta el momento es el formato RDF Resource Description Framework[8] que es un formato genérico que soporta y permite traducir cualqiuero cosa y las relaciones que puede tener un término para constituír una instancia. En otras palabras, el Lenguaje RDF permite traducir finalmente la información. Una tripleta es una estructura básica para mostrar la relación entre tres conceptos y crear un concepto nuevo. En el ejemplo se presentan 3 Uris, una especifica al sujeto llamado Sean B. Palmer que además es una persona que es creadora de un objeto o artefaco llamada “The Semantic Web: An Introduction” la Relación entre el nombre del objeto y el artefato no es directa, sólo se vinculan gracias a la propiedad de “creador de un elemento”

Ejemplo de un concepto en lenguaje RDF
Frase de búsqueda y sus clases

La frase constituye la intención de búsqueda de la persona, con ella se permite el dialogo con el sistema. En el caso de la web semántica se puede especificar las clases a las que pertenecen las palabras que son ingresadas. Las palabras pueden ser reconocidas por sujetos (personas con aplicaciones FOAF, personas que pueden compartir información) verbos, objetos, adjetivos y rangos temporales (valores numéricos o nombres de épocas) De esta forma una frase compuesta de varias palabras puede ubicar la información siguiendo estas especificaciones del sentido que tiene cada palabra ingresada.

Frase de búsqueda y sus clases

Los resultados de búsquedas se arrojan en listas con jerarquías de relevancia respecto de la frase consultada, en esta lista arroja la información que encuentra específicamente dentro de las clases antes nombradas, en este caso sujetos coleccionistas y sujetos pintores, objetos pinturas, etc.

Frases textuales expresadas en estructuras RDF

1. Ejemplo de una frase traducida en Notation 3 [9]

Ilovesemanticweb.jpg
@forSome <#jav>. <#jav> <#loves> <#you>
@forAll <#h>. @forSome <#jav>. <#jav> <#loves> <#h> 
significa: for all h, for some jav, jav loves h <--- Sentencia
(“Every has someone who loves them” rather than
“Somebody loves everybody”) which you might think of as ~h(~jav(loves(jav,h))

2. Ejemplo de un artefacto perteneciente al Archivo José Vial Armstrong y su traducción a una estructura RDF

Frase de Consulta: "documentos de miguel eyquem"
Sentencia: Miguel Eyquem es el creador [autor] del recurso http://www.ead.pucv.cl/1985/acerca-de-la-cruz-del-sur/

*Sujeto (Recurso): http://www.ead.pucv.cl/1985/acerca-de-la-cruz-del-sur/
*Predicado (Propiedad):	Creador
*Objeto (Literal):Miguel Eyquem

El artefacto trae consigo la siguiente tabla de propiedades que puede ser extraída por sistemas semánticos de recuperación de información de sitios web o wikis [10]: Tabla propiedades artefacto.jpg

La estructura se despliega en un grafo textual de la siguiente forma:

Ejemplo estructura rdf.jpg

Benchmark motores de búsqueda

Análisis a los métodos existentes en Recuperación de la Información:

Interacción humano-sistema

Esquema basado en el esquema "Human-System Interaction" de http://humanslab.ece.gatech.edu/HRI/hri.html
Esquema de retroalimentación Persona-Sistema en el proceso de Recuperación de la Información

Para que exista la comunicación entre el sistema y la persona debe existir un espacio en el cual ambas partes puedan entregar la información o requerimientos que tienen. Dicho espacio debe tener leyes de sintaxis que sean reconocibles y utilizables tanto para la persona como para el sistema y de esta forma lograr que ambos interactúen y logren la retroalimentación o feedback (uno de los principios para el diseño de Interfaces para usuarios[11])
Una de las principales virtudes que la web semántica ofrece (promete) es el enriquecimiento semántico de los contenidos en la web gracias a su traducción a RDF y la posibilidad de generar relaciones semánticas entre contenidos de recuperar información y además inferir todo el contexto o instancias de información relevante que rodea a dicha información. Como el sistema es semántico “sabe” el significado de los términos en juego por lo tanto puede realizar conexiones por otras vías no tradicionales (sintácticas) relativas al significado de los contenidos.

En el caso de la recuperación de la información, el sistema es capaz de acceder a la información por vías sintácticas y semánticas. Por otro lado las personas tienen la capacidad de manejar un lenguaje potencialmente semántico por lo que debiera por medio de la interacción de ambos personajes, darse la retroalimentación. El “entendimiento” semántico (del sistema) y el acceso eficaz a la información requerida (de la persona).
El espacio de interacción entre persona-sistema es similar al sistema de aprendizaje propuesto por Vigotsky en el sentido de un “maestro” que entrega sus capacidades al discípulo para que éste por medio de la imitación realice las actividades por sí sólo en un sistema llamado andamiaje.
En éste caso el sistema transparenta las inferencias realizadas mediante ontologías para que la persona comprenda el proceso de recuperación que ha sido realizado, de esta forma si el sistema arroja inferencias incorrectas la persona puede manejar dicho proceso y refinar la búsqueda directamente en la “caja negra”. Este modelo de diálogo se da gracias a las acciones de ambos roles (sistema y persona) que en sinergia se complementan y permiten la retroalimentación. A su vez la persona es capaz de entregar al sistema la inteligencia para formular las consultas, las especificaciones semánticas de los términos de consulta y el manejo de las inferencias realizadas permitiendo al sistema aprender de dichas acciones del usuario.

FAQ-o-Sphere by tom gruber.jpg

Tom Gruber plantea que la combinación de los roles del usuario y sistema permitiría un diálogo estructurado que enirquecería el sistema de recuperar información, permitiendo un Sistema de conocimiento colectivo o Collective Knowledge System[12]. En el esquema FAQ-o-Sphere se plantean tres directrices que permiten la la eficacia del proceso:

  • Una comunidad de contribuyentes que participan en un proceso social en aumento por la comunicación mediante computadoras.
  • El motor de búsqueda que es capaz de recuperar información.
  • La inteligencia de los usuarios que consultan activamente al sistema mediante estrategias en el proceso de generación de contenido y el motor de búsqueda.

Diálogo mediante Lenguaje Natural

Las personas por naturaleza aprenden a comunicarse con los demás mediante el lenguaje y usualmente generan y obtienen conocimiento mediante la conversación. El creciente uso de Internet en la vida de las personas permite que "las máquinas" ayuden a las personas a crear y adquirir más conocimiento entre sí.[13] El sistema de búsqueda semántico apunta a mejorar la comunicación entre la persona y el sistema en la entrega de resultados acertivos respecto del sentido de la pregunta hecha por la persona.
El buscador tiene un sistema capaz de reconocer la semántica de la información, datos y en este caso de las palabras conjugadas en una frase. Esta capacidad de poder asociar las palabras otorgando un Sentido permite que las personas puedan acercarse a comunicar mediante el Lenguaje natural (PLN) (Medio que utilizan las personas de manera cotidiana para establecer comunicación con otras personas [14]) a los sistemas lo que requieren y recibir respuestas acertadas a lo que realmente están solicitando al sistema.
La idea es ayudar a que esta comunicación con los sistemas de búsqueda se acerque cada vez más a la utilización del lenguaje natural, es por ello que se plantea la frase como la principal herramienta de conversación para consultas y la especificación del sentido semántico de las palabras ingresadas por las personas.
Las facetas como especificación de la semántica
La frase que ingresa la persona se compone de palabras clave y palabras conectivas; son las palabras clave donde se debe especificar el sentido de la frase, en este caso para los parámetros de búsqueda, el sentido de cada palabra corresponde a la conjugación de una faceta. Es decir si se especifica un sentido a la palabara como “lugar” “persona” “fecha”, etc. éste sentido en realidad va a corresponder a una faceta que permitirá encontrar resultados de acuerdo a dicho parámetro de especificación.
Al ser la frase en lenguaje natural el medio para comunicar las necesidades al buscador, el sistema debería entregar respuestas en este mismo lenguaje. Respecto de ello, existen sistemas de recuperación de información que pretenden dar respuestas muy concretas en este lenguaje natural llamado Question Answering (QA). Para ello se realiza un análisis de textos escritos en lenguaje natural al igual que la pregunta, de los cuales se extraeran unos fragmentos en los cuales se localiza la respuesta a la pregunta solicitada.[15] Sin embargo es difícil que en estas instancias el sistema otorgue siempre resultados acertados, es probable que se generen “incoherencias”, de modo que la persona debiera tener la posibilidad de manejar o corregir los resultados, para que el sistema se perfeccione a medida que los mismos usuarios corrigen los errores.

Composición de la Frase de Consulta

La primera fase dentro del proceso de búsqueda corresponde a la intención de una persona que pretende encontrar información. Para ello requiere de algún sistema que lo ayude a explorar con la gran cantidad de contenidos en las bases de datos que posee Internet, sin embargo es necesario un canal y algún lenguaje con el cual la persona pueda “comunicarse” con el sistema. Para ello como se ha evidenciado en el estudio Modalidades y especificaciones de búsqueda, esta conversación se lleva acabo por palabras claves que ingresan las personas, por la selección de categorías o por la discriminación de parámetros Los estudios realizados en motores de búsqueda de web semántica han innovado en el sistema de recuperación de contenidos y en la visualización de los resultados evidenciando las relaciones semánticas. Sin embargo, el modo de funcionamiento semántico es totalmente distinto al ya estandarizado sistema de búsqueda sintáctico. Si el modo de operar en la recuperación de datos es diferente entonces es fundamental que las personas comiencen a generar consultas especificas para este tipo de búsqueda. Los sistemas experimentales de web semántica [16] siguen manteniendo las modalidades de ingreso de consultas tradicionales, ya que las personas en general están acostumbradas a estos sistemas que de cierta manera funcionan, sin embargo están diseñados para que las personas encuentren contenidos según palabras claves, por lo que generalmente la paleta de resultados es tan diversa que es probable que sólo un pequeño porcentaje de los resultados arrojados tengan una relevancia respeto de lo que la persona requiere.

Existen varios sitios que trabajan en la recuperación de datos semánticamente, sin embargo esto no pasa de ser un simple funcionamiento que queda oculto y que realmente no revela ninguna diferencia ni siquiera en la forma de arrojar los resultados ya que no se evidencian realmente las relaciones semánticas que ha inferido en los datos.

El próximo paso en esta investigación será plantear una nueva modalidad de búsqueda en la cual todas las fases de este proceso converjan a una conversación fluida de la persona con el sistema mediante la proposición de frases de consulta correctas, la transparencia del funcionamiento del motor de búsqueda y simultáneamente la evidencia de las relaciones semánticas con que el sistema responde a la consulta.

La idea es que a medida que la persona plantea su frase de consulta el sistema genera simultáneamente las inferencias de este modo la persona se da cuenta de cómo esta trabajando el sistema en ese proceso hasta ahora invisible para los usuarios, va generando visualizaciones de los resultados encontrados. Y a la vez la visualización de los resultados debe evidenciar una jerarquía entre los elementos que muestra ya sea por relevancia, por parámetros de visualización que podría elegir el usuario y las relaciones semánticas que existen; creando de esta forma un universo de objetos semánticamente conectados que representaran un panorama de la información contextualizada.

Primera proposición de analizador semántico para un explorador patrimonial

Visualización de la Información

La Visualización es la representación de datos o información abstracta en una imagen. La idea es crear un espacio abierto y navegable, donde se permitan visualizar las relaciones (semánticas o de otro orden) entre los artefactos y permitir al usuario acceder a más información a partir de una búsqueda. Al entregar los artefactos unidos por relaciones a múltiples elementos relacionados, se permite ubicar a un elemento dentro de un panorama donde convive con otros generando una contextualización de la información.

Generalmente los buscadores genéricos o específicos, como las bibliotecas digitales arrojan extensos listados de resultados con los documentos de respuesta a la consulta generada, sin embargo es difícil para las personas encontrar rapidamente lo que efectivamente necesita ya que la lectura y comprensión de los resultados es muy lenta.
Las visualizaciones de resultados más usadas son los Listados ya que permiten entregar en una página muchos elementos descritos de forma textual. Sin embargo en estas visualizaciones, es imposible tener una percepción del panorama total de respuestas generada por el sistema. Los listados se navegan por paginación y es el número de páginas lo que determina en cierta forma la cantidad de respuestas arrojadas. De la misma forma es imposible ver las relaciones semánticas que influyen en la eficacia de las respuestas respecto de la consulta echa por la persona. Cada elemento del listado es arrojado como si fueran equivalentes entre sí, el único parámetro que puede tener la persona es que los primeros resultados de la lista son los más relevantes respecto de la consulta realizada.
Lo más probable es que si la persona no encuentra lo que busca en los 10 primeros elementos no lo hará en los siguientes resultados por lo que se deberá generar una nueva consulta con un mayor grado de especificación.

Agrupaciones en clusters

Recientemente, se han desarrollado varios accesos a los resultados de búsqueda mediante clusters o agrupación por etiquetas para proporcionar a los usuarios un panorama general de los resultados y un acceso más fácil a la información relevante[17]
Estas agrupaciones son flexibles y se adaptan a los resultados que sean arrojados independiente de las cantidades o atributos que tengan en particular. Sin embargo necesitan constituír palabras muy exactas y precisas para ser significantes de los resultados que contendrán. La ventaja que entregan estas agrupaciones es que permiten ordenar los resutados bajo nuevos parámetros sin que ésto afecte a los artefactos mismos. Sólo es una forma simultánea de agrupar una lista uniforme de elementos. Es decir que además del orden en que son ordenados los resultados (por relevancia, por temporalidad, orden alfabético, etc.) existe una nueva forma de nombrar ciertas categorías que refieren a cualidades más semánticas de los elementos ya que se agrupan por temáticas, propiedades, tipos, etc.

Relaciones en grafos

Ejemplo de una visualización de resultados dentro de un grafo
Despliegue de ficha de un artefacto en un grafo y en un módulo tabular

Permiten crear un espacio en el cual se disponen múltiples objetos simultáneamente permitiendo comparaciones, relaciones, y agrupaciones. Cada objeto se mide con sus mismos pares, de modo que la visualización representa un panorama general donde cada parte convive y tiene valor respecto del todo.

A su vez los objetos en el espacio se anclan bajo ciertas coordenadas (x, z) que determinan atributos particulares bajo los que se rigen dentro del espacio y que permite graficar atributos transversales entre artefactos.

Por otra parte en toda visualización puede otorgarse la posibilidad de elegir a los usuarios parámetros de búsqueda de manera que se puede visualiza la totalidad así como también discriminar esa visualización de resultados. Son posibles múltiples jerarquías de aparición en el espacio, según facetas, como la relevancia, fechas, categorías, etc. Estas facetas son en sí agrupaciones que están sobre las categorías donde se ubica cada artefacto, ellas permiten que los objetos que siempre están aislados en la profundidad de categorías y subcategorías puedan visualizarse en un primer nivel y además poder pertenecer a más de una categoría. Se generan relaciones transversales.

En el ejemplo se ubican los artefactos en el espacio libremente, sin coordenadas que posicionen su ubicación.

Los artefactos se agrupan en islas según su fuente de origen, en este caso el grupo más grande corresponde a artefactos del Archivo José Vial Armstrong, además existen otros artefactos correspondientes a otros archivos patrimoniales que contienen artefactos relacionados con algún término de la frase de consulta.

Las líneas vinculan a los artefactos con los términos especificados por el usuario, la frase se descompone en el sujeto, el predicado y sus conectivas.

A pesar de que los artefactos se manifiestan sin distingos en el espacio existen jerarquías que pueden determinarse por la relevancia que tengan mediante el porcentaje de acertividad que tengan con los términos consultados, éstos muestran un thumbnail, algunos datos importantes como la fecha, título, etc.

Pueden existir parámetros discriminatorios para la visualización, como una línea de tiempo en la cual se puede determinar un rango temporal. De esta forma sólo permanecerán visibles en la visualización los artefactos inscritos dentro de este rango temporal.

En el momento que es escogido un artefacto se despliega una ficha más completa pero sigue siendo una vista preliminar y no corresponde al artefacto en sí.

A su vez se despliega un panel tabular que ubica al artefacto dentro de su contexto dentro del archivo al que pertenece. Se muestran los artefactos paralelos dentro de las categorías que lo contienen. Esto permite reconocer la raíz de donde viene este artefacto.

Ejemplo de una visualización básica de artefactos relacionados en un grafo


Resultados Facetados

Menú para discriminar resultados por Facetas

Las facetas corresponden a las dimensiones que componen un objeto como tal. Funcionan como atributos o propiedades que cuelgan de cada objeto o artefacto.

Posee dos ventajas respecto de la accesibilidad y navegación del artefacto:


Localización

El recurso está disponible por múltiples vías.
La descripción de los objetos o artefactos mediante facetas permite a las personas localizar los objetos mediante vías específicas que son determinadas dependiendo de lo que requiera. La persona discrimina del universo de posibles resultados mediante las áreas específicas que le interesan.

Transversalidad

Los recursos son localizables con homogeneidad, independiente de la estructura donde son concebidos.
Las facetas son dimensiones paralelas de los artefactos de manera que se pueden realizar agrupaciones de objetos que se ordenan según una faceta, permitiendo relaciones de dichos objetos que pertenecen a faceta transversal. Estas agrupaciones permiten que los objetos se visualicen interoperando bajo órdenes que se manifiestan según los requerimientos del usuario. La clasificación facetada permite que a pesar de que los elementos se encuentren clasificados de forma jerárquica pueden localizarse independiente del nivel en que se encuentren, ya que el orden en que se evidencian y ordenan se da según estas dimensiones transversales a la jerarquía.
Existen 4 facetas que son discriminantes de los resultados arrojados por la frase de consulta, corresponde a un segundo campo de especificación. Las tres primeras facetas despliegan un campo libre para ingresar keywords y la faceta “Tipo” despliega una lista con cuatro opciones de formatos, es posible elegir una o más facetas. La Faceta autor corresponde a nombres de personas que tengan un atributo autoral respecto de los artefactos. En caso de que el usuario requiera un tema particular puede ingresar dicho tema en la faceta “temática”. Se ha planteado una faceta que corresponde a circunstancias o hechos particulares que han ocurrido en la historia, sobre todo si este sistema se hará cargo de la información patrimonial de los archivos de la ciudad; ésta se a llamado “Eventos”. La última opción es la discriminante por “Tipo” en la cual se da un listado para que el usuario elija los formatos en los que requiere los artefactos, por ejemplo si quisiese sólo fotografías, deberá marcar la opción “Imagen”.

Listado de resultados

Listado facetado de Artefactos

Listado desplegable de resultados ordenados por relevancia o por fecha del artefacto. Previamente son discriminados por las Facetas. En el listado se entregan tablas donde cada una corresponde a un artefacto, por ello se debe entregar la información básica de dicho artefacto. Es necesario otorgar sólo los datos principales para que el usuario se de cuenta de que es realmente ese resultado. A su vez se puede desplegar esa tabla para ver más datos, en este caso al desplegar un artefacto se visualiza parte de la descripción, de modo que la persona puede entender mejor de que se trata y ver si efectivamente corresponde a un artefacto útil para él. Cada tabla dentro del listado dice del Tipo, es decir, si el artefacto es una imagen, Texto, Video o Audio. En información textual se declara el Título, la fecha del artefacto (no de publicación), categorías a la que pertenece dentro del Archivo, autores, Descripción y Formatos disponibles con su peso para descarga.

Primer Prototipo para la visualización de resultados


Visualización de Resultados

La segunda parte del Explorador Patrimonial corresponde a la visualización de los resultados.
En este caso se necesita traer a presencia diversos artefactos de forma homogenea a pesar de estar concebidos dentro de estructuras jerárquicas independientes que además corresponden a diferentes formatos que se visualizan mediante distintos medios.

El primer problema que surge en la entrega de resultados es la disparidad de tipos. En la visualización deben convivir los diferentes formatos (Audios, imágenes, documentos y videos. La entrega de los elementos dispares debe privilegiar la homogeneidad pero evidenciando la distinción de cada uno. Para ello se han diseñado íconografía para los 4 tipos de archivos que puede contener el Archivo.

Unidad Artefacto.

  1. Estado inactivo dentro de la visualización Temporal y Espacial. Corresponde a puntos que cinviven ordenándose según la visualización que corresponde y agrupandose según las relaciones de facetas que posean entre artefactos. La única información que se entrega al usuario es el tipo de artefacto que corresponde mediante íconos
  2. Al mover el mouse por éstos puntos se despliega hacia la derecha el título de publicación del artefacto.
  3. Al presionar (cualquier lugar) del artefacto el despliegue de información es hacia abajo. Aqui se manifiestan datos como la Descripción, la fecha original y de publicación, las facetas, etiquetas, thumbnail o reproducción, etc.

Explorador Patrimonial

A partir del estudio realizado se crea un modelo de diálogo entre las personas y el sistema para la recuperación de la información aplicado a un Explorador Patrimonial.
Para la existencia de cualquier buscador es necesario por un lado poseer información, datos que puedan visualizarse y por otro lado personas que requieran éste contenido. Se toma como modelo el Archivo Histórico Patrimonial José Vial Armstrong de la e[ad] que posee una memoria de registros desde décadas en una diversidad de artefactos de diverso tipo, relacionada a diversos ámbitos. Además se trata de un Archivo en el cual se está generando continuamente material de registro nuevo. Para la interfaz de este espacio de búsqueda semántico se plantea un sistema modular en el cual se genera todo el proceso de diálogo entre la persona que consulta y las afinaciones que regula la persona para refinar los resultados.

Las Directrices principales dentro del Módulo de Exploración Patrimonial que se presentan a continuación son tres:

  • Etiquetas y Términos Facetados
  • Transparencia de las Inferencias (Ontologías)
  • Listado homogéneo de Resultados

El módulo de búsqueda toma el nombre de “Explorador Patrimonial” ya que en él se da lugar no sólo a la búsqueda. Se trata de un espacio en el cual se entabla un diálogo con el sistema para refinar los contenidos que la persona requiere. No sólo se plantean las búsquedas sino también las especificaciones de términos, el analizador semántico, la edición de las inferencias, etc. Se trata de un panel que permite explorar e interactuar con los contenidos de forma semántica.

Primer estado del Módulo

Cajabusqueda1.jpg

Cuando no se ha ingresado ninguna consulta el Explorador se mantiene un mensaje para incentivar el ingreso de una consulta.
Se presenta de ésta forma a lo largo de todas las páginas del sitio. La caja de texto es la parte fundamental del buscador ya que es ahí donde se da cabida al ingreso de la frase de búsqueda, es aquí donde comienza la conversación con el sistema. La caja y la tipografía es más grande que las de buscadores tradicionales (La caja tiene más de 30 pixeles de altura y la tipografía es cuerpo 16).
Sobre esta frase se despliega el analizador semántico que corresponde a una segunda instancia de comunicación de la persona con el sistema.

Ingreso de la Frase de Consulta

En el momento que la persona comienza a tipear la frase de consulta en la caja de texto el sistema comienza a reconocer los términos ingresados y a ejecutar el “analizador semántico”.
Entonces el botón de búsqueda cambia de estado a “procesar” para evidenciar a la persona que mientras se ingresan términos, el sistema de forma simultánea esta realizando una operación con éstas palabras. La idea es que tanto el ingreso de términos como el proceso de análisis de los términos ingresados sea simultáneo, y si se modifica algo el cambio sea automático.

Cajabusqueda2.jpg

Ingreso de la frase
El elemento de interfaz clave en el ingreso de la frase de consulta es el botón “buscar” que en esta instancia se modifica a “procesar”.

Analizador Semántico

Sobre la caja de campo en la cual se ha ingresado la frase se despliega automáticamente el analizador semántico. Esta acción es un proceso que se genera simultáneamente a medida que los términos son ingresados. Cuando la frase deja de ingresarse el botón que indica el proceso del sistema cambia nuevamente a buscar. La idea es que la persona verifique si el reconocimiento que ha realizado el sistema de las palabras corresponde al significado correcto. De ser así puede accionar el botón Buscar inmediatamente para arrojar los resultados.
El sistema puede reconocer cuales son las Palabras Clave de la frase y cuales son las conectivas, que pueden estar de antemano predeterminadas (por lo menos del idioma español). En este caso las palabras conectivas como de, en, por, etc. serán obviadas por el analizador semántico.

Analizador semantico.jpg

Analizador Semántico
Corresponde a una capa que aparece sobre la caja de texto. Se puede trabajar en este espacio modificando las facetas asignadas a cada término.

Reconocimiento de términos por facetas

Todo término que no es una conectiva puede pertenecer a facetas genéricas en las cuales el usuario puede especificar el significado que realmente tiene cada palabra que en conjunto determinarán el sentido de la frase. Se piensa que cada término debe ser asignada a una faceta. Estas facetas genéricas son:

  • Temática

Se refiere al caso en el cual una etiqueta es un término amplio, relativo a un tópico o a un conjunto de temas. Persona. Nombre del sujeto

  • Lugar

Permite asignar referencias geográficas que no considera el artefacto dentro de su descripción.

  • Tiempo

Se refieren a tiempos históricos en el cual se origina el artefacto, movimientos artísticos, épocas, periodos políticos, etc.

  • Personas

Asignar personajes relacionados a los contenidos de los artefactos aparte de su autor. Estos pueden ser nombrados tanto como por su nombre y apellido, como también por identidad social.

Cajabusqueda3.jpg

Despliegue de facetas
Cada faceta que a sido asignada por el sistema a los términos o Palabras Clave dentro de la frase. Ahora cada una de ellas puede ser editada por la persona mediante un drop down que muestra las cuatro facetas posibles para los términos.

Transparencia de Inferencias

El paso inmediato al después de haber verificado la información del analizador semántico es el despliegue de las inferencias realizada por el sistema junto con los resultados de búsqueda. La caja de texto vuelve a su estado inicial con el mensaje “ ingrese frase de búsqueda” ya que los resultados para esa frase ya han sido arrojados. Las refinaciones que se hagan en el módulo se evidenciarán en los resultados, pero la frase de búsqueda ya no necesita permanecer en ese lugar. Se mantiene como un recordatorio al usuario “Buscaste por la frase ...” para permitir al usuario el ingreso de una nueva consulta.
Como se ha planteado el dialogo de la persona con el sistema mediante frases, las inferencias generadas son dilucidadas mediante frases igualmente, el sistema contesta en el mismo lenguaje. Estas inferencias a pesar de que se comportan como frase son realmente grafos que unen dos o más elementos (palabras clave) y le otorgan un nuevo sentido más complejo gracias a vínculos (palabras conectivas) que pueden referirse a pertenencia (de, en), equivalencia (es, son), etc.

Cajabusquedainferencias.jpg

Prototipo módulo de inferencias
Cuando se despliegan las inferencias realizadas se mantienen dos columnas de frases, la primera de inferencias respecto de la frase de consulta y la segunda correspondiente a otras frases ingresadas al sistema por otros usuarios y que utilizan los mismos términos en las mismas facetas, es decir se refieren a lo mismo. La caja de texto vuelve a su estado inicial para permitir en ingreso de una nueva consulta.

transferencia de una frase a inferencia

Al lado derecho del módulo se genera una lista con otras frases que corresponden a frases de búsqueda ingresadas anteriormente por otros usuarios al sistema. Estas frases aparecen por la cantidad de coincidencias en cuanto a la similitud de términos asignados a la misma faceta. Cada frase puede ser agregada como una nueva inferencia que discriminará los resultados al igual que las que ha inferido el sistema. Cada inferencia por sí sola puede ser eliminada si se desea ampliar el número de resultados, ya que mientras más inferencias actúen en la recuperación de los contenidos menor será el número de resultados. La frase arrastrada sin embargo no se muestra como una inferencia del sistema, ya que es una frase ingresada por una persona, todos los términos son negros. Las inferencias van creciendo hacia abajo ampliando la dimensión del módulo y se vuelven a cargar nuevas frases de búsqueda relacionadas.

Cajabusqueda4.jpg


Etiquetas facetadas

La Web Semántica como infraestructura basada en metadatos aporta un camino para razonar en la web, extendiendo así sus capacidades.[18] Las etiquetas son datos que se asocian a un elemento o artefacto. El uso de etiquetas que se asignan a estos elementos ayuda potencialmente al enriquecimiento de datos y por consecuencia enriquece las vías de acceso a dicho elemento, se hace más localizable. La idea de que las etiquetas sean palabras o frases que las personas pueden vincular libremente a los elementos permite otorgar datos más semánticos que ayudarán al sistema a reconocer efectivamente qué son y qué significan. Ahora, para refinar el uso de etiquetas se propone un sistema en el cual cada etiqueta corresponde a un faceta determinada, ya que cada palabra o frase que se vincula a un elemento puede tener muchos significados (como toda palabra o frase), pero al estar ubicada como hija de una faceta queda especificado el sentido de dicha etiqueta. Se ingresa una etiqueta que significa de forma inequívoca. Por ejemplo, se puede ingresar la etiqueta “Iglesias”, pero dicha palabra puede tener múltiples significados, la palabra por sí sola queda igualmente sin valor semántico; para ello se vincula como hija a cierta faceta que determinará qué significa esa palabra vinculada a tal elemento. La palabra “Iglesias” puede referirse a una Persona (apellido de una persona), un objeto (una iglesia física) o una temática (La Iglesia como institución), etc. El vínculo de una etiqueta a cierta faceta ayudará a la especificación del significado por lo que potenciará el enriquecimiento semántico del elemento al que se une.

Faceta1.jpg

Cada artefacto lleva consigo etiquetas las que se ha determinado que al igual que en los términos de la frase de consulta se asignan a una faceta determinada. El usuario puede tomar cualquier etiqueta y ver resultados relacionados a ésta. El Explorador Patrimonial toma la etiqueta como término de consulta y genera inferencias sobre ella respecto de sus facetas y los distintos significados que puede tener.
En el caso de que la etiqueta sea hija de alguna faceta de Lugar podrá georeferenciarse en un mapa. La persona puede desechar la inferencia en el caso de que la etiqueta esté ligada a una faceta que no corresponde a lo que requiere. A dicho resultado se le pueden agregar más términos para realizar búsquedas de artefactos relacionados a más de una etiqueta.
Consulta por etiqueta
El módulo puede generar inferencias tanto en el ingreso de una frase de consulta en la caja de texto, como también por una etiqueta seleccionada desde otro elemento del sitio.

Sumar etiqueta a la búsqueda

Faceta2.jpg

1. Al seleccionar la acción “sumar etiqueta” se despliega un campo de texto con un mensaje que indica a la persona que ahí debe ingresar un término que será sumado a las inferencias.

Faceta3.jpg

2. La persona puede ingresar uno o más términos en la caja de texto y seleccionar el botón [+] para sumarla.

Faceta4.jpg

3. Al ser sumado el término puede ser o no reconocido por el sistema, ya que puede haber sido asignado anteriormente a alguna faceta. Es decir, puede que el término ya haya sido ingresado anteriormente como etiqueta por lo que tiene asignada una faceta específica. En el caso de ser así, se evidenciará esa faceta como significante del término. Si el término no es reconocido, el sistema lo arrojará sin faceta simplemente como término y no como etiqueta.

Esta opción aparece cuando ya se ha realizado la búsqueda de artefactos relacionados a una etiqueta de algún artefacto. En el ejemplo un usuario a seleccionado la etiqueta Ururguay desde un artefacto. El sistema reconoce la etiqueta a la faceta de Lugar entregando dos georeferencias, una de Uruguay como país y otra como calle de la Ciudad Valparaíso, Chile.
Decide sumar la etiqueta Diseño. Entonces los resultados serán relacionados con la etiqueta Uruguay más la discriminante Diseño. A medida que se suman términos a las inferencias existe una menor cantidad de resultados.

Pagresultados.jpg

Ejemplo de una página de resultados relacionados con dos etiquetas, Uruguay asignada a una faceta de Lugar y Diseño asignada a una faceta de temática. Se entrega un número pequeño de resultados por página, utilizando la paginacón en el caso de que sean un número mayor de las que caben en la página.

Listado homogéneo de resultados

La visualización de resultados arroja artefactos y agrupaciones de artefactos de forma simultanea, de manera que debe haber un distingo entre el artefacto individual y la agrupación de ellos. Dentro de las catalogaciones de los Archivos Patrimoniales los artefactos responden a jerarquías rígidas por lo que en este caso se entregarán tres tipos de elementos: Artefactos, Series y Colecciones. Cada una de ellas es nombrada y además tiene un icono identificatorio. Cuando se trata de un artefacto individual tiene iconos que evidencian el tipo de archivo que es (imagen, documento, audio o video). Los resultados en lista son los más claros y fácilmente comprendidos por las personas por lo que se adopta dicho patrón como primera visualización. Como los resultados pueden ser individuales o agrupaciones es necesario que el sistema los entregue de forma clara pero conservando la homogeneidad en la visualización.

Ejemplo de tres resultados en lista Además de la descripción de cada elemento de la lista y de información autoral, de fecha y Lugar, existen otros datos relevantes: 1. thumbnail Cada elemento tiene un thumb. En el caso de no tener una representación digital, el icono pasará a tomar este lugar. 2. Tipo de resultado Los dos primeros corresponden a agrupaciones de artefactos, Colección y Serie respectivamente. Se identifican mediante un icono además de nombrar “Colección ...” o Serie ....” El tercero es un artefacto individual. Por lo que el icono representa el tipo de artefacto, en éste caso, una imagen. Como se trata de un sólo artefacto sólo se nombra el título de la fotografía. 3. Agrupación de Artefactos Resumen de la cantidad y tipos de artefactos que hay en el caso de ser una Colección o Serie. 4. Etiquetas

Visualización Temporal de Resultados

Al trabajar con Archivos Patrimoniales o Históricos los resultados siempre serán artefactos o elementos vinculados a alguna fecha. Se trata de elementos potencialmente temporales por lo que existe en toda página de resultados una opción a ver los elementos en una línea de tiempo. La visualización de resultados en línea de tiempo permite ver los elementos ordenados por parámetros temporales. En el eje x se muestran las medidas temporales en décadas, años, meses y días; Dependiendo del acercamiento que determine la persona. Los elementos se agrupan en el eje Y que crece según la densidad de artefactos que existan colapsados en un rango de tiempo cercano o igual. Los elementos son visualizados como imágenes pequeñas o thumbs las que son seleccionadas para mostrar más información que está colapsada. Se muestran las etiquetas que posee el elemento agrupadas según la faceta a la que pertenecen.

Líneas de tiempo con distintos acercamientos
La primera visualización es la que se despliega por defecto. Los parámetros del eje X determinan años, las décadas están siempre presentes. La segunda corresponde a un acercamiento, por lo que los años se separan en meses y sucesivamente se visualizarían los días de casa mes si el acercamiento es mayor.

Temp.jpg

Mejoras de Interfaz para el Explorador Patrimonial

Para que el diálogo entre la persona y el sistema se cumpla finalmente no sólo debe estar bien pensados el funcionamiento del sistema. Es crucial para que se genere efectivamente el diálogo que exista un espacio diseñado en el cual la persona pueda manejar el explorador de forma intuitiva. En el diálogo que se ha planteado es fundamental la fluidez, por ello se deben diseñar las herramientas o widgets con las que la persona puede interactuar priorizando las acciones expeditas.

De los prototipos realizados anteriormente se diseñan nuevos parámetros gráficos para permitir que la complejidad de los procesos del Explorador sean manejados por las personas de forma intuitiva: Lograr que la interacción sea fluida para que el diálogo entre la persona y el sistema se cumpla . Para ello se rediseña el Explorador y todas las herramientas y aplicaciones que implica su funcionamiento.

Exp semantico estado inicial.jpg

Estado Inicial del Explorador. Se separa de forma modular el nombre del Explorador del espacio de trabajo, en este caso corresponde al estado inicial del Explorador, consiste en una caja de texto con un mensaje al usuario.
En este estado permanece la mayor parte del tiempo mientras se navega en las páginas de sitio.


Exp semantico ingreso frase.jpg

Previo a la búsqueda, el ingreso de la frase implica la acción de analizar, por ello el botón indica ese mensaje reemplazando al tradicional buscar.
Al accionar el analizador semántico el botón indica que el sistema está procesando los términos ingresados.


Exp semantico analizador 1.jpg
Exp semantico analizador 2.jpg

El analizador semántico aplica una faceta a cada término clave, sin embargo ésta es editable mediante un dropdown que muestra las opciones de facetas existentes.
A continuación dos propuestas:


Exp semantico modulo inferencias 1.jpg

El módulo de inferencias es el estado más complejo del Explorador debido a la cantidad de información que muestra y procesa de forma dinámica y simultaneamente.
Se decide dividir en dos módulos los elementos asociados directamente con la búsqueda realizada de los elementos que corresponden a sugerencias que el sistema es capaz de entregar por su relación semántica con la búsqueda realizada.


Exp semantico modulo inferencias colapsado.jpg

Ambos módulo son colapsables para no invadir el espacio en caso de que la persona necesite navegar por los resultados.

Exp semantico modulo inferencias.jpg

Las inferencias que entrega el sistema tienen la cualidad de sumarse para recuperar la información, sin embargo existe la opción de manejar las inferencias de forma excluyente con la especificación de los vínculos entre inferencias: y (sumatoria a las inferencias), o (excluyente a las inferencias) o no (excluyente a una inferencia particular). Todo esto para la refinación de la búsqueda.

+minimal.jpg
+minimal2.jpg

Más minimal, módulos más discretos sin bordes. ñe?

Drop down gris explorador patrimonial.jpg

Explorador Facetado

Visualizaciones de Resultados Facetados:

Como un segundo modelo de comunicación con el Sistema y manipulación de los contenidos es la Visualización de los Resultados.
Se trata de la última fase dentro del proceso de búsqueda donde la Persona es quién decide qué información es la que necesita y de qué modo quiere verla. Se desarrollan cuatro modos de visualizar la información bajo los parámetros de las Facetas propias de los Artefactos, los que al ordenarse en diferentes escenarios, relacionarse con el contexto de otros artefactos y parámetros logran ubicarse en un contexto de información potencialmente navegable. Las visualizaciones diseñadas permiten otorgar a cada artefacto atributos espaciales que dan cuenta de su condición en el punto de vista que se está visualizando.

En el modelo propuesto anteriormente se ha puesto especial énfasis en la interacción directa entre la Persona y Sistema de recuperación de Información, sin embargo el modelo no está completo hasta que se entregan los Resultados de búsqueda. Es necesario un espacio en el cual la Persona sigue teniendo participación de lo que ve en pantalla y poder de desición respecto de que forma quiere ver la información, eligiendo los parámetros que le son especificamente útiles.

En este espacio la persona tiene el dominio de los elementos, puede descubrir los patrones y atributos espaciales subyacentes de cada artefacto. Para ello se necesitan herramientas con las que la Persona puede interactuar en la visualización. Para ello el diseño de intefaz se enfoca en permitir un fácil e intuitivo acceso a las funcionalidades de cada visualización.

Para realizar las visualizaciones se requiere de tres pasos fundamentales:

1 Análisis de los Datos: Definir los elementos que serán recuperados en el proceso de búsqueda. Analizar sus atributos y posibles relaciones. Definir qué es lo relevante para la Persona que busca estos elementos.

2 Organización de los Elementos: Definir los parámetros que ordenan los elementos. Definir los tipos de visualizaciones que son posibles desarrollar para el panorama general de los elementos.

3 Mapeado de Datos: Se adquiere capacidad semántica que facilita la percepción de relaciones e integraciones entre las variables que se están visualizando, entregando los elementos contextualizados dentro de un total de elementos.

Relación Artefactos y Facetas

Artefactos.jpg

Cada artefacto que es recuperado trae consigo una o varias etiquetas. En las visualizaciones se especifica la pertenencia de las etiquetas a cada artefacto individualmente.

Ilum etiquetas.jpg

Las etiquetas de los artefactos de listado se iluminan al posicionar el mouse sobre el Título de artefacto. Se ilumina el artefacto y las Facetas asociadas a él.
Para las visualizaciones que muestran Resultados en “globos”, también se accionan las Etiquetas mediante el Over del enlace.

Zonas de la Pantalla

Dibujo zonas pantalla.jpg

La Pantalla se divide en tres zonas que son potencialmente manipulables en la instancia de la recuperación de información.
Módulo de Búsqueda En sus dos versiones corresponde al espacio de ingreso de consulta mediante la especificación de los términos asociados a Facetas.

Módulo de Facetas Todos los artefactos que son recuperados se asocian a Facetas por lo que como agrupación de ellos, se pueden manipular por éstos parámetros. Este módulo permite manipular las Etiquetas para especificar las búsquedas.

Zona de Visualización Los Resultados se despliegan en visualizaciones para cada una de las Facetas. En este caso se plantean cuatro modos de visualizar la información bajo patrones de Temática, Personas, Lugar y Tiempo.

Módulo de Búsqueda

Caja basica busqueda.jpg

Caja de búsqueda básica

La caja de búsqueda se mantiene en este estado a lo largo de toda la navegación del sitio. En el centro se ubica el campo de texto para que la persona ingrese su frase de búsqueda.

Caja de búsqueda avanzada

Caja facetas busqueda.jpg La búsqueda avanzada se despliega de la caja de búsqueda inicial.
permite a la persona ingresar palabras clave en la búsqueda especificando a que faceta se refiere con cada una de ellas.
El sistema analizará los términos ingresados en las agrupaciones respectivas y de ésta forma se recupera información más precisa respecto de los requerimientos planteados por la persona. Bajo el campo de texto inicial se despliegan cuatro campos más correspondientes a las cuatro Facetas de las cuales el sistema puede recuperar Etiquetas de los artefactos.
Las Etiquetas ingresadas pueden ser añadidas a la búsqueda antes o después de la visualización de los Resultados mediante un botón "agregar a Módulo de Facetas" que las agregará al Módulo de Facetas y generando nuevos Resultados.

Módulo de Facetas

Dibujo seleccion visualizaciones.jpg

Cada módulo individual funciona como pestaña con su respectiva visualización formando un sólo cuerpo. Las pestañas son seleccionadas con un clickover en el título de la Faceta.
Manipulación del módulo de Facetas para la elección de diferentes visualizaciones de Resultados. Vínculo visual entre la Faceta seleccionada y su respectiva representación de información.

Dibujo modulo facetas.jpg

En cada módulo se definen tres secciones.

  • La primera sección corresponde al título de cada Faceta que a la vez funciona como acceso a la visualización respectiva.
  • La segunda zona muestra las etiquetas que han sido ingresadas en el módulo de búsqueda. Como la persona ingresa los términos de antemano asociados a una Faceta específica, ésta se incluirá inequivocamente en el módulo que le corrresponde.
  • Por último se despliegan otras etiquetas que están asociadas a los artefactos que han sido recuperados en los resultados como términos relacionados.

Módulo individual de Faceta

Modulo faceta tematica.jpg
  • Título de Faceta.

Son términos predeterminados que corresponden al tipo de visualización en la que se mostrarán los resultados.

  • Etiquetas de Búsqueda.

Las etiquetas se ubican en dos columnas que van creciendo hacia abajo a medida que la persona las agrega. Si una etiqueta es un término extenso aparecerá sola en una fila.
Las etiquetas pueden ser eliminadas de la búsqueda con un botón "eliminar" que se ubica antes de cada etiqueta. Antes de eliminarse el sistema envía un mensaje para confirmar la acción.

  • Etiquetas asociadas.

Al igual que las etiquetas de búsqueda, éstas se ordenan en dos columnas, pero tienen una jerarquía visual menor. Para dar a entender de qué se tratan estas etiquetas es necesario acompañar con una indicación “etiquetas asociadas”.

Como las etiquetas asociadas pueden ser una gran cantidad de términos se plantea mostrar dos filas de etiquetas que pueden ser navegadas por medio de un slider.
Cada etiqueta asociada puede ser agregada como otra etiqueta de búsqueda. Para ello cada una se antecede de un ícono que representa la acción de “subir” el término a la sección de etiquetas de búsqueda. Esta acción desencadena que se refresquen los resultados y que se agreguen nuevas etiquetas asociadas.


Visualización de Resultados

visualización de resultados por Faceta Temática

Resultado listado.jpg

Los artefactos se despliegan en un listado separado por el Tipo.
Cada agrupación de artefactos tiene una navegación horizontal independiente. Cuando el número de artefactos recuperados es menor al número que se muestra en la zona de visualización las herramientas de navegación se omiten. El orden de aparición se determina por relevancia, es decir los artefactos que tienen mayor cantidad de coincidencias en las etiquetas asociadas a la Faceta Temática aparecerán primero.
Cada Tipo de artefacto se representa por un ícono.

Los artefactos de Tipo Textos y Audios son reconocidos al ser nombrados por su título. En la zona de visualización se entregan tres resultados por Tipo de artefacto. Si el motor de búsqueda rcupera más de tres, se nombra la cantidad de elementos que posee la lista y se navegan con un slide >>. Cada elemento del listado se antecede de un ícono que hace más predecible a la persona el modo en que visualizará el artefacto.

Cada unidad del listado se compone de tres partes:

  • Tipo de artefacto. Se ocupan ìconos pequeños de 12 x 12 px aprox. ya que no entorpecen la lectura ni quitan jerarquía a los textos. Al contrario visualmente marcan cada elemento como un bullet.
  • Título artefacto. Corresponden a el primer elemnto de lectura. En general, os textos y audios tienen un título pensado para ser descritos de ésta forma.

Al hacer MouseClick sobre el se accede a la página del artefacto.

  • Fecha Original.

se ocupa la siguiente sintáxis:
- 31 de Diciembre, 1984
- Diciembre, 1984
- Diciembre

  • Datos Básicos.

Se entrega más información que describe al artefacto. Se declara el autor y la Serie. Además se muestra el número de pedido para ahorrar un paso a la persona que necesita solicitar el artefacto físico.

Los resultados de imágenes y Videos se bastan de una miniatura para adelantar a la persona el contenido. Se entrega una fila de miniaturas de 50 x 50 px por cada tipo de artefacto que al igual que el listado textual se navega horizontalmene mediante un slider.
En este caso basta con mostrar una vez el ícono del tipo de artefacto ya que las miniaturas se agrupan visualmente en un sólo bloque.

  • Tipo de Artefacto.

Ícono + Texto

  • Número de artefactos recuperados en la búsqueda y slider para su navegación.
  • Miniaturas.

Para Imágenes y Videos se resume la imágen de la misma forma, ya que basta con la declaración del tipo de artefacto para distinguir ambos grupos.

Visualización de resultados por Faceta Tiempo

Linea tiempo.jpg

Al trabajar con Archivos Patrimoniales o Históricos los resultados siempre serán artefactos o elementos vinculados a alguna fecha. Se trata de elementos potencialmente temporales por lo que existe en toda página de resultados una opción a ver los elementos en una línea de tiempo.
En el caso de que un artefacto no posea la fecha exacta se ubica al comienzo del rango de tiempo que abarca.

Al aglomerarse muchos artefactos en un punto de la línea de tiempo, se resume en un ícono que agrupa varios artefactos. Al presionar Click se aumenta la escala para el despliegue de la agrupación de elementos.

La escala de la Línea de Tiempo se ajusta a los artefactos que está arrojando el motor de búsqueda, dividiendo el tiempo en unidades según:

  • Años: en números (1994, 1995...)
  • Meses: Tres letras iniciales del mes (jun, jul, ago...)
  • Días: Número correspondiente al día del mes (1,2...31)
Dibujo linea tiempo.jpg

El espacio de la visualización se rige bajo dos variables.
El eje horizontal corresponde a las variables temporales. Su navegación se acciona mediante un Slider. El segundo eje es vertical y corresponde a los cuatro tipos de artefactos existentes.
Los artefactos se resumen en un globo cn el ícono del tipo de artefacto. Ellos se agrupan según éste parámetro y se sobreponen cando el traslape entre uno y otro no sobrepasa los 10 px. Cuando la aglomeración de elementos excede ésta medida se representa la agrupación con el botón "zoom" que ajusta la línea de tiempo a los rangos temporales que determinan los mismo artefactos agrupados.

Visualización de resultados por Faceta Lugar

Resultados mapa.jpg

Esta visualización hereda el manejo de artefactos georeferenciados del Proyecto Web Travesías
Al visualizar los artefactos bajo las variantes de la Faceta de Lugar, se posicionan en un mapa. Por defecto el mapa muestra un vista general de la colección completa de artefactos.
La escala del mapa se ajusta a los artefactos que está arrojando el motor de búsqueda. Cuando hay muchos artefactos agrupados en un lugar, se representan en un ícono que al ser accionado escalará la visualización para su despliegue y la escala se ajustará a ellos.

Visualización de resultados por Faceta Personas

Grafo personas.jpg

Este modo es la única que incluye a las Etiquetas dentro de la visualización.
Se manifiesta mediante un grafo que relaciona a las Personas (Etiquetas) con los artefactos a los que se asocia. Cada Etiqueta de Persona es un nodo central y los artefactos asociados son los elementos que lo rodean. A su vez, cada artefacto puede tener más de una etiqueta de Persona asociada por lo que se permite la navegación de la información mediante las relaciones entre artefactos y sus Etiquetas.

Cuando hay una Etiqueta en la visualización se centra en la zona de visualización. Los elementos se despliegan en una estructura Radial alrededor del nodo central.
La cercanía de los elementos al centro varía según la cantidad que han sido recuperados en el proceso de búsqueda agrupándose la menor cantidad en los radiales más pequeños y cercanos al centro y desplegandose la mayor cantidad de elementos en los radiales más grandes y lejanos.

Los artefactos de ordenan según cuatro grupos por tipo de artefacto que se alinean de izquierda a derecha en Textos, Audios, Imágenes y Videos.

Ubicación de elementos en el grafo

Estructura radial grafo personas.jpg
Estructura subdivisiones faceta personas.jpg

Para ordenar los elementos y sus relaciones en el espacio se definen dos leyes para ubicarse en el espacio.

  • Los artefactos desplegados se ordenen de forma radial
  • Los nodos centrales y los artefactos colapsados se ubican en las subdivisiones de la zona de visualización

Estructura radial para elementos desplegados

Cada grupo de elementos tiene dos líneas. Más cercano y vinculado al nodo central se ubican los artefactos que se tienen la etiqueta asociada. Atrás se ubican los artefactos de búsqueda que no tienen la etiqueta asociada pero pertenecen a los resultados de búsqueda.

Estructura de subdivisión para nodos y elementos colapsados

El espacio de visualización se subdivide en cuadros de escala para la integración de elementos en la visualización de Resultados.
A medida que se navega en el grafo los elementos se van colapsando y escalando hacia el borde superior izquierdo del cuadro. El despliegue de elementos siempre es hacia la derecha.
Cuando hay un nodo central se ubica en el centro, cuando se agrega otro se van ordenando en la subdivisión de las partes.

Grafo dos personas.jpg
350px‎
Componentes grafo personas.jpg

Cuando se despliega una agrupación de artefactos colapsados éstos dse despliegan mediante la estructura radial hacia la derecha.
Cuando se despliega una agrupación de artefactos colapsados éstos dse despliegan mediante la estructura radial hacia la derecha.
Cuando se agrega un nuevo nodo o etiqueta a la visualización, se despliegan sólo los artefactos en común. Los demás artefactos se colapsan representados en un botón "zoom".

  1. http://sunsite.dcc.uchile.cl/irbook/10/node4.html#SECTION00131000000000000000
  2. http://tomgruber.org/writing/ontology-of-folksonomy.htm Tom Gruber. Folksonomy as data that is emergent from shared information
  3. Wikipedia.org. Zone of proximal development [en línea] Última actualización 14 de Mayo 2008 [ref. 29 de Septiembre de 2008] Disponible en Web: http://en.wikipedia.org/wiki/Zone_of_proximal_development
  4. CAÑEDO ANDALIA, Rubén. Análisis del conocimiento, la información y la comunicación como categorías reflejas en el marco de la ciencia. [en línea]. Última actualización 21 de mayo 2003 [ref. 4 de Septiembre 2008] Dsiponible en web: < http://www.bvs.sld.cu/revistas/aci/vol11_4_03/aci02403.htm>
  5. Wikipedia.org. Web Ontology Language [en línea]. ] Wikipedia, the free encyclopedia. Última actualización 19 de Mayo 2008 [ref. de 23 de Mayo de 2008]. Disponible en Web: < http://en.wikipedia.org/wiki/Web_Ontology_Language>
  6. http://webtrespuntocero.blogspot.com/2008/11/la-lista-de-las-ontologas-ms-usadas.html Listado de las ontologías más utilizadas actualmente (referenciado el 17 nov, 2008)
  7. DEHAES, Viv. Web semántica, ontologías y rdf [en línea]. ] Interacciones, Artículos de usabilidad, accesibilidad, web 2.0, estándares web. Julio 2004 [ref. de 23 de Mayo de 2008]. Disponible en Web: <http://www.interacciones.com.ar/web-semantica-ontologias-y-rdf/>.
  8. http://www.sidar.org/recur/desdi/traduc/es/rdf/rdfesp.htm Especificación de la sintaxis del modelo RDF
  9. http://www.w3.org/DesignIssues/Notation3 Notation 3 un lenguaje para datos en web semántica
  10. http://www.eswc2007.org/pdf/eswc07-auer.pdf Paper What have Innsbruck and Leipzig in common? de Sören Auer y Jens Lehmann. Extracción semántica del contenido en Wikis
  11. http://en.wikipedia.org/wiki/Human-computer_interaction#Human.E2.80.93computer_interface
  12. http://tomgruber.org/writing/CollectiveKnowledgeSystems.pdf
  13. http://tomgruber.org/writing/CollectiveKnowledgeSystems.pdf Documento Collective Knowledge System [pág 2] by Tom Gruber
  14. Lycos.es. Procesamiento del Lenguaje Natural para la Recuperación deInformación [en línea]. ] Última actualización 5 de Abril 2008 [ref. de 29 de Julio de 2008]. Disponible en Web: <http://usuarios.lycos.es/procelenguajenatural/pln.html>
  15. Lycos.es. Sistema Question Answering. Recuperación y acceso a la información [en línea]. ] Última actualización 12 de Abril 2008 [ref. de 7 de Agosto de 2008]. Disponible en Web: <http://question-answering.atspace.com/index.html>
  16. BÖRNER, Kathy. iScape: A Collaborative Memory Palace for Digital Library Search Results.[en línea] 2001. pág.2.[ref. 22 Agosto, 2008] Disponible en PDF http://ivl.slis.indiana.edu/km/pub/2001-borner-iscape.pdf
  17. W3C. Guía Breve de Web Semántica [en línea] Última actualización 07 de Febrero 2008 [ref. 26 de Agosto 2008] Disponible en Web: <http://www.w3c.es/Divulgacion/Guiasbreves/WebSemantica>