Paper: Diseño de Interacción para un Explorador Patrimonial

De Casiopea

Diseño de Interacción para un Explorador Patrimonial

Modelo de diálogo para un sistema semántico de recuperación de información

Resumen

Este estudio tiene como objetivo crear un modelo de diálogo transparente y dinámico entre las personas y los sistemas de búsqueda. Se plantea un proceso que consta de dos pasos mediante la especificación del lenguaje natural, en la cual el sistema se alimenta de la información especificada por las personas. La idea es transparentar el proceso que realiza el sistema para entregar resultados a partir de las palabras ingresadas por las personas mediante claves visuales, ya que a partir de esta comprensión se podrán refinar mejor las consultas búsquedas. Las claves para que se genere un diálogo entre la persona y el sistema corresponde al manejo y refinación de la consulta, por lo que es necesario convenir un lenguaje apropiado para ambas partes. Para ello se debe tener en cuenta la importancia de la consulta como una primera instancia en la cual la persona manifiesta su intención o necesidad de información y luego cómo entrega el sistema dicha información de manera clara y obedeciendo a los requerimientos semánticos requeridos en la consulta.
Se definen directrices gráficas para hacer visible el funcionamiento de la recuperación de información y la posibilidad de que las personas intervengan el proceso de recuperación para su afinación semántica.

Este modelo se define mediante dos directrices claves:

1. Transparencia del proceso
Lo primero es plantear una zona de potencial diálogo textual donde la persona en una primera instancia ingresa el requerimiento de información para después recibir las inferencias realizadas por el sistema que pueden ser corregidas, añadidas, modificadas, etc. La idea es que las personas intervengan en el proceso de recuperación de la información aportando refinaciones semánticas enriqueciendo al sistema de nuevas relaciones entre los objetos.
Dicha zona de diálogo es similar al planteamiento de Vigotsky de una Zone of Proximal Development o ZDP en el aprendizaje de las personas. Vigotsky plantea que existe una zona en el aprendizaje de una persona que se ubica entre el nivel de desarrollo que posee y el potencial nivel de desarrollo que puede alcanzar con la ayuda de un sujeto con más capacidades.[1] En este caso es la zona donde se alberga la retroalimentación del aprendizaje entre la persona y el sistema como el modelo de scaffolding en el cual el desarrollo de una actividad se da colaborativamente entre dos sujetos con diferentes niveles de conocimiento, en este caso el sistema posee la información y la persona el lenguaje semántico que enriquece las vías para su recuperación; ambas partes se complementan y potencian la recuperación de la información mediante relaciones semánticas.

El diálogo es potencialmente textual y semántico. La interfaz procura entregar herramientas para que la persona interactúa miesntras el sistema trabaja. Cada acción realizada desencadena un cambio en la recuperación de la información.

2. Etiquetas facetadas
Cada etiqueta que posee un elemento es anidada a una faceta predeterminada para ayudar a su encontrabilidad. Esto permite que los elementos que están aislados puedan ser localizados por vías no jerárquicas sino por agrupaciones semánticas. Luego se plantea la directriz que potencia la eficacia del reconocimiento semántico de los términos con que se da cabida al diálogo. Esta es la especificación del significado de cada término mediante facetas (igualmente predeterminadas) que explicitan a qué se refiere cada palabra mediante cuatro clases: Temática, Persona, Lugar, Fecha.



Palabras Clave

Diseño de Interacción, Diseño de Interfaz, Web Semántica, Diseño.

Introducción

La web semántica es presentada como una nueva extensión de la web, en la que la principal ambición consiste en hacer el acceso a la información más certera respecto de los significados. Las personas son las que poseen la cualidad de otorgar dichos significados a las palabras y objetos que están en la web por lo que el diálogo con los sistemas debiera refinarse a este lenguaje.
A su vez los sistemas de búsqueda semántica se hacen cargo del significado de las palabras y del sentido que genera la conjugación y relaciones de dichas palabras en una frase, que a su vez otorga un nuevo significado más complejo. Suponen búsquedas más “inteligentes” ya que las relaciones entre los objetos entregados como respuesta tienen relaciones más enriquecidas que los tradicionales modos de búsqueda sintácticos gracias a las “ontologías”.
El proceso de inferencias que realizan los sistemas de búsqueda semántica es complejo y es difícil entender las ecuaciones que realiza el sistema para inferir lo que la persona realmente está buscando.
Es por ello que se hace necesario transparentar dicho funcionamiento y dejar espacio a que la persona (que se comunica semánticamente por esencia) sea la que guíe y corrija estas inferencias del sistema, ya que como aún es un sistema que mundialmente está en estado beta es probable que ocurran incoherencias o inferencias erróneas. Para transparentar lo que el sistema infiere es necesario inventar una fórmula gráfica que sea generosa y comprensible por las personas. Si las personas realizan preguntas a través del Lenguaje natural, lo lógico sería que el sistema traspasara las relaciones e inferencias también a dicho lenguaje, lográndose una “conversación” entre persona y el sistema.
La cantidad de información existente es inmensa por lo que son los buscadores o motores de búsqueda herramientas primordiales para que las personas encontremos vías para llegar a la requerida información.
Los motores de búsqueda se han transformado en los medios fundamentales dentro de la web y es mediante ellos que se produce la comunicación entre persona-sistema; es en esta instancia donde la persona manifiesta la intención de los requerimientos de información. Sin embargo, como se expresa anteriormente la cantidad de información es demasiada y va aumentando de manera incalculable por lo que ha sido necesario refinar cada vez más los sistemas de recuperación de información para satisfacer los requerimientos de las personas que a su vez son cada vez mas precisos y exigentes. Se plantea un modelo de diseño genérico de comunicación para ser aplicado a los repositorios digitales con una base de datos acotada, como por ejemplo Archivos Patrimoniales. El objetivo principal de este estudio es crear un modo en el cual se potencie la especificación de los requerimientos de información que intentan comunicar las personas al sistema, en donde el diálogo sea potencialmente semántico, acercándose más al lenguaje de las personas que de los sistemas, es decir al lenguaje natural que ocupamos para comunicarnos entre personas. Al existir información que puede ser recuperada de forma semántica, ¿por qué seguir dialogando con el sistema de forma sintáctica?
La comunicación debe ser semántica desde la formulación de la consulta.


La comunicación mediante el lenguaje natural

El sistema de búsqueda semántico apunta a mejorar la comunicación entre la persona y el sistema en la entrega de resultados asertivos respecto del sentido de la pregunta hecha por la persona. El buscador tiene un sistema capaz de reconocer la semántica de la información, datos y en este caso de las palabras conjugadas en una frase. Esta capacidad de poder asociar las palabras otorgando un Sentido permite que las personas puedan acercarse a comunicar mediante el Lenguaje natural (PLN) (Medio que utilizan las personas de manera cotidiana para establecer comunicación con otras personas [1]) a los sistemas lo que requieren y recibir respuestas acertadas a lo que realmente están solicitando al sistema.
La idea es ayudar a que esta comunicación con los sistemas de búsqueda se acerque cada vez más a la utilización del lenguaje natural, es por ello que se plantea la frase como la principal herramienta de conversación para consultas y la especificación del sentido semántico de las palabras ingresadas por las personas.

La Visualización homogénea de los resultados
La Visualización es la representación de datos o información abstracta en una imagen. En este caso se necesita traer a presencia diversos artefactos de forma homogénea a pesar de estar concebidos dentro de estructuras jerárquicas pertenecientes a múltiples fuentes y además correspondientes a diferentes formatos que se visualizan individualmente por distintos medios. La entrega de estos objetos dispares debe privilegiar la homogeneidad pero evidenciando la distinción de cada uno. Generalmente los buscadores genéricos o específicos, como las bibliotecas digitales arrojan extensos listados de resultados con los documentos de respuesta a la consulta generada, sin embargo es difícil para las personas encontrar rápidamente lo que efectivamente necesita ya que la lectura y comprensión de los resultados es muy lenta.
En visualizaciones de listado es imposible tener una percepción del panorama total de respuestas generada por el sistema, los listados se navegan por paginación y es el número de páginas lo que evidencia la cantidad de respuestas arrojadas.
De la misma forma es imposible ver las relaciones semánticas que influyen en la eficacia de las respuestas respecto de la consulta echa por la persona. Cada elemento del listado es arrojado como si fueran equivalentes entre sí, el único parámetro que puede tener la persona es que los primeros resultados de la lista son los más relevantes respecto de la consulta realizada.
Lo más probable es que si la persona no encuentra lo que busca en los 10 primeros elementos no lo hará en los siguientes resultados, por lo que se deberá generar una nueva consulta con un mayor grado de especificación.

Agrupaciones en clusters
Recientemente, se han desarrollado varios accesos a los resultados de búsqueda mediante clusters o agrupación por etiquetas para proporcionar a los usuarios un panorama general de los resultados y un acceso más fácil a la información relevante[2] Estas agrupaciones son flexibles y se adaptan a los resultados que sean arrojados independiente de las cantidades o atributos que tengan en particular. Sin embargo, necesitan constituir palabras muy exactas y precisas para ser significantes de los resultados que contendrán. La ventaja que entregan estas agrupaciones es que permiten ordenar los resultados bajo nuevos parámetros sin que esto afecte a los artefactos mismos. Se trata de una forma simultánea de agrupar una lista uniforme de elementos. Es decir que además del orden en que son ordenados los resultados (por relevancia, por temporalidad, orden alfabético, etc.) existe una nueva forma de nombrar ciertas categorías que refieren a cualidades más semánticas de los elementos ya que se agrupan por temáticas, propiedades, tipos, etc.

Relaciones en grafos
Permiten crear un espacio en el cual se disponen múltiples objetos simultáneamente permitiendo comparaciones, relaciones, y agrupaciones. Cada objeto se mide con sus mismos pares, de modo que la visualización representa un panorama general donde cada parte convive y tiene valor respecto del todo.
A su vez los objetos en el espacio se anclan bajo ciertas coordenadas (x, z) que determinan atributos particulares bajo los que se rigen dentro del espacio y que permite graficar atributos transversales entre artefactos.
Por otra parte en toda visualización puede otorgarse la posibilidad de elegir a los usuarios parámetros de búsqueda de manera que se puede visualizar la totalidad así como también discriminar esa visualización de resultados. Son posibles múltiples jerarquías de aparición en el espacio, según facetas, como la relevancia, fechas, categorías, etc. Estas facetas son en sí agrupaciones que están sobre las categorías donde se ubica cada artefacto, ellas permiten que los objetos que siempre están aislados en la profundidad de categorías y subcategorías puedan visualizarse en un primer nivel y además poder pertenecer a más de una categoría. Se generan relaciones transversales.

Las facetas como especificación de la semántica

El sentido de cada palabra o término se determina mediante la asignación de una faceta. Es decir si se especifica un sentido a la palabra como “lugar” “persona” “fecha”, etc. éste sentido en realidad va a corresponder a una faceta que permitirá encontrar resultados de acuerdo a dicho parámetro de especificación.
Al ser la frase en lenguaje natural el medio para comunicar las necesidades al buscador, el sistema debería entregar respuestas en este mismo lenguaje. Respecto de ello, existen sistemas de recuperación de información que pretenden dar respuestas muy concretas en este lenguaje natural llamado Question Answering (QA). Para ello se realiza un análisis de textos escritos en lenguaje natural al igual que la pregunta, de los cuales se extraerán unos fragmentos en los cuales se localiza la respuesta a la pregunta solicitada [3]. Sin embargo es difícil que en estas instancias el sistema otorgue siempre resultados acertados, es probable que se generen “incoherencias”, de modo que la persona debiera tener la posibilidad de manejar o corregir los resultados, para que el sistema se perfeccione a medida que los mismos usuarios corrigen los errores.


Directrices visuales para el diálogo persona-sistema

caso de uso: módulo explorador patrimonial

Para la existencia de cualquier buscador es necesario por un lado poseer información, datos que puedan visualizarse y por otro lado personas que requieran éste contenido. Se toma como modelo el Archivo Histórico Patrimonial José Vial Armstrong de la e[ad] que posee una memoria de décadas registrada en una diversidad de artefactos de diverso tipo, relacionada a diversos ámbitos. Además se trata de un Archivo en el cual se está generando continuamente material de registro nuevo. Para la interfaz de este espacio de búsqueda semántico se plantea un sistema modular en el cual se genera todo el proceso de diálogo entre la persona que consulta y las afinaciones que regula la persona para refinar los resultados.

1. Etiquetas y Términos Facetados
Las facetas corresponden a las dimensiones que componen un objeto como tal. Funcionan como atributos o propiedades que cuelgan de cada objeto o artefacto. Posee dos ventajas respecto de la navegación y accesibilidad al artefacto:

Localización
El recurso está disponible por múltiples vías.
La descripción de los objetos o artefactos mediante facetas permite a las personas localizar los objetos mediante vías específicas que son determinadas dependiendo de lo que requiera. La persona discrimina del universo de posibles resultados mediante las áreas específicas que le interesan.
Transversalidad
Los recursos son localizables con homogeneidad, independiente de la estructura donde son concebidos.
Las facetas son dimensiones paralelas de los artefactos de manera que se pueden realizar agrupaciones de objetos que se ordenan según una faceta, permitiendo relaciones de dichos objetos que pertenecen a faceta transversal. Estas agrupaciones permiten que los objetos se visualicen interoperando bajo órdenes que se manifiestan según los requerimientos del usuario. La clasificación facetada permite que a pesar de que los elementos se encuentren clasificados de forma jerárquica pueden localizarse independiente del nivel en que se encuentren, ya que el orden en que se evidencian y ordenan se da según estas dimensiones transversales a la jerarquía.
La Web Semántica como infraestructura basada en metadatos aporta un camino para razonar en la web, extendiendo así sus capacidades. Las etiquetas son datos que se asocian a un elemento o artefacto. El uso de etiquetas que se asignan a estos elementos ayuda potencialmente al enriquecimiento de datos y por consecuencia enriquece las vías de acceso a dicho elemento, se hace más localizable. La idea de que las etiquetas sean palabras o frases que las personas pueden vincular libremente a los elementos permite otorgar datos más semánticos que ayudarán al sistema a reconocer efectivamente qué son y qué significan. Ahora, para refinar el uso de etiquetas se propone un sistema en el cual cada etiqueta corresponde a un faceta determinada, ya que cada palabra o frase que se vincula a un elemento puede tener muchos significados (como toda palabra o frase), pero al estar ubicada como hija de una faceta queda especificado el sentido de dicha etiqueta. Se ingresa una etiqueta que significa de forma inequívoca. Por ejemplo, se puede ingresar la etiqueta "Iglesias", pero dicha palabra puede tener múltiples significados, entonces la palabra por sí sola queda igualmente sin valor semántico; para ello se vincula como hija a cierta faceta que determinará qué significa esa palabra vinculada a tal elemento. La palabra "Iglesias" puede referirse a una Persona (apellido de una persona), un objeto (una iglesia física) o una temática (La Iglesia como institución), etc. El vínculo de una etiqueta a cierta faceta ayudará a la especificación del significado por lo que potenciará el enriquecimiento semántico del elemento al que se une.

2. Lucidez de Inferencias El funcionamiento de la recuperación de la información como se ha explicado anteriormente comienza con el ingreso de términos de consulta, a partir de ésta acción se generan los resultados. Sin embargo a la persona nunca se le evidencia el porqué se arroja tales resultados de manera que si éstos no son los esperados, la persona sólo tiene la opción de realizar una nueva búsqueda más específica. La idea de éste proyecto es evidenciar el proceso de conjugaciones de términos y relaciones semánticas que realiza el sistema para arrojar un número de resultados, en el cual la persona puede dilucidar de qué manera el sistema conjuga los términos ingresados y cómo se recuperan elementos a partir de éstas relaciones. Como se ha planteado el diálogo de la persona con el sistema mediante frases, las inferencias generadas son dilucidadas mediante el mismo lenguaje, es decir cada inferencia o relación entre dos o más términos se expresa gráficamente como una frase en lenguaje natural. A pesar de que una inferencia se comporte gráficamente como frase, lo que realmente se evidencia es un grafo que une dos o más elementos (palabras clave) y le otorgan un nuevo sentido más complejo gracias a vínculos (palabras conectivas) que pueden referirse a pertenencia (de, en), equivalencia (es, son), etc.
3. Listado homogéneo de Resultados
La visualización de resultados arroja artefactos y agrupaciones de artefactos de forma simultanea, de manera que debe haber un distingo entre el artefacto individual y la agrupación de ellos. Dentro de las catalogaciones de los Archivos Patrimoniales los artefactos responden a jerarquías rígidas por lo que en este caso se entregarán tres tipos de elementos: Artefactos, Series y Colecciones. Cada una de ellas es nombrada y además tiene un icono identificatorio. El artefacto tiene iconos que evidencian el tipo de archivo que es (imagen, documento, audio o video). En el lado derecho se ubican los atributos identificatorios del elemento como las facetas que lo componen, el formato, el tipo, etc. El título y descripción se ubican en el lado izquierdo ya que corresponden a una definición de criterio personal de la persona que disponibiliza el elemento. Otra versión para mostrar el listado de resultados. En esta versión se acentúa la lectura horizontal de cada ítem arrojado como resultado. Se eliminan los iconos del tipo de resultado y se nombra si es correspondiente a una Serie o colección. Para distinguir esta condición, se plantea una caja gris oscura para las colecciones, una gris más clara para las series y en blanco para los artefactos. Cada una de estas cajas entrega descripciones y son accesos directos a las páginas específica de la Colección, Serie o Artefacto.


Conclusiones

Este proyecto se ha concebido como una propuesta en la que el principal objetivo es potenciar la comunicación eficiente mediante un lenguaje común entre la persona y el sistema. No se trata de un dialogar tal cual, si no que se manifiesta planteando directrices gráficas que permiten a las personas entender la complejidad de relaciones que hace el sistema para la recuperación de información a partir de una consulta, entregar herramientas de especificación para realizar mejores consultas, permitir un espacio en el cual la persona puede intervenir en las inferencias realizadas por el sistemas y pueda colaborar en el "razonamiento" del proceso de recuperación de la información de manera que no quede como un proceso oculto. Por último la facetación de las etiquetas que son asignadas a los elementos para etiquetar apuntando al enriquecimiento semántico de los elementos y de esta forma ayudar a la accesibilidad. Todas estas directrices son patrones de diseño que apuntan a un modelo escalable a cualquier buscador o explorador de información contextualizada, ya que apunta a el diálogo a partir de los términos como unidad independiente de las estructuras establecidas, que se rodean de un aura de otros elementos que generan relaciones, por tanto contexto. Todo el proceso de búsqueda es planteado de forma genérica apuntando a dilucidar comunicación semántica entre el sistema y las personas.


  1. Wikipedia.org. Zone of proximal development [en línea] Última actualización 14 de Mayo 2008 [ref. 29 de Septiembre de 2008] Disponible en Web: http://en.wikipedia.org/wiki/Zone_of_proximal_development


[0] Wikipedia.org. Zone of proximal development [en línea] Última actualización 14 de Mayo 2008 [ref. 29 de Septiembre de 2008] Disponible en Web: http://en.wikipedia.org/wiki/Zone_of_proximal_development

[1] Lycos.es. Procesamiento del Lenguaje Natural para la Recuperación de Información [en línea] Última actualización 5 de Abril 2008 [ref. de 29 de Julio de 2008]. Disponible en Web: http://usuarios.lycos.es/procelenguajenatural/pln.html

[2] BÖRNER, Kathy. iScape: A Collaborative Memory Palace for Digital Library Search Results.[en línea] 2001. pág.2.[ref. 22 Agosto, 2008] Disponible en PDF http://ivl.slis.indiana.edu/km/pub/2001-borner-iscape.pdf

[3] Lycos.es. Sistema Question Answering. Recuperación y acceso a la información [en línea]. Última actualización 12 de Abril 2008 [ref. de 7 de Agosto de 2008]. Disponible en Web: http://question-answering.atspace.com/index.html