AURA: Web Semántica para Archivos Patrimoniales

De Casiopea

Exploración


Estudio de existencias y relaciones e[ad]

La exploración pretende hacerse cargo de definir la situación actual de la escuela, plantear las unidades, la jerarquización de éstas y con ese orden definir el modo de relaciones con que las partes se comunican, interactúan e integran. Ello implica la representación de una figura que es arrojada precisamente por estas relaciones o “conversaciones”. Cada unidad posee un nombre y a la vez un contexto que la relaciona con otras unidades, estas relaciones pueden ser semánticas, pueden ser hechos, lugares, situaciones, etc.
En el fondo se pretende definir una estructura con un pensamiento de integración por relaciones.
Toda la red genérica (de datos o unidades) y sus respectivos modos de integración se plantean bajo los siguientes temas

  • La Notación El modo gráfico de presentarse.
  • La visualización La Representación de la notación.
  • La Colaboración
  • La Archivación o Documentación
  • La Performatividad El comportamiento respecto del usuario.
  • La imagen como Discurso

En primera instancia se estudia el universo “escuela” con todos los temas y tópicos que implica. Se realiza un card sorting en el cual aparecen decenas de palabras de naturalezas muy distintas pero que se presentan todas con el mismo valor como unidad. Para dar mayor claridad del significado, se platean 9 categorías donde las palabras pueden pertenecer; ellas son: Personas, Docencia, Tradición, Ámbito, Extensión, Lugares, Objetos, Administración y Servicios.

La primera visualización corresponde a una tabla cartesiana en la cual se plantean las unidades y su pertenencia a alguna de las categorías.
Esto es una Clasificación de Conceptos.

La segunda visualización se trata del traspaso de esta información a una pizarra Inicialmente las categorías se presentan como núcleo de un grafo del cuál se desprenden las unidades. Luego estas unidades se relacionan entre sí por “Relaciones Directas” que generalmente corresponde a una relación de equivalencia (eso es esto), “Relaciones entre conceptos Particulares”, cuando los conceptos se relacionan por alguna situación o proceso y “Relaciones Semánticas” dadas cuando una palabra pertenece a más de una categoría adquiriendo más de un significado. A este mapa lo hemos llamado Mapa de las Existencias y Relaciones

Mapa de las existencias y relaciones



La Visualización final corresponde a la versión digital del Mapa de las existencias y relaciones, en el cual se generan más relaciones antes no descubiertas, pero siempre siguiendo la misma notación y orden.

Versión Digital del Mapa de existencias y relaciones e[ad]


Primer caso de estudio

Archivo:Infografía farándula.jpg
Infografía de faenas de Farándula en la escuela.

Registro de Farándula 2008

Dentro del contexto de la semana universitaria se toma como objeto de estudio la Farándula, actividad con carácter particular de la e[ad]. En ella coexisten distintas actividades donde los alumnos, aparte de organizar y disfrutar de instancias recreativas, se unen entorno al oficio para la constitución de una celebración colectiva con una temática determinada.
Para ello se distribuyen en distintas faenas de trabajo donde diseñan, confeccionan y construyen carros alegóricos, trajes, máscaras y banquetes; elementos que constituyen esta celebración.
Todo este proceso y su descenlace, en carnaval y peregrinación, es lo que llamamos Farándula, la cual queda registrada por alumnos y profesores en distintos modos y soportes.
La principal forma de registro corresponde a las fotografías y vídeos, por otro lado existen los dibujos de los diseños de carros, trajes y máscaras. Dicho material queda en manos de integrantes de la escuela sin llegar a formar parte de un registro completo ni elocuente debido a que se mantiene disperso. En este estudio se toma esa situación y los contenidos que la actividad Farándula genera, construyendo un registro propio basado en el seguimiento de sus actividades y en la colaboración de sus propios actores.


Organización y estructura del archivo José Vial

Los siguientes mapas conceptuales se encuentran disponibles en la carpeta de Cmap Tools, IHMC Public Cmap, en Titulación DG e[ad]

Modelo de Clasificación Actual del Archivo José Vial

Ir al mapa

Modelo de Clasificación del Archivo José Vial de la e[ad]

El Archivo José Vial clasifica la información en bancos donde se almacena el contenido según se trate de materiales académicos o docentes. Cada categoría genera subcategorías las que se mantienen en un mismo orden y valor por igual. Esta estructura permite que a medida que se genera material se pueda contenerlo, clasificarlo y disponibilizarlo(*) sin que se desorganice ni colapse el sistema de archivación.

(*)La disponibilización de los objetos está en proceso, sólo algunos de ellos se mantienen en plataformas disponibles para toda persona.


Propuestas

Primera propuesta

Mapa de relaciones entre hechos, usuarios y objetos que generan material de archivo

Se plantean tres grandes tópicos que en su interacción generan el material de registro y documentación.

Estos tópicos son:

  • “Personas” sujetos que participan y aportan con el registro.
  • “Hechos”, eventos que al ser registrados, generan contenido.
  • “Objetos”, material de registro archivables, como los son fotos, textos, audio, video, independiente del formto en el cual se encuetren.


Siguiendo esta estructura se llega al siguiente mapa de relaciones y existencias, el cual mustra estos tópicos que se relacionan entre si y contienen respectivamente sujetos, temas y objetos.

Segunda Propuesta

Ir al mapa

Mapa de relaciones que generan material de archivo

En esta se replantea el mapa anterior luego de la revisión su estructura con funcionarios del departamento de Archivo de la escuela.

Los cambios son los siguientes:

Al grupo, Hechos, se le suman algunos temas, aún sin distinguirse relaciones más exactas para el nacimiento de agrupaciones genéricas optimas.

En el caso de los Objetos, el cambio más relevante es el que ocurre con los archivos de audio, agrupación que contaba dentro de sus unidades con el PodCast, elemento que se encuentra en un estado intermedio. Este no es objeto ya que contiene archivos de audio, vídeo y texto, siendo su contenido actualizable y comportándose como un canal. Debido a esto y también por la necesidad de contar en este mapa también con los medios que actualmente utiliza la escuela para la disponibilización de información, se considera un cuarto tópico, el de las Plataformas.

Por último se replantea el grupo hasta el momento llamado personas y se divide en cuanto a sus Roles, estos son los siguientes:

  • Administrador

Persona encargada del sitio. Filtra y actualiza.

  • Colaborador

Consulta y aporta archivos.

  • Observador

Solo consulta.

  • Autor

Consulta y aporta material original de su creación.

Mapa de Categorías Archivo José Vial

Archivo:Categorías para archivo copy.jpg
Estructura generada según temática de sus contenidos

Ir al mapa

Se realizo un segundo card-sorting con las temáticas que generan material de registro en la escuela, considerándose material ya existente en el Archivo de la e[ad].

Este mapa muestra una jerarquía de contenidos del archivo según sus relaciones temáticas, las cuales se construyen a partir de la estructura actualmente utilizada para catalogar el material existente en el Archivo José Vial, a la cual se le suman ciertas agrupaciones no concideradas dentro de las categoías actuales.

Por otro lado se redistribuyen contenidos y se re-nombran ciertos términos. De esta forma se establece un flujo básico de acceso a sus contenidos, que se acomoda a en terminos generales a las entradas que uno como usuario concideraria al momento de realizar una búsqueda.


Estructura genérica de una plataforma para archivos

El siguiente estudio trata de la creación de una estructura genérica que permite el desarrollo de la actividad de los archivos en plataformas digitales; el archivo se plantea como concepto y éste posee tres caras de las cuales es necesario definir su funcionamiento.


Funcionamiento y Relaciones del Archivo

Cada archivo como conjunto orgánico de documentos tiene una manera de organizar sus contenidos, los que se contienen en orden jerárquico como Fondos, Series o Colecciones. Sin embargo cada contenido se inscribe en ciertas Temáticas las que permiten vincular los objetos mediante relaciones Semánticas, Conceptuales o bien por la ya nombrada Temática.
De forma intuitiva se a realizado previamente el mapa de Existencias y Relaciones con el Universo de la e[ad] como ejemplo de cómo se articulan los objetos mediante vínculos.
Si la articulación de estas relaciones está bien construida se crea un organismo que posee una relación sistémica entre sus componentes y de esta fomra será mucho más efectiva la gama de posibilidades a la que el usuario podrá acceder a la hora de generar una Búsqueda.

El Archivo y la justeza con el usuario

Uno de los principales objetivos que contempla este proyecto respecto de los archivos es dar forma al acceso o "conversación" de las personas con cierta información, es por ello que se planteará la investigación y creación de un modelo genérico de consulta (independiente de los contenidos y modo de clasificación que posea cada archivo).
La idea es que la información, contenida en cualquier formato, tenga ágiles caminos para ser reconocida y de esta manera ayudar en el conocimiento retrospectivo del usuario que la requiere.
El usuario busca bajo las alternativas libres por palabras clave y/o por la selección de categorías las que deben ser cuidadosamente definidas tanto por lo que contienen como por el cuidado del lenguaje utilizado enfocado al entendimiento de los usuarios.


Caracterización de Usuario

Alumnos de Diseño y Arquitectura de los cursos de pregrado


Alumno de pregrado e[ad]

Guillermo estudia diseño gráfico en la e[ad] de la PUCV, cursa su tercer año y debe desarrollar un catalogo sobre la Ciudad Abierta; el catalogo trata sobre Textos Fundacionales, Figura Legal Actos Poéticos y Ágoras, Actividades Docentes, Huéspedes, Visitas, Acontecimientos, Obras de Arquitectura, Obras de Escultura y Publicaciones, por lo que necesita información, planos, fotografías y archivos que muestren la ciudad abierta en sus comienzos hasta hoy. Para ello acude a la sitio web de la escuela, encuentra la información pero no toda la que necesita por lo que debe acudir al lugar físico a solicitar el material.

Alumnos que desarrollan la tesis o proyecto de título del último año de estudios

Alumna desarrollando su tesis

Carolina está cursando su último año en la carrera de pedagogía en Historia, geografía y ciencias sociales en la PUCV. Su tesis trata la historia de Valparaíso y sus catástrofes, se entera que el archivo José vial hay información valiosa que puede utilizar pero que no está disponible en la web, se pone en contacto con los administradores del archivo para obtener la documentación necesaria y debe ir a buscar la información a las dependencias de la facultad de arquitectura y diseños.

Investigadores de Maestría y Doctorado, tanto nacionales como extranjeros

investigador de doctorado

Jean Pierre es un arquitecto francés que realiza su Doctorado en la American University of Paris, a través de unos amigos se entero de la existencia de la Ciudad Abierta, con el afán de incluirla en su investigación busca información en el sitio web. Se entera de los elementos que hay en él a través del sitio web de la e[ad], pero la información que requiere no está disponible vía web, por lo que debe viajar a chile y obtenerla en las dependencias del archivo.


Mapa de Navegación

Benchmark

Análisis de los modos de búsqueda para usuarios

versión pdf

Esquema comparativo de los tipos de búsqueda en sitios contenedores de repositorios y contenidos respectivos

Análisis de cuatro sitios que manejan repositorios digitales y contenidos particulares. Se analizan los tipos de búsqueda que deben realizar los usuarios para acceder a la información buscada. Cada sitio presenta por lo menos tres modos de búsqueda, siendo fundamental una básica o standard, generalmente compuesta por una caja de búsqueda simple la cual funciona con un keyword o imput text que arroja directamente un listado de resultados sin discriminar categorías, temáticas u otras clasificaciones particulares.
Las búsquedas avanzadas poseen categorías genéricas referentes a los metadatos de cada artefacto, como fechas, autor, formato, etc. Datos que debe tener cada artefacto de antemano declarado para su descripción primordial. Además de otras opciones de búsqueda que tienen que ver con las temáticas particulares que tratan los repositorios contenidos en el sitio.


Referencias

Repository66 Archivos del mundo georeferenciados que manejan contenidos con Dspace, Fedora, Eprint, etc.
Footnote Repositorio de archivos digitales históricos
CONTENTdm Software para manejar colecciones digitales
CONTENTdm modos de búsqueda
A2A Buscador de archivos digitales locales de Inglaterra y Gales
Open Repository Buscador y contenedor de repositorios institucionales


‎Modalidades y especificaciones de búsqueda

Presentación del estudio de modalidades y especificaciones de búsqueda

Búsquedas básicas o Standard

Caja de búsqueda google

Las búsquedas básicas corresponden a una primera instancia en la cual el usuario expone su intención de búsqueda.
Ésta modalidad permite al usuario ingresar una palabra o frase representativa de su intención, y esta “palabra clave”, término o keyword permite arrojar contenidos directos desde las bases de datos consultadas sin discriminar categorías de ningún tipo. Un ejemplo de búsqueda básica es la utilizada por google, en la cual se da espacio al usuario en una “caja de texto” para exponer libremente los términos que desea consultar.

Caja de búsqueda CONTENTdm, (explorador de colecciones históricas) en la cabecera del sitio
  • La búsqueda básica se mantiene en la cabecera del sitio.

Generalmente los sitios que interactúan con bases de datos mantienen un sector de búsqueda en la esquina derecha de la cabecera manteniéndose presente en toda la navegación, cuando no se trata de una página independiente de búsqueda.

Ejemplo de caja de búsqueda con una aplicación para prevención de errores, del sitio FootNote
  • textbox con recomendaciones de búsqueda al usuario o prevención de errores

La caja de texto se presenta vacía para que el usuario ingrese el texto, sin embargo en algunos casos se agrega a esta caja mensajes o recomendaciones de Búsqueda para permitir resultados más acertados. Estos mensajes corresponden a la prevención de errores en la búsqueda o “imput value”.


Ejemplo de caja de búsqueda con una aplicación Autocomplete Text Box, del sitio Veer
  • Autocomplete Text Box

Otro recurso para ayudar al usuario a generar mejor su consulta es insinuar los posibles términos que podría buscar, entonces a medida que el usuario tipea cada letra o combinaciones de letras aparece automáticamente un panel popup que arroja una lista de términos anteriormente consultados que comienzan con la combinación que está siendo ingresada a la caja de texto. A esto se le llama “autocomplete text box”.
El usuario puede encontrar la palabra que está escribiendo antes de terminar y seleccionarla para hacer la pregunta más rápida.

Búsquedas Avanzadas

Ejemplo de un sistema de búsqued avanzada que otorga Dspace a todos sus repositorios

Cuando la búsqueda ya no se basta con ingresar una palabra clave y es necesario incluir ciertas especificaciones que filtran los resultados deja de ser una búsqueda básica y pasa a ser una Avanzada. Se trata de instancias donde los usuarios pueden realizar preguntas específicas acerca de los contenidos que desea encontrar. Ésta pregunta se especifica seleccionando o ingresando datos que filtrarán los datos consultados en categorías.
Los datos corresponden a campos de búsqueda que generalmente están determinados por el mismo buscador ya que de antemano los artefactos se ubican en clasificaciones y categorías al momento de ser ingresados a la base de datos. Como una ayuda a la interacción del usuario, las categorías se presentan en listas dentro de un dropdown donde pueden ser seleccionadas o bien en “chek boxes” para seleccionar más de una opción.


Las búsquedas avanzadas pueden construirse solo con una caja de búsqueda y una especificación de categorías, sin embargo pueden alcanzar una complejidad mayor al ir agregándose varios campos de selección que ubican a los objetos en categorías determinadas, en rangos de tiempo, proximidad de palabras, etc. Cuando la selección o ingreso de datos es muy extensa es bueno agregar un botón para limpiar los datos ingresados. Como la notación de palabras es libre, es posible ingresar una o más palabras.
En el caso de tratarse de dos o más términos se produce un vacío entre ambas ya que la mayoría de los sistemas sólo busca por keywords en la base de datos, sin hacer relaciones semánticas u ontológicas. Por ello al momento de ingresar una frase existen ciertas palabras o signos que determinan el sentido de la frase o la conexión entre palabras.

  • Palabras vínculo

Se utilizan para dar un sentido a la búsqueda con más de un término por ejemplo AND &, OR |, NOT !

  • Signos vínculo

Corresponde a símbolos que permiten especificar si los términos ingresados en la caja de texto son efectivamente una frase y no palabras independientes; a estos signos se les llama símbolos de agrupación lógica, por ejemplo “utilización de comillas” ,(utilización de paréntesis). También existen booleans que se ubican entre las palabras ingresadas como el signo + que indica que Indica un término que debe aparecer en cualquier documento o el signo – que indica que el término no debe aparecer en el documento buscado.

Ejemplo de una búsqueda avanzada con especificaciones acerca de los términos ingresados
  • Campos de vínculo

Otro modo para especificar la relación de los términos ingresados es otorgar al usuario una lista donde selecciona el campo al cual pertenecen, de manera que pueda expresar si los términos corresponden a una frase exacta (the exact phrase), si son palabras independientes pero dentro de un texto específico (all of the words), si se trata de palabras independientes que podrían estar dentro de un texto específico (any of the words), o si son palabras relacionadas con la temática del objeto buscado (none of the words).


Ejemplo de dropdown con una lista de datos temporales a seleccionar. Sitio de A2A Acces to Archives
  • Búsquedas Avanzadas por temporalidad o rangos numéricos

Estas búsquedas se utilizan para filtrar resultados en fechas, precios, valores, horas, etc. Para este caso se estudiaran casos específicos de anotación de fechas. Existen dos formas de filtrar los resultados de búsqueda por datos temporales, la más directa es ingresar libremente la temporalidad exacta, es decir ingresar el año o fecha específica, sin embargo los modos de notación de fechas utilizada por cada usuario pueden variar, entonces es probable que la búsqueda no sea eficaz. Para ello es mejor entregar las opciones de fechas predeterminadas y que el usuario las seleccione, por ejemplo en un dropdown, diferenciando días, meses, años, siglos, épocas, etc.

Caja de texto predeterminada para el ingreso de datos numéricos y selección de fechas en un calendario

Otra modalidad para buscar específicamente artefactos inscritos en el tiempo es otorgando al usuario la posibilidad de acotar la búsqueda a un rango de tiempo, de manera que los artefactos que resulten de esa pregunta estarán inscritos dentro de un rango temporal y no una fecha específica.

Para anotar ese rango temporal también es bueno evitar que el usuario anote los datos, es mejor que seleccione el rango dentro de un sistema determinado como slidebars (en el cual se disponen dos puntos que determinan el rango dentro una línea de tiempo) o “masked edit” (para restringir el tipo de texto que será ingresado por el usuario, guiándolo en la manera de anotación para números) o bien otorgando un calendario convencional donde el usuario puede marcar las dos fechas que acotan el rango temporal.

Ejemplo de especificación de la pregunta por un rango temporal

Por otra parte existen especificaciones de búsqueda respecto de la primera fecha ingresada, ya que puede tratarse no sólo de un rango de tiempo “a partir de tal fecha”. La pregunta por la primera fecha ingresada especifica si es la fecha exacta, desde, antes o después, por lo que debería otorgarse al usuario la selección de estas opciones.


Ejemplo de búsqueda avanzada por proximdad de los términos house + history
  • Búsquedas Avanzadas por proximidad

El usuario ingresa dos palabras libremente, la idea es asociar una palabra cualquiera a otra palabra que sea representativa del tópico que desea investigar. Los resultados de búsqueda están determinados por la proximidad de estas dos palabras en un párrafo de texto que corresponde a la descripción de los artefactos consultados. La proximidad se mide por la cantidad de palabras entre éstos dos keywords.


  • Búsquedas Avanzadas por etimología

El usuario ingresa un término y la búsqueda arroja resultados de la base dedatos que contengan esa palabra exacta o que contengan la raíz de la palabra de búsqueda especificada. Por ejemplo si ingresa la palabra correr, entonces en la b´suqeda también se considerarán las palabras corriendo, corren, etc.

Referencias

muestras de aplicaciones en Ajax
Descripción parámetros de búsqueda en Yahoo!
Documentación de búsquedas Developer Connection de Apple
Opciones de búsquedas avanzadas para documentos pdf

Estudio de tecnologías para la implementación de un repositorio digital

Un repositorio digital es un sistema en red (hardware, software) que proporciona servicios referidos a una colección de objetos digitales (toda información capaz de ser almacenada digitalmente): guardarlos de forma estructurada en un “lugar” seguro, de manera que puedan ser fácilmente accesibles y recuperables para ser usados, reutilizados y compartidos con diferentes propósitos y en diferentes contextos.

Dpace Manakin

Manakin es la segunda versión de la interfaz de usuario DSpace XML UI, proyecto que implementa una interfaz basada en XML que permite mantener colecciones y comunidades con su propio look and feel. El proyecto se basa en el marco Cocoon junto con la Interface Repositorio Digital(DRI) y el esquema de usos Temas para estilos y paquetes de contenido llamados aspectosde la portabilidad. Estas características se combinan para ofrecer mejoras en la eficiencia y una mayor modularidad en la generación de contenidos.

Requerimientos y especificaciones

Apache Cocoon es un frameworks de desarrollo Web diseñado en torno al concepto de “separación de preocupaciones” (SoC) utilizando una arquitectura basada en los componentes. El frameworks se centra en la publicación a través de sitios Web usando Simple API para XML (SAX) eventos en basados en las “tuberías” (pipeline)

El principio de diseño SoC en Cocoon se realiza por componentes. Los Componentes son operaciones que se unen para formar un flujo. Los tipos de componentes que existen son: Matchers, Generadores, Transformadores, Serializers, Selectores, visualizadores, Lectores y Acciones. Estos componentes no están interconectados, no hay método de llamadas de un componente a otro. En lugar de ello, su interacción se guía por su estructura(conductor), que en la mayoría de los casos es el mapa de sitio

  • Tuberías(Pipeline)

La tubería es un concepto fundamental de Cocoon. Como web, la solicitud entra en la “tubería”, diversos componentes transformar el contenido en cada etapa hasta llegar al final de la “tubería”, donde el contenido se transmite al usuario. Los sitios web se construyen a través de la disposición de los componentes de la “tubería” que a veces se denomina “lego-like” enfoque. Bajo este enfoque, un programador es capaz de construir un sitio web dinámico de enganche junto componentes sin necesidad de recurrir a cualquier "real" de programación.

  • Mapa del Sitio

El mapa web es un conjunto de documentos XML que describen como son configurados juntos todos los elementos de Cocoon. El mapa de sitio contiene dos partes principales: un componente de definición, que describe cada tipo de componente y una “tubería”(pipeline), que define la manera en que los componentes están organizados.^El mapa del sitioes el corazón de cualquier Web basada en Cocoon.

Tipos de Componentes

  • Generadores

Los generadores crean un flujo de eventos SAX para que sean procesados a otros componentes. Normalmente, este se deriva de un archivo XML en el sistema de archivos. Sin embargo, estos contenidos también pueden ser generados dinámicamente sobre la marcha o puede ser el resultado de una nueva petición HTTP, ya sea interna a la página Web o a un sitio Web externo. Típicamente, en las “tuberías” el primer componente es un generador.

  • Transformadores

Los transformadores toman un flujo de eventos SAX y realizar unos procesos en ellos. El flujo SAX puede ser tratado para añadir o eliminar el contenido de la tubería. El transformador más común es un transformador XSLT.

  • Serializers

Serializers son el punto final de un “tubería” Transforman los eventos SAX en binario o en flujo de caracteres para trasmitirlos al cliente.

  • Matchers

Los matchers se utilizarán para hacer coincidir las respuestas contra wildcard o patrones de expresiones regulares. Sobre la base de esos resultados, la posibilidad de adoptar decisiones sobre qué componentes incluir en las “tuberías” y que pasar por alto.

  • Selectores

Los selectores son similares a matchers pero con mayor flexibilidad. En caso de los Matchers solo pueden hacer decisiones binarias de "sí / no", un selector puede hacer que las decisiones de opción múltiple, similar a “if – else – if – else”.

  • Acciones

Las acciones no añaden ni eliminan el contenido de la tubería, ni toman decisiones sobre el flujo de la tubería. En su lugar, realizar operaciones que puedan afectar a las decisiones futuras de matchers o selectores.

  • Lectores (readers)

Los lectores son a la vez el inicio y el punto final de una tubería. Las tuberías normales deben empezar con un generador y terminar con un serializer. Los lectores combinan estas funciones y las utilizan normalmente en contenido binario tal como imágenes.


Más Información el la guía de desarrolladores (ingles)

Fedora commons

Fedora es un software de gestión de contenidos que se ejecuta como el servicio Web Apache Tomcat. Fedora proporciona las herramientas e interfaces para la creación, ingestión, administración y difusión de contenidos almacenados en un repositorio.

Hay una serie de características que distinguen a Fedora:

Apoya la creación y administración de contenidos digitales de objetos u objetos digitales que puede agregar datos de múltiples fuentes. Por ejemplo, un objeto digital podría ser un conjunto de imágenes TIFF que son las páginas individuales de un documento escaneado. Las fuentes de datos pueden ser gestionados de forma local dentro del software Fedora o procedentes de otra URL de acceso al servidor. Las fuentes de datos pueden ser de contenido o metadatos. Se pueden pensar estos objetos digitales como documentos digitales avanzados, especialmente a la luz de la función describen a continuación.

Apoya la asociación de servicios web con los objetos digitales

Estos servicios suelen consumir los datos empaquetados dentro del objeto digital para producir una distribución dinámica de los objetos digitales. Por ejemplo, el objeto digital descrito arriba con múltiples imágenes de página en formato TIFF puede estar asociado con un servicio OCRs, las imágenes son partes del objeto digital y se difunde una versión HTML de las páginas. Los servicios pueden ser tanto locales a la maquina del respectivo servidor fedora u otro servidor de red de acceso que a través de una URL. De este modo, Fedora actúa como un servidor proxy de coordenadas locales y distribuye datos y servicios web dentro de un framework uniforme. Esto se ilustra en la Figura 1.

Proporciona un acceso uniforme a estos objetos digitales en una interfaz basada en la web

A través de solicitude REST (Representational State Transfer) y los más potentes métodos basados en SOAP (Object Access Protocol) es un protocolo estándar creado por Microsoft, IBM y otros, está actualmente bajo el auspicio de la W3C que define cómo dos objetos en diferentes procesos pueden comunicarse por medio de intercambio de datos XML. Esta interfaz se compone de un conjunto de procedimientos para el acceso a métodos de características comunes a todos los objetos digitales, como clave de metadatos y estructura interna. Estos incluyen un método para “mirar dentro” (introspect) de en un objeto y revelar el conjunto de métodos que constituyen la extensión del comportamiento de ese objeto. Por ejemplo, un cliente podría utilizar estos métodos incorporados para "aprender" sobre la capacidad del objeto digital descrito anteriormente como una forma dinámica difundir una página HTML a partir de un conjunto de imágenes TIFF. Los beneficios de estos son dobles:

  • Los clientes pueden acceder a los objetos digitales de Fedora y contar con un acceso uniforme independientemente de la naturaleza del objeto.
  • Las distribuciones disponibles de un objeto son independientes de la estructura interna del objeto. Por ejemplo, la interfaz del cliente del ejemplo anterior en HTML que se difunde a partir de un conjunto de páginas TIFF puede permanecer constante, independientemente de si los objetos figuran en imágenes TIFF, JPEG, PDF, o incluso un simple HTML estático. Esto le da al desarrollador de contenido gran libertad para modificar un repositorio de manera interna, sin perturbar como el cliente y el usuario visualizan el contenido.


En él se presenta un modelo de interfaz de administración uniforme y potente basados en SOAP

Todas las operaciones internas del repositorio como objeto, la creación y gestión están disponibles a través de esta API, proporcionando los ganchos para integrar Fedora en una variedad de entornos. Estos hace útil a Fedora para la creación (fundación)de un administrador de contenido con aplicaciones avanzada.

  • Incluye amplias versiones de frameworks que realizan un seguimiento de la evolución de los objetos y proporciona acceso a las versiones anteriores.
  • Incluye una relación básica entre frameworks para representan los vínculos entre los objetos digitales.

Apoya la ingesta y exportación de objetos digitales en una variedad de formatos XML

Esto permite el intercambio entre Fedora y otras aplicaciones basadas en XML y facilita las tareas de archivo.


más información en el tutorial de Fedora(ingles)

Eprint

Eprint es un programa que sirve para construir repositorios genéricos desarrollado por la Universidad de Southampton, se tiene la intención de crea repositorios Web altamente configurables. EPrints se utiliza a menudo documentos de investigación como archivos, y la configuración por defecto refleja esto, pero también se utiliza para otras cosas tales como imágenes, datos de la investigación, archivos de audio y cualquier archivo que puede ser almacenada digitalmente.

Requerimientos

Lo idea es contar como wget, tar y [unzip]


Mas información en la documentación de Eprint

Modelo de Interacción

Modelo de accesibilidad

Tres niveles de accesibilidad según usuario predeterminado

En él se grafica tres niveles de accesibilidad al sitio web.

  • En un primer nivel se encuentra el usuario no registrado u observador. A él corresponde el nivel de accesibilidad más limitado de los tres. Este usuario solo puede ver y pre-visulizar, estando inhablitado para interactuar con los contenidos.
  • En el segundo nivel esta el usuario registrado que tiene una cuenta personal la cual presta herramientas de almacenamiento y anotación. La cual se da en una capa superior a los objetos, sin modificar el archivo original. Además puede acceder a búsquedas realizadas por otro usuarios que relacionen objetos que él haya seleccionado y guardado en su búsqueda, dándole la posibilidad de contextualizarlos en otras temáticas y a su vez encontrar otros artefactos relacionados que le sean de utilidad.

Además tiene la posibilidad de proponer al administrador material archivable, colaborando con las colecciones de archivos patrimoniales.

  • El tercer nivel correponde al administrador, el cual cuenta con el mayor nivel de acceso al sitio. Estas personas son elegidas por las instituciones encargadas del repositorio respectivo. Personas encargadas de la línea editorial del sítio, que deben tener un nivel de conocimiento adecuado para intervenir en el diseño, mantenimiento y publicación. Siendo de radical importancia este último item, ya que determinará que material propuesto por los usuarios registrados podrá ser catalogado dentro del archivo patrimonial y cual no.

Diagrama de Roles

Características de la interacción con el sistema que posee un usuario registrado y un usuario observador

En el se muestran las principales acciones, y propiedades que caracterizan a un usuario registrado, persona que contará con las funciones principales en el sitio, luego del administrador. Dentro de ellas se encuentra la posibilidad de generar y guardar una búsqueda asignándole descripciones, etiquetas y notas, enriqueciendo la información base con la que cuenta un artefacto determinado de cualquier archivo. De esta forma si otro usuario da con el mismo artefacto, dentro de los datos de ese artefacto, aparte de su título, autor, descripción y categoría, podrá acceder al registro de búsquedas a las cuales ha sido adjuntado el archivo y las posibles notas que incluyan otros usuarios, mostrando otras temáticas a las cuales se relaciona, ampliando su propia visión de estudio. También esta la posibilidad de que en caso de contar con material patrimonial, este usuario aporte proponiendo su material, subiéndolo en formato digital a un nivel intermedio para que el administrador tome la decisión de subirlo oficialmente o no. Por otro lado se muestra al usuario no registrado también conocido como observador, el cual solo tendrá la posibilidad de navegar por el sitio, sin interferir en la información que acompaña cada artefacto, esto como manera de regular que los datos aportados por los usuarios sean serios, facilitando al administrador la tarea de resguardar la información patrimonial que alberga el sitio.


Diagrama de Artefactos

Relaciones y caracteristicas de los artefactos de archio

En este diagrama se consideran todos los aspectos con los cuales puede estar relacionado un artefacto, de esta forma se definen primero todos los tipos de materiales que son considerados artefactos, estos son: video, audio, imagen y documentos de texto. Elementos que se relacionan con un universo determinado de posibilidades de registro y los formatos que puede contener un sitio web. Cada uno de estos elementos cuenta con datos básicos como título, autor, fecha, descripción, categorías y keywords. Estos artefactos quedan contenidos en una primera instancia en la base de datos de un repositorio digital determinado, y en una segunda instancia queda relacionado con una carpeta temática de búsqueda perteneciente una cuenta de usuario determinada.

Secuencia de Uso

Flujo de acciones primarias de búsqueda

Versión pdf

A partir del benckmark realizado se plantea la necesidad de una primera visualización de la interacción entre las acciones que podría realizar el usuario y lo que ellas generan en el sistema. Para esto se utilizó el modelo de esquemas Blueprinting.

En él se muestra las sisguientes acciones:

  • Primero el usuario que entra en la página
  • Segundo, crea una cuenta, aparece la caja de suscrpción el usuario completa con datos como su nombre, apellido, ID y correo electrónico. Elsistema valida los datos y envia un mail de confirmación al usuario, este lo revisa y clikea el link de acceso a su cuenta personal.
  • Tercero, crea una carpeta de búqueda, para ir archivando temáticamente los resultados de su búsqueda.
  • Cuarto, realiza su primera búsqueda mediante el uso de palabras clave, el sistema procesa la búsqueda y los resultados aparecen en la misma página mostrrandose como un listado de objetos con referencias básicas, como el archivo al cual pertenece, la colección, título, autor, el usuario selecciona un ítem.
  • Quinto, pre-visualiza el artefacto , apareciendo una ficha con datos más detallados sobre el objeto, como un abstract de sus contenidos.
  • Sexto, guarda el ítem dentro de la carpeta creada. Al archivar el objeto, el sistema da la posibilidad de asignar tags a la búsqueda realizada, los guarda y vuelve a la página de usuario.