Investigaciones en curso sobre interfaces gráficos en dos y tres dimensiones para el acceso a la información electrónica


Félix de Moya Anegón
felix@goliat.ugr.es

Victor Herrero Solana
vhersol@alcazaba.unex.es


Sumario


Resumen

En este trabajo se presentan una serie de proyectos de investigación sobre interfaces gráficos. Se consideran tanto los intefaces bidimensionales como los tridimensionales, especialmente los basados en VRML. Se pone énfasis en las redes neuronales (SOM) como métodos de organización de la información. Por último, se presenta el proyecto de investigación IRVAIE, que tiene por objetivo el desarrollo de un nuevo intefaz para el acceso a información electrónica, con particular énfasis en el diseño de una metáfora tridimensional que permita la comunicación entre los usuarios y facilite la exploración de grandes volúmenes de información.

Introducción

Las técnicas avanzadas de recuperación de la información (RI), son una de las áreas de investigación más activas de nuestra disciplina. Desde hace años se viene trabajando en mode-los de representación de contenidos documentales que representen una superación del ya clásico, que consiste en la equiparación exacta de términos de búsqueda suministrados por el usuario contra los términos de indización existentes en los ficheros invertidos de una base de datos. Estos modelos alternativos están basados en el concepto matemático denominado coeficiente de similaridad (Moya 1995).

Uno de los más conocidos es el modelo de espacio vectorial defi-nido por Salton en el marco de su proyecto SMART (Salton 1979), en donde los documentos son representados por vectores n-dimensionales, siendo n el número de términos de indiza-ción contenidos en el texto completo. Este espacio multidimensional representa fiel-mente la complejidad de relaciones de contenido de un grupo determinado de documentos. Sin em-bargo, es imposible visualizar este espacio, por lo que es necesario apelar a diver-sos algoritmos denominados de reducción de la dimensión que permitan generar una repre-sentación aproxi-mada humanamente observable.

Entre los algoritmos más conocidos encontra-mos:

  1. análisis de componentes principales (PCA),
  2. escalamiento multidimensional (MDS), y
  3. análisis de cluster (Kinnucan 1987).

A ellos es posible agregarles un cuarto basado en el tratamiento de la información mediante redes neuronales artificiales (RNA).

Los interfaces bidimensionales

Nos referimos a un modelo especí-fico de RNA denominado Mapa Auto-Organizativo (Self-Organizing Map), también llamado modelo de Kohonen o SOM, que trabaja bajo el principio de auto-organización y agrupación de vectores n-dimensionales en un espacio bidimensional. A principio de los años 80, Kohonen demostró que una información de entrada por sí sola, suponiendo una estructura propia y una descripción funcional del comportamiento de la red, era suficiente para forzar la forma-ción de ma-pas topológicos (Kohonen 1997). Estos mapas presentan la característica de organizar la informa-ción de entrada clasificán-dola automáticamente. El principio es bastante sencillo, podemos imaginar el SOM como una caja negra que recibe información de en-trada (numérica) y que a la salida presenta una matriz de puntos (neuronas) que llamaremos mapa. La información de entrada se procesa de tal forma que cada una ocupa un lugar en el mapa. Para ello la red debe realizar gran cantidad de cálculos con una serie de datos de ejemplo, a esto se lo llama "entrenamiento de la red". Una vez entrenada, la red puede reci-bir datos nuevos que ira ordenando en un determinado lugar del mapa de salida. Lo im-portante es que la red siempre pondrá el mismo dato en el mismo lugar del mapa, y tenderá a agrupar los datos similares en la misma zona de dicho mapa.

Este modelo ha sido utilizado para reducir la dimensión en una amplia gama de espacios documen-tales de dis-tinta naturaleza.

En la figura 1 podemos observar un ejemplo de SOM. Se trata del WEBSOM, un proyecto dirigido por el propio Kohonen en la Universidad Tecnológica de Helsinski y que clasifica grandes volúmenes de información procedentes de un grupo de noticias Usenet (Honkela 1996a y 1996b). Las áreas oscuras indican mayor densidad de información que las claras, y los temas aparecen resumidos en tres letras. Cuando se selecciona una determinada zona se accede primero a un mapa ampliado de la misma y luego a una lista de documentos relacionados temáticamente. El sistema tiene un interface muy sencillo de manejar y puede ser visitado en: http://websom.hut.fi/websom. (Honkela 1995, Kaski 1995 y 1996, Lagus 1996).

Otro ejemplo intersesante de SOM ha sido desarrollado por Xia Lin, investigador de la Escuela de Biblioteconomía de la Universidad de Kentucky. El principio de funcionamiento es similar al WEBSOM, cada zona del mapa representa un tema deter-minado, indicado por los nombres y colores.


Imagen grande

Como podemos apreciar en la figura 2, cada uno de los puntos pequeños es un documento. El mapa permite aumentar o disminuir la resolución de los puntos y nombres, de forma tal que sea posible observar en determinado momento solo los grandes temas, para luego en-trar con más detalle en los temas menores asociados. Varios sitios web co-nocidos cuentan con un mapa de este tipo como índice automático de contenidos: Yahoo, McDonnell-Douglas, etc. (Lin 1995 y 1996, 1997).

Lin establece cuales son las limitaciones del modelo, entre las que se encuentran: incapacidad para trabajar con grandes volúmenes de in-formación y alto costo de procesamiento de la información. No obstante, la aplicación de este modelo parece ser una de las aplicaciones más prometedoras en la clasificación automática mediante redes neu-ronales. Existen en la actualidad algunas aplicaciones que presentan un mapa de visuali-zación para sitios Internet. En la página personal del propio Xia Lin (http://www.uky.edu/~xLin/) es posible encontrar más información sobre el asunto, inclu-yendo una lista de sitios web clasificados por este método.

Otro ejemplo similar es este tipo de mapas ha sido desarrollado por el Grupo de Inteligencia Artifi-cial de la Universidad de Arizona, con fi-nanciamiento de varias entidades gubernamentales estadounidenses. El sistema intenta brindar, de forma automática y escalable, una aproximación temática a la categorización y búsqueda de información en la red.


Imagen grande

En la figura 3 podemos observar la apariencia de este interfaz, el cual puede ser examinado en: http://ai2.BPA.arizona.edu/ent/

Los interfaces tridimensionales

La salida que se obtiene con cualquiera de estos algoritmos es una serie de coordenadas en espacio reducido (normalmente bidimensional), que permiten visualizar de forma clara, aunque un tanto distorsionada, las relaciones existentes en el espacio multidimensional. Ahora bien, el presente proyecto parte del principio de que si utilizamos un espacio tridi-mensional (3D) como espacio reducido obtendremos una distorsión (stress) menor a la de la repre-senta-ción bi-dimensional, y podremos observar una noción más cercana a la realidad multidi-mensio-nal. Esto nos permitirá representar de forma más fidedigna la complejidad de relaciones de contenidos entre los documentos, lo cual facilitará al usuario los procesos de búsqueda y recu-peración de la información que desee llevar a cabo.

El problema de esto radica en que, si bien efectivamente en un entorno 3D obtendre-mos una menor distorsión en la representación, nos encontramos con el inconveniente que acarrea moverse de manera fluida en un entorno tridimensional (Boyle 1996). Creemos que el secreto del éxito se encuentra en la utilización de una metáfora de visualización correctamente diseñada. Esta tarea es sumamente compleja, si tenemos en cuenta que una metáfora es una representa-ción que permite interactuar de forma sencilla y por analogía con un sistema mucho más complejo de manera totalmente transparente al usuario (Eberts 1994), pero que no deja de ser representación necesaria-mente incompleta y sesgada de dicho sistema (Dieberger 1997).

En informática, el desarrollo de metáforas ha estado íntimamente ligado con la historia de los interfaces de usuario, y a sido un factor determinante en la consolidación de los dife-rentes sistemas. El caso más conocido es la adopción de la metáfora de escritorio, inventada por Xerox y popularizada por Apple en el Macintosh, por Microsoft para el PC-Intel aunque este último le hubiera ya ganado la guerra de los estándares a Apple (Lynch 1994). Las ten-dencias en este campo apuntan a la creación de interfaces cada vez más íntimos e integrados al usuario (Piscitelli 1995). En esta línea, la representación en 3D y la realidad virtual (RV) jue-gan un papel muy importante, el cual se a visto incrementado partir de la creación del estándar VRML.

En un entorno de RV, la metáfora de visualización cobra un papel protagónico y se ve enri-quecida por la amplia gama de formas que esta puede adoptar: formas geométricas (cubos, esferas, poliedros, et.), formas artificiales (casas, habitaciones, ciudades, etc.), formas naturales (relieves de terreno, árboles, etc.), estructuras sistemáticas (sistemas de carreteras, sistemas de flujo, etc.), sistemas dinámicos (átomos, moléculas, constelaciones, etc.), y sistemas simbólicos tradi-cionales (mandalas, etc.) (Benking 1994).

Existen varios desarrollos de metáforas 3D, las cuales podemos dividir en dos grandes grupos: las basadas en nodos espaciales (spatial nodes) y las basadas en mapas es-tructurales (structured maps) (Andrews 1994). Las primeras son muy utilizadas para navegar entornos hi-pertextuales (generalmente la web), a través de racimos de nodos entrelazados mediante líneas de conexión, mientras que las segundas son más indicadas para representar relaciones estructu-rales más complejas como el contenido documental de una base de datos.

Un claro ejemplo del primer grupo lo constituye el modelo Narcisssus (figura 4), desarrollado en la Universidad de Birmingham, y que tiene como objetivo la organización tridimensional de la información de la web (Hendley 1995). Para ello forma una suerte de galaxias y constela-ciones de esferas de distinto tamaño unidas por líneas. Las esferas representan las pá-ginas y las líneas los enlaces (links). Basándose en este modelo los autores han desarrollado una aplicación espe-cial denominada HyperSpace (figura 4), que también esta dirigida a la gestión de informa-ción en Internet (Wood 1995a, 1995b).


Figura 4
Imagen grande

Un ejemplo del segundo grupo, los mapas estructurales, lo encontramos en un proto-tipo denominado LyberWorld (Hemmje 1994, 1995), que consiste en un interfaz de usuario desarrollado para un sistema probabilístico de recuperación en texto completo llamado INQUERY (Hemmje 1993). Lyber-World presenta dos metáforas: las esferas de relevancia (RelevanceSpheres), dirigidas a la búsqueda (figura 5) y los conos de navegación (NavigationCones), utilizados para el browsing de la base de datos (figura 6).


Figura 5
Imagen grande


Figura 6
Imagen grande

Los conos son árboles jerárquicos en 3D sin mayor com-plejidad, mientras que las esferas de relevancia, en cambio, son utilizadas para organi-zar de forma espacial un determinado grupo de documentos dependiendo de su grado de relevancia.

Hay otros desarrollos que en realidad no pueden ser encuadrado en ninguno de los dos grupos, como es el caso de Virgilio, un interfaz que permite visualizar las búsquedas de una base de datos de obras musicales (Levialdi 1995). El problema de Virgilio consiste en que la metáfora elegida es la de un edificio (forma artificial), que intenta plasmar de manera fotográ-fica un entorno de RV, que resulta poco intuitivo y complicado de navegar (figuras 7 y 8).


Figura 7
Imagen grande


Figura 8
Imagen grande

El proyecto IRVAIE

IRVAIE ("Inter-faz de realidad virtual para el acceso a información electrónica" TEL97-1131), es un proyecto investigación subvencionado por el Plan Nacional de In-vestigación y Desarrollo (I+D) de la Comisión Interministerial de Ciencia y Tecnología de Es-paña (Moya 1998). El primer objetivo del proyecto consiste en desarrollar una metáfora que permita a los usuarios navegar entre los documentos representados en el espacio reducido por alguno de los métodos citados (PCA, MDS, cluste-ring y SOM).


Figura 9
Imagen grande

En la figura 9 se puede apreciar una representación basada en MDS de los grandes grupos temáticos de la CDU.

Para ello se estu-diarán las diversas metáforas existentes con el fin de sintetizar los elementos más importantes de cada una y desarrollar un modelo propio. La metáfora será sometida a diversos test con el fin de analizar de que forma organiza diferentes tipos de información: 1) datos estruc-turados je-rárquicamente mediante un sistema de clasificación clásico (CDU, Dewey, etc.), 2) informa-ción, también estructurada jerárquicamente, existente en directorios de la web (Yahoo, Galaxy, etc.), y 3) documentos representados mediante el modelo vectorial. Este último caso es el más importante y esta dividido en dos fases: 1) visualización del resultado de una búsqueda (query), y 2) browsing de la base completa.

El análisis también incluye el trabajo con usuarios para evaluar por un lado el rendi-miento global del sistema, y por otro la medida en que estos usuarios se adaptan y aceptan el nuevo entorno de trabajo. Un punto interesante consiste en la observación de los usuarios interactuando simultáneamente en el sistema. Creemos que en un sistema de recuperación de información electrónica, la interacción y comunicación con otros usuarios es un factor impor-tante que ha sido muy poco estudiado. Este tipo de navegación cooperativa y de comunicación inter-usuario, brinda información con valor añadido más allá de los contenidos en el propio sistema.

El segundo objetivo es estudiar a fondo la capacidad del SOM como reductor de la dimensión. Si bien hablamos en general de los cuatro algoritmos, el SOM presenta para no-sotros un interés especial debido a que es una aproximación radicalmente distinta al problema de la reducción. Lo estudiaremos comparativamente con los otros tres, con el fin de determi-nar como organiza el espacio y cual es el grado de stress que introduce en las representaciones. Hasta el momento no se ha realizado ningún estudio de este tipo en el campo de la RI.


Figura 10
Imagen grande

En la figura 10 podemos observar un ejemplo de SOM que organiza las grandes categorías o grupos temáticos de la base ISOC del CINDOC.

Si bien todavía no tenemos claras las herramientas tecnológicas a utilizar, esta claro que se trabajará con formatos de datos estándar, como el VRML. Esto garantizará la posibili-dad de desarrollar una aplicación fácilmente compartible y portable, además de que la utilización de formatos propietarios condiciona fuertemente el trabajo realizado ya que im-piden la migración a sistemas posteriores.

Es importante destacar que el objetivo principal consiste en desarrollar un entorno de trabajo estándar, no diseñado para contexto específicos sino para su utilización de forma gene-ral por una amplia gama de usuarios en diversas situaciones. Por ello es muy importante traba-jar con los visualizadores clásicos (Netscape y Explorer) y no con programas propietarios que reducen su cobertura potencial. Para el caso de las metáforas tridimensionales, trabajaremos con el estándar VRML, tal como se puede apreciar en la represenatción de la figura 11.


Figura 11
Imagen grande
No obstante, estas herramientas no son capaces, hasta el mo-mento, de trabajar en entornos multiusuario. Por ello y para las primeras fases del proyecto, no se descarta la posibilidad estudiar la interacción inter-usuario en un entorno propietario del tipo Alphaworlds SDK. Para más información, se encuentra disponible una sede web del grupo: http://fbds02.ugr.es/irvaie/

Conclusiones

Es importante tener en cuenta que los sistemas aquí descritos brevemente tienen muchas ventajas y desventajas en el tratamiento de la información automatizada. Cada uno puede presentar adeptos y detractores, por lo que es imposible establecer conclusiones ca-tegóricas en medio de un entorno tan cambiante. Lo que si podemos afirmar es que, sea cual fuere el sistema utilizado, los intefaces de acceso a la información electrónica constituyen una línea de investigación importante en el campo de la documentación.

En cuanto a las técnicas utilizadas para organizar la información, debemos destacar el promisorio futuro de los siste-mas basados en redes neuronales. Este es, no obstante, un campo todavía joven que se encuentra en una fase experimental temprana y al cual todavía no se le puede exigir aplica-ciones finales concretas.

Referencias

Benking, Heiner; Judge, Anthony (1994). Design considerations for spatial metaphors. // ECHT94 Workshop on Spatial Methapors.
http://www.lcc.gatech.edu/faculty/dieberger/ECHT94.WS.Benking.html

Boyle, John; Lowit, Peter; Mitchell, Kenny (1996). 3D or not 3D... // Proceedings of the 3rd. FADIVA Workshop. Gubbio, Italia, 1996.
ftp://ftp.dis.uniroma1.it/pub/santucci/in/FADIVA/jboyle.ps.Z

Dieberger, Andreas (1997). Navigation metaphors and social navigation in information spaces. // CHI´97 Workshop on Navigation in Information Spaces.
http://www.lcc.gatech.edu/~dieberger/CHI97_navigation_workshop.html

Eberts, Ray. User interface design. Englewood Cliffs : Prentice Hall, 1994. (Prentice Hall International Series in Industrial and Systems Engineering).

Hemmje, Matthias (1993). A 3D based user interface for information retrieval systems. // Proceedings of IEEE Visualization ´93. San Jose, California, October 25-29.
ftp://ftp.darmstadt.gmd.de/pub/VISIT/papers/hemmje/IEEEVIS93.ps

Hemmje, Matthias; Kunkel, Clemens; Willet, Alexander (1994). Lyberworld - a visualiza-tion user interface supporting fulltext retrieval. // Croft, W.B.; Rijsbergen, C.J. van (eds.) Pro-ceedings of the 17th Annual International Conference on Research and Development in Information Retrieval (SIGIR´94). Dublin, July 3-6. Springer Verlag, 1994. Pp. 249-257.
ftp://ftp.darmstadt.gmd.de/pub/VISIT/papers/hemmje/SIGIR94.ps

Hemmje, Matthias (1995). Lyberworld - a 3D graphical user interface for fulltext retrieval. // Pro-ceedings of CHI´95. ftp://ftp.darmstadt.gmd.de/pub/VISIT/papers/hemmje/CHI95.ps.gz

Hendley, Robert; Drew, Nick; Wood, Andrew; Beale, Russell (1995). Narcissus: visualising information. // Info-Vis´95. Atlanta, IEEE Press. Pp. 90-96.
ftp://ftp.cs.bham.ac.uk/pub/authors/R.J. Hendley/ieeeviz.ps.Z

Honkela, Timo; Pulkki, Ville; Kohonen, Teuvo (1995). Contextual relations of words in Grimm tales, analysed by self-organizing map. // Proceedings of International Conference on Artificial Neural Networks, ICANN-95. París : EC2 et Cie.
http://www.cis.hut.fi/~tho/publications/grimmsom.ps

Honkela, Timo; Kaski, Samuel; Lagus, Krista; Kohonen, Teuvo. (1996a). News-group ex-ploration with WEBSOM method and browsing interface. Espoo : Helsinki University of Techno-logy, Laboratory of Computer and Information Science. (Technical Report, A32).
http://websom.hut.fi/websom/doc/websom.ps.gz

Honkela, Timo; Kaski, Sammuel; Lagus, Krista; Kohonen, Teuvo (1996b). Self-organizing maps of document collections. // Alma. 1: 2, 1996.
http://www.diemme.it/~luigi/websom.html

Kaski, Sammuel; Kohonen, Teuvo (1995). Exploratory data analisis by the self-organizing map: structures of welfare and poverty in the world. // Refenes, A. y otros (eds.) Neural Networks in Financial Engineering: Proceedings of the Third International Conference on Neural Networks in the Capital Markets. London, 11-13 October, 498-507.
http://www.cis.hut.fi/~sami/nncm95.ps.gz

Kaski, Sammuel; Honkela, Timo; Lagus, Krista; Kohonen, Teuvo (1996). Creating an order in digital libraries with self-organizing maps. // Proceedings of World Congress on Neural Networks, WCNN´96. Mahwah, NJ : INNS Press, 814-817.
http://websom.hut.fi/websom/doc/wcnn96o.ps.gz

Kinnucan, Mark; Nelson, Michael; Allen, Bryce (1987). Statistical methods in information science research. // Annual Review of Information Science and Tecnology (ARIST). 22 (1987) 147-178.

Kohonen, Teuvo. Self-organizing maps. 2ed. Berlín : Springer, 1997.

Lagus, Krista; Honkela, Timo; Kaski, Sammuel; Kohonen, Teuvo (1996). Self-organizing maps of docu-ment collections: a new approach to interactive exploration. // Simoundis, E.; Han, J.; Fayyad, U. (eds.) Proceedings of the Second International Conference on Knowledge Disco-very and Data Mining. Menlo Park : AAAI Press, 238-243.
http://websom.hut.fi/websom/doc/kdd96.ps.gz

Levialdi, Stefano; Massari, Antonio; Saladini, Lorenzo (1995). Visual metaphors for data-base exploration. // FADIVA 2 Workshop. Glasgow, July 20-22, 1995.
http://www-cui.darmstadt.gmd.de/visit/Activities/Virgilio/Publications/virgilio.ps

Lin, Xia (1995). Searching and browsing on map displays. // Proceedings of ASIS´95. Chicago, Octo-ber 1995. http://www.uky.edu/~xlin/asis95.htm.

Lin, Xia (1996). Graphical table of contents. // Digital Library ´96.
http://www.uky.edu/~xlin/DL96/DL96.htm.

Lin, Xia (1997). Map displays for information retrieval. // Journal of the American Society for In-for-mation Science (JASIS) . 48: 1 (1997) 40-54.

Lynch, Patrick (1994). Visual design for the user interface. // Journal of Biocommunications. 21: 1 (1994) 22-30.

Moya-Anegón, Félix. Los sistemas integrados de gestión bibliotecaria: estructuras de datos y recuperación de información. Madrid : ANABAD, 1995. (Colección Estudios).

Moya-Anegón, Félix; Herrero-Solana, Víctor; Guerrero-Bote, Vicente (1998). Virtual reality interface for accessing electronic information. Library and Information Research News. 22: 71 (1998) 34-39.

Piscitelli, Alejandro (1995). Mente y cuerpo en la era de las máquinas inteligentes. // Piscitelli, Alejandro. Ciber-cul-turas en la era de las máquinas inteligentes. Buenos Aires : Paidós, 1995. (Contextos).

Salton, Gerard (1979). Mathematics and information retrieval. Journal of Documentation. 35: 1 (March 1979) 1-29.

Wood, Andrew; Drew, Nick; Beale, Russel; Hendley, Robert (1995a). Hyperspace: a World-Wide Web visualizar and its implications for collaborative browsing and software agents. // Thrid Internatio-nal World-Wide Web Conference Poster Proceedings. Darmstadt (Alemania), April 10-14. Pp. 21-25. http://www.cs.bham.ac.uk/~amw/hyperspace/www95/

Wood, Andrew; Drew, Nick; Beale, Russel; Hendley, Robert (1995b). Hyperspace: web browsing with visualization. ftp://ftp.cs.bham.ac.uk/pub/authors/R.J.Hendley/1995b.ps.Z

Nota biográfica

Félix de Moya Anegón Facultad de Biblioteconomía y Documentación. Universidad de Granada. Campus Universitario de Cartuja, 18071 - Granada. TE: 958 - 24 - 3948

Victor Herrero Solana Facultad de Biblioteconomía y Documentación. Universidad de Extremadura. Av. Alcaraz y Alenda 1, pasaje - Badajoz TE: 924 - 259910 ext. 217 http://alcazaba.unex.es/~vhersol/