25102006En esta entrevista analiza la importancia de la catalogación y los metadatos en la Web, y las iniciativas orientadas a establecer criterios comunes para la descripción de los objetos digitales. Comenta también los proyectos de bibliotecas digitales en el país, y las distintas etapas en la incorporación de las nuevas tecnologías en las bibliotecas.

—El campo de la educación y las nuevas tecnologías es por definición un campo interdisciplinario: debe construirse a partir de voces y disciplinas diferentes. Podríamos decir que hoy el conocimiento no puede construirse de otra manera. Las entrevistas de educ.ar son un espacio “a la medida” de ese modo de construcción: un repertorio de perfiles diferentes. A nuestros usuarios no les llama la atención encontrar una entrevista a un humorista, a un programador experto, un epistemólogo, un empresario del sector. Pero, ¿qué hace una bibliotecaria en internet? ¿Para qué sirve la catalogación en el mundo de los contenidos web?

—Si pensamos que catalogar es representar o describir de forma normalizada objetos –que en nuestro ámbito son objetos de información– para hacer luego más precisa la búsqueda y acceso a esos objetos, no podemos dejar de advertir la importancia que tiene la catalogación en la Web. Mundo infinito, heterogéneo, no estructurado, que, si bien ha dado por tierra con toda pretensión de “control universal”, demanda posibilidades de filtrar, ponderar relevancia, evaluar, seleccionar rápidamente, organizar, clasificar. Eso se facilita con la catalogación.

Por supuesto que muchas cosas han cambiado en la catalogación desde la utilización de fichas que se arreglaban en forma alfabética a las bases de datos con registros de múltiple acceso, y a los “metadatos” –datos sobre los datos– ocultos tras etiquetas en las páginas web. Pero en todos los casos decimos: “esto es el autor”, “esto es el tema”, “esto el título”. En las fichas nosotros mismos reconocíamos los datos: en las bases de datos y con los lenguajes de marcado en la Web es el software el que reconoce y manipula el nombre de un dato. Y eso es lo que permite, por ejemplo, que un buscador responda ordenando primero un sitio en el que la palabra que buscamos aparece en el título, respecto de otro en el que la palabra figura en el texto.

Y si antes la información de los catálogos se registraba en libros o en ficheros, ahora son múltiples los espacios en los que se acumula y se puede consultar el producto de la catalogación: buscadores que agregan alguna descripción o clasifican los sitios que registran; sitios web que seleccionan y catalogan sitios web como educ.ar, Cyberstacks o Internet Public Library; portales de información especializada que recogen la información de infinidad de artículos de revistas científicas como Scopus o catalogan sus propios recursos como educ.ar; catálogos de decenas de miles de bibliotecas… En internet no sólo crecen exponencialmente los contenidos: también se multiplican las formas de los catálogos.

—Internet nos mete de lleno en el mundo global, nos conecta con otros datos que están organizados por diferentes formas de pensamiento. ¿Qué están haciendo los catalogadores para solucionar esta Babel?

—Además de catalogar, hay muchos grupos y organizaciones que analizan las características de los objetos que se encuentran en internet y piensan cómo describirlas. Y, lo que no es poco, están intentando ponerse de acuerdo. Son muchas las iniciativas que establecen cuáles son los datos que deben señalarse en la descripción de los objetos digitales; una de las más difundidas es el esquema Dublin Core, que fija 15 datos mínimos (título, creador, editor, fecha de creación, entre otros). También hay iniciativas en áreas temáticas específicas o en áreas de actividad, como por ejemplo el esquema LOM (Learning Object Metadata), para describir objetos destinados al aprendizaje.

Para comprender algo del porqué de esta complejidad tenemos que detenernos en los atributos de un objeto digital. Pensemos en un diario en la Web: tal como a un diario de papel, puedo pensarlo como una publicación periódica en su conjunto o puedo describir cada número, o cada artículo: esto es el nivel de análisis para su catalogación. Pero un diario en la Web tiene fotos, imágenes, animaciones que a su vez son objetos digitales que podrían considerarse por separado. Y además contiene hipervínculos a otros objetos y otros sitios. Cada uno de esos elementos, también objetos digitales, está editado en un formato de archivo particular, tiene derechos de autor y condiciones de acceso particulares, puede tener diferentes versiones, etcétera.

Y los enfoques cambian de acuerdo con la finalidad de la catalogación: si describimos para encontrar, para enseñar, para reutilizar, para almacenar y preservar a largo plazo, los datos que interesan son diferentes. Habrá un núcleo de datos común y muchos otros metadatos distintos según la finalidad de la catalogación.

—¿Cómo ves el panorama de las bibliotecas digitales de nuestro país?¿Y en otros lugares?

—Me parece oportuno puntualizar aquí qué entiendo por biblioteca digital. Una biblioteca digital es una organización que procura la selección, evaluación, registro y sistematización de recursos de información en formato digital, asegurando su persistencia en el tiempo y el acceso local o a distancia por parte de una comunidad de usuarios locales o remotos. Un conjunto de objetos digitales sin el adecuado procesamiento, sin una política de crecimiento y sin la organización como para sostener su integridad y los servicios de acceso, no es una biblioteca digital. Las colecciones de las bibliotecas digitales pueden integrarse con contenidos nacidos digitales y con la digitalización de materiales analógicos.

En la Argentina son muy numerosas las iniciativas para conformar bibliotecas digitales por parte de entidades de diverso tipo. Doy algunos ejemplos: organismos oficiales (Biblioteca Nacional, Acceder-Gobierno de la Ciudad de Buenos Aires, Biblioteca Electrónica de la Secretaría de Ciencia, Tecnología e Innovación Productiva, Proyecto SCIELO del CAICYT -Centro Argentino de Información Científica y Tecnológica); organismos del área de la educación: (Biblioteca Nacional de Maestros, educ.ar), Bibliotecas o sistemas de bibliotecas universitarias públicas y privadas (SISBI-Sistema de Información y Bibliotecas de la UBA, Proyecto Roble de la Universidad Nacional de La Plata, el Sistema de Información y Documentación de la Universidad Nacional de Cuyo); otras instituciones académicas o científicas (Biblioteca Virtual de Clacso, BVS- Biblioteca Virtual de Salud), e infinidad de proyectos con fines culturales, profesionales o comerciales.

Creo que nos encontramos en un estadio inicial, con grandes posibilidades de desarrollo. Por supuesto, hay cuestiones a enfrentar de tipo tecnológico, legal –la tensión entre el derecho a la información y la propiedad intelectual–, económico. Entre ellas quiero destacar que nos falta recorrer mucho camino respecto de la cuestión de la catalogación, es decir los metadatos de los objetos digitales, en cuanto a adoptar estándares que permitan compartir, mediante la ejecución de procesos automáticos, las catalogaciones de los objetos, y construir grandes catálogos que permitan buscar en todos ellos mucho más fácilmente.

Y un aspecto más crítico aún es la cuestión de cómo preservar las colecciones digitales a lo largo del tiempo. En la Argentina poco se sabe y se hace para que en el mediano y el largo plazo se pueda acceder a los documentos digitales hoy generados o incorporados a una organización. La obsolescencia de formatos, las diferentes capas de software y el hardware, así como el deterioro de los soportes físicos de la información digital, entre otras condiciones, obstaculizarán o impedirán que puedan “leerse” textos, audio, imágenes, bases de datos, documentos web en no demasiados años, tal como ocurre hoy con documentos generados, por ejemplo, por procesadores de texto propietarios que ya no tienen vigencia, o que se encuentran almacenados en disquetes de una medida para la que no existen actualmente dispositivos de lectura. Esto es válido para la información de cualquier tipo: científica, cultural, administrativa, histórica, etc., en cualquier clase de institución. Este tema está en investigación en el mundo, pero en el país casi no hay conciencia sobre los riesgos que encierra.

—¿La introducción de la informática en la biblioteca fue instrumental o bien modificó estructuras más profundas?

—Las bibliotecas comparten con la mayoría de las organizaciones el reto de adaptarse a los cambios permanentes producidos desde las tecnologías de la información. Pero al ser instituciones cuya misión es la de seleccionar, organizar, preservar y dar acceso a información en variados soportes, viven con particular intensidad los impactos y la complejidad de los procesos de adecuación a estos cambios.

Miremos un poco la historia: la biblioteca, en su etapa preinformática –desde la Antigüedad hasta la primera mitad del siglo XX–, atendía las necesidades de información de usuarios locales, contando principalmente con una colección bibliográfica local enteramente en papel y los catálogos manuales para facilitar la búsqueda y recuperación. Sus colecciones estaban compuestas por libros, folletos y publicaciones periódicas, todas ellas impresos, que se distribuían en diferentes depósitos y salas. Para facilitar las búsquedas existían los catálogos, que duplicaban fichas en diferentes ordenamientos. Tanto los procesos de catalogación y clasificación, la confección de ficheros y bibliografías y los registros de usuarios y préstamos se realizaba manualmente.

A fines de la década de los 60, en Estados Unidos, la Biblioteca del Congreso desarrolló las primeras experiencias de automatización de catálogos y creó el formato de descripción bibliográfica automatizada MARC, adoptado ampliamente en todo el mundo. Fue el inicio de la segunda etapa en esta evolución tecnológica de las bibliotecas: la de la automatización de catálogos y procedimientos. En nuestro país, comienza a fines de la década del 70 en algunas bibliotecas especializadas, y tuvo una mayor expansión en los 80, especialmente con la difusión del programa MicroIsis que distribuyó la Unesco en forma gratuita.

La etapa de la biblioteca automatizada se caracteriza porque utiliza las computadoras conectadas en red para los procesos de control bibliográfico (adquisición, inventario, catalogación y clasificación), para el catálogo público, el control de usuarios y el préstamo. Sin embargo, las colecciones siguen siendo mayoritariamente impresas y se encuentran localizadas entre las paredes de la institución. Como en la etapa anterior, los usuarios deben concurrir a la Biblioteca para acceder a sus servicios.

Y entramos en la era digital, con la explosión de la producción de información en formato digital y la expansión de internet. Por una parte, se inicia el proceso de incorporación de fuentes de información en formato digital, CD-ROM por ejemplo. Por otro lado, internet, con su potencia para el acceso a la información a distancia y sus posibilidades para la comunicación, desmorona los límites físicos de la biblioteca: cualquier persona puede alcanzar información en recursos de cualquier lugar del mundo; complementariamente, a través de las páginas web pueden recurrir a la biblioteca usuarios de cualquier latitud. Y en la pantalla es posible pasar de un registro de un catálogo al libro o artículo descrito sin buscar en un estante. Estos son los rasgos esenciales de las bibliotecas de la era digital.

El ingreso de la biblioteca en cada etapa de las que hemos descrito no implica el abandono de la anterior sino que las características de la biblioteca preinformática, la automatizada y la de la era digital coexisten en las instituciones. Además del cambio instrumental, que ha sido enorme e implica el reciclaje permanente de conocimientos y habilidades para los que trabajamos en las bibliotecas, la falta de límites en cuanto a los recursos de información y los usuarios está produciendo otra importante transformación: de la biblioteca que administra la propiedad de materiales bibliográficos locales se está cambiando hacia una organización que gestiona el acceso al conocimiento de muchas y diversas maneras.

En este proceso, muchas bibliotecas han recogido el guante y están fortaleciendo y modificando roles de forma particular: mediante la digitalización y la construcción de bibliotecas digitales encontraron un poderoso recurso para almacenar, preservar y dar acceso a la producción intelectual, artística y cultural. También están robusteciendo su papel docente en cuanto a la formación de usuarios para el acceso y uso de la información. Por último, las bibliotecas tienen una enorme responsabilidad para asegurar el acceso democrático a al información, muchas veces amenazado por fuertes intereses comerciales y corporativos o por la falta de recursos de vastos sectores de la población.

—Trabajaste en el Programa Inventario en la Biblioteca Nacional. ¿En qué consistió? ¿Qué objetivos tenía o tiene este trabajo?

—Con profunda alegría puedo decir que hace pocos días la Biblioteca Nacional finalizó el inventario de libros, con un resultado de 763.000 libros registrados. En el 2004, durante la gestión de Elvio Vitali y frente al hecho de que a casi 200 años de existencia la Biblioteca Nacional no había construido un inventario completo y unificado de su patrimonio bibliográfico, comenzó el diseño, la planificación y ejecución del Programa Inventario 2005, orientado a la creación de una base de datos de libros o monografías, con una catalogación abreviada y el nuevo número de inventario, para que luego sea implementada para el resto del patrimonio documental.

Entre octubre de 2004 y enero de 2005 quedó concretada la planificación, la compra e instalación del equipamiento informático y la red, el acondicionamiento de un sector de 500 metros cuadrados del segundo subsuelo y la adquisición de escritorios, sillas y carros especiales para libros, proyectando el trabajo de 40 puestos simultáneos, en tres turnos diarios de cuatro horas cada uno. También se llevó a cabo la selección y adaptación del software, el diseño de la estructura de datos, la confección de manuales e instructivos, y la extracción y adaptación de los datos normalizados, como autores, editoriales, ciudades, entre otros, con el fin de unificar la tarea de los catalogadores y minimizar los errores.

Desde febrero de 2005 hasta agosto de 2006 trabajaron en tres turnos 110 pasantes universitarios y 25 bibliotecarios. El circuito de trabajo incluyó la limpieza de libros y estanterías, la colocación de libros en carros y su traslado hasta los puestos de trabajo, la asignación de número de inventario mediante etiqueta de código de barras, la catalogación abreviada de los libros y el señalamiento de los ítems que necesitaban restauración, la separación de materiales que correspondían a otros sectores como revistas o libros propuestos para ser incorporado al Tesoro y el traslado y reubicación de los libros en los estantes.

La Biblioteca Nacional, ahora en la gestión de Horacio González, se propone continuar con el inventario de partituras musicales, las revistas y otros materiales que conserva la institución. Por eso mi alegría y satisfacción: la Biblioteca Nacional está dando pasos importantes en el cumplimiento de su misión de registrar, preservar, y difundir la memoria impresa de la cultura del país, en cualquier soporte permanente de información.

—¿En qué consiste el trabajo que estás realizando en educ.ar?

educ.ar es un portal que, entre otras actividades, produce y reúne miles de objetos digitales para que puedan ser utilizados en el ámbito de la educación: recursos para el aprendizaje, libros y artículos digitales, enlaces comentados a otros sitios web, comentarios de libros, entre otros. En su breve e intensa existencia se produjeron modificaciones explícitas y no tanto en la manera de catalogar estos objetos, y clasificarlos para que puedan ser encontrados y accedidos a través de la Web. Esta situación produjo inconsistencias en la catalogación y la organización de los objetos digitales y, por lo tanto, en la posibilidad de administrarlos y reutilizarlos.

Por otra parte, educ.ar estableció un convenio con la Red Latinoamericana de Portales educativos –Relpe– mediante el que integrará un catálogo latinoamericano de recursos educativos digitales. Los compromisos con esta red de portales incluyen, entre otros, la adopción del estándar de catalogación Dublin Core y otros requerimientos. Además, educ.ar se encuentra en un proceso de cambios tecnológicos para mejorar y potenciar la gestión de contenidos.

Estas tres situaciones plantearon la necesidad de revisar las estructuras de metadatos, los instrumentos para clasificar los objetos digitales, establecer nuevos criterios y corregir la catalogación actual, así como realizar los ajustes necesarios para hacer compatible la catalogación de educ.ar con la de los portales latinoamericanos en Relpe.

Junto a un grupo de especialistas en contenidos y bibliotecarios de educ.ar estamos realizando esta tarea, para la que hemos analizado estándares internacionales de catalogación de objetos digitales y experiencias nacionales de adaptación de esas normas a las realidades educativas y tecnológicas de los países. Actualmente tenemos una primera versión de un nuevo esquema de metadatos y hemos logrado formular procesos automáticos para convertir la catalogación de recursos educativos al esquema de metadatos requerido por Relpe.


Fecha: Agosto de 2006

Otras notas relacionadas en educ.ar:

Bibliotecas digitales y virtuales de la Argentina (29/03/06)
Grandes bibliotecas digitales y virtuales del mundo (20/01/06)