Búsquedas bibliográficas hasta fines de los 80

Desde el principio de los 90 el uso de las TIC viene modificando nuestra manera de acceder a la información. Antes de este período, la búsqueda de antecedentes en publicaciones científicas especializadas resultaba tediosa y muchas veces infructuosa.

Si un físico necesitaba iniciarse en un tema novedoso para él y conocer los últimos adelantos en la materia, como por ejemplo con respecto a la conductividad térmica de determinados plásticos afectados por radiación, tenía que consultar los «physics abstracts» (resúmenes de física). Estos libros traían un índice de temas donde reportaban las diversas publicaciones que se habían realizado durante un semestre determinado, sobre ese tema específico. Si se elegía el poliestireno como ejemplo de plástico, debían recorrerse con la vista varias páginas escritas con la densidad de una guía telefónica dedicadas a temas de estudio sobre el citado plástico. Así, si se tenía la suerte de ubicar las palabras conductividad térmica, se contaba con una lista de números que indicaban la página y el tomo donde se podría hallar el título, el resumen de la publicación y la cita completa para ubicar el texto original. No había forma de abarcar períodos mayores a los seis meses, salvo ir sumando las consultas de los índices de distintos semestres, y ni qué hablar de hacer una búsqueda que combinara varios términos como «conductividad térmica», «poliestireno» e «irradiado», que especificarían con mayor precisión lo que se buscaba.

Otra manera de acceder a la información estaba relacionada con la distribución de «preprints», es decir, de los trabajos enviados para publicación que estaban siendo sometidos a revisión en las revistas especializadas. El Stanford Linear Accelerator Center (SLAC) es uno de los centros más importantes para la física de altas energías y partículas elementales.

Desde la década del 60, su biblioteca comenzó a implementar una serie de acciones que resultaron de muchísima importancia. En 1962, comenzaron a catalogar los preprints de trabajos de física de altas energías de todo el mundo. A partir de ese momento, poco a poco fue instalándose la costumbre de enviar los trabajos a dicha biblioteca, al mismo tiempo que el trabajo se enviaba a publicar a una revista especializada (por supuesto todos los envíos se realizaban por correo ordinario). A partir de 1969, cientos de físicos de partículas en todo el mundo se suscribieron a la biblioteca, para recibir semanalmente un listado de los preprints que llegaban a la biblioteca. Si el título del trabajo resultaba de interés, se solicitaba al autor el envío de una copia. Desde el momento en que un autor en Europa o Estados Unidos terminaba un trabajo hasta que llegaba la copia a la Argentina, transcurrían al menos tres meses (por los tiempos de correo). Ese tiempo era mucho menor que el que demandaba la llegada del artículo ya publicado en la revista especializada, y en muchos casos ninguna biblioteca del país estaba suscripta a determinada revista.

A mediados de la década del ochenta, la base de datos de SLAC estaba computarizada, y era posible consultarla enviando un correo electrónico.

Las TIC cambiaron esta situación por completo, facilitando enormemente nuestro acceso a la información especifica, combinando búsquedas, abarcando períodos de hasta varias decenas de años, destacando las publicaciones más relevantes y generadoras de nuevas ideas y brindando fácilmente el acceso al texto original.

Bases de publicaciones y revistas electrónicas

El desarrollo de internet permitió tener millones de computadoras interconectadas y con un protocolo óptimo para la transmisión de paquetes de información. De esta manera, y gracias a los programas de correo electrónico, era posible distribuir información fácilmente a un gran número de personas repartidas en lugares geográficos diversos. Áreas de investigación en física tan activas como la ligada a la superconductividad de alta temperatura crítica, que hacía furor a principios de los años 90, pudieron beneficiarse con el uso de estas herramientas. Esta área convocaba a más de 10.000 investigadores en todo el mundo que producían entre 300 a 400 publicaciones por mes.

¿Cómo estar al tanto de los últimos avances?¿Cómo evitar duplicar trabajos que acababan de concluirse?
Se armó entonces un «club», el «high Tc update» (HTCU) para mantenerse actualizado: los investigadores mandaban una copia de sus trabajos (en general antes de ser publicados) a un comité editorial que armaba un pequeño folleto que se distribuía quincenalmente por e-mail a todos los interesados y que contenía una breve información de todos los trabajos así como una nota editorial donde se destacaban los resultados más importantes. También se publicitaban futuros congresos, ofertas de trabajo en el área y los avances de la industria en materia de superconductores.

En la física de altas energías hubo un proceso similar. Un físico teórico del laboratorio de Los Alamos (USA), Paul Ginsparg, sugirió a los físicos que estaban trabajando en teoría de cuerdas que enviaran por correo electrónico sus trabajos a la dirección «hep-th@xxx.lanl.gov». Los resúmenes de los trabajos eran enviados diariamente por e-mail a todos los interesados, que podían solicitar el archivo completo de los mismos enviando un e-mail hep-th, que respondía automáticamente enviando el trabajo. El tiempo de espera entre que un autor terminaba un trabajo y otro científico quería leerlo se redujo a un día o dos, en cualquier parte del mundo donde se tuviese acceso al correo electrónico.

Como nota al margen, es interesante mencionar que este proceso fue posible entre otras cosas gracias a que, en 1979, Donald Knuth desarrolló un programa denominado TeX, que permitía escribir fórmulas matemáticas utilizando caracteres ASCII. Por primera vez era posible escribir esas fórmulas con una calidad excelente. En este lenguaje, la ecuación de Schroedinger se escribe $i\hbar\frac{\partial \Psi}{\partial t}= H\Psi$ y luego de procesar el texto se ve así:

Ecuación de Schroedinger

La versión actual de ese programa, denominada LaTeX, es ampliamente utilizada para escribir trabajos científicos.

La creación de la web en 1991, por parte de T. Berners-Lee y para responder a las necesidades de los físicos del CERN de compartir sus avances científicos, modificó definitivamente nuestra capacidad de acceder a la información. La web aprovechó la existencia de redes de computadoras y su capacidad de transmitir información para brindar al usuario el acceso a documentos, independientemente de la computadora donde residen y de las conexiones necesarias para llegar a ella.

Se crearon entonces las bases de datos públicas, como la que mencionamos anteriormente, el HTCU (high Tc update), en red desde 1992 hasta el 2003, con 74.000 publicaciones , o como la iniciada por Paul Ginsparg en Los Alamos en 1991 (http://xxx.lanl.gov), que sigue actualmente vigente con base en la Universidad de Cornell (http://arXiv.org) y duplicada en otros 18 sitios en distintas partes del mundo. Esta base de datos es la más utilizada actualmente entre los físicos y reúne los preprints de numerosas disciplinas ligadas a las ciencias duras (física, matemática, ciencias no lineales, ciencias computacionales y biología cuantitativa).

Estas bases de datos dejaron de basarse en el correo electrónico, y están disponibles online. Así, es posible ver los trabajos que fueron enviados el día anterior, hacer búsquedas por autor y por palabra en el título o resumen del trabajo. Es posible además obtener en pocos segundos el archivo del trabajo completo que a uno le interese, en formato postcript o pdf.

El proceso de envío de un trabajo a la base de datos ha evolucionado también. Puede hacerse realizando un ftp (proceso de transferencia de archivo) desde la PC del autor directamente al servidor de la base de datos. Los investigadores envían una versión completa de su futura publicación en una revista especializada, donde agregan un resumen, detalles de extensión y a qué revista fue enviada para su publicación. Esta información junto con la publicación se incorporan entonces a la base de datos que los usuarios pueden consultar, realizando búsquedas temáticas, por autores, etc., y finalmente pueden descargar la publicación completa de su interés. Teniendo en cuenta que los procesos de referato y de edición de una revista especializada toman en general entre 3 y 12 meses, este sistema permite contar con trabajos con bastante anterioridad a su publicación, en forma totalmente gratuita, aunque con el inconveniente de que no se ejerce ningún control por parte de pares que asegure la calidad del material publicado en esta base de datos.

Evolución de las publicaciones

Evolución de las publicaciones de trabajos de investigación en física (particularmente en materia condensada) en la base de datos pública de ArXiv (duplicada en Los Alamos National Lab.).

La comunidad científica ha ido valorando la publicación preliminar de sus resultados en estas bases de datos, según puede verse de la evolución del número de publicaciones anuales desde su creación. De hecho suelen citarse trabajos publicados en estas bases que aún no han sido publicados en revistas oficiales, lo que representa para los científicos una forma de publicitar sus trabajos y poder reclamar la autoría sobre los mismos antes de que se complete el largo proceso de publicación en una revista especializada.

Las revistas oficiales donde se publican los trabajos científicos luego de un proceso de referato (realizado por pares a los que los editores consultan) no quedaron fuera de la revolución de la información que están produciendo las TIC. El caso de las revistas de la American Physical Society (APS) es un buen ejemplo de ello. En el año 2001 completaron la base de datos accesible a través de la web en http://journals.aps.org/archive/ que incluye todas las publicaciones realizadas desde 1893, sin incluir las de los últimos tres años que reservan a los que se encuentran suscriptos al servicio pago que brindan. De esta manera pueden realizarse búsquedas en línea sobre cualquiera de los artículos publicados (que representan 1.600.000 páginas), pudiéndose realizar búsquedas combinadas, por temas, por autores, evaluar la influencia de ciertas publicaciones por su impacto en la cantidad de citas posteriores, etc. Gratuitamente se accede a los resúmenes de las publicaciones, mientras que las suscripciones permiten bajar las publicaciones en su versión completa. Nunca fue tan sencillo contar con tanta información en tan poco tiempo.

Los autores de las publicaciones científicas también se vieron beneficiados por el desarrollo de las TIC. Los trabajos no se envían más por correo aéreo, reduciéndose así los tiempos de referato que imponían las comunicaciones de documentos en la época previa a internet. Las publicaciones se cargan en servidores accesibles por la web y los editores distribuyen las copias por e-mail a los pares encargados de juzgar los trabajos, que pueden encontrarse en cualquier punto geográfico con acceso a internet. Los autores también cuentan con una página de información en la que pueden monitorear la evolución de los trabajos que mandaron a publicar por las distintas etapas editoriales.

Finalmente, ya existen revistas científicas que se publican solo electrónicamente en la web, es decir, no se realiza la publicación en papel, como por ejemplo el New Journal of Physics.

Motores de búsqueda científicos

Scholar Google

Sumándose a las bases de publicaciones científicas y a las revistas especializadas tenemos los motores de búsqueda que se especializan en temas académicos. Este es el caso específico de Scholar Google (https://scholar.google.com.ar/), que permite realizar búsquedas orientadas a publicaciones científicas, tesis, libros, artículos y resúmenes de sociedades profesionales, universidades, editoriales científicas y de otras organizaciones académicas. Lo interesante de este motor gratuito es que establece un ranking donde intenta clasificar la relevancia del documento científico, determinado en función de una serie de parámetros que cuantifican su impacto en la comunidad, como la calidad de la revista donde se publicó, la cantidad de citas por parte de otras referencias académicas, otras publicaciones del autor, etc. De esta manera se destacan las publicaciones más importantes, pudiéndose así separar para un primer estudio los trabajos que realizaron aportes fundamentales de los que fueron contribuyendo con conocimientos adicionales.

Volviendo a un ejemplo mencionado anteriormente, si se realiza la búsqueda de las palabras «conductividad térmica», «poliestireno» e «irradiado» (traducidas al inglés), como resultado de la búsqueda en pocos segundos se obtienen 270 links a trabajos donde aparecen esas palabras.

El Scholar Google y otros buscadores también pueden utilizarse para tener una idea sobre la importancia que la comunidad científica le da a ciertos temas específicos de investigación.

El gráfico siguiente, realizado a partir de búsquedas muy sencillas con Scholar Google, muestra la evolución del número de trabajos en los que aparecen ciertas palabras claves, relacionadas con temas de investigación de mucha actualidad en física (materia oscura, energía oscura y computación cuántica).


Gráfico de búsquedas con Scholar Google

Web of Science

El «Web of Science» es otro motor de búsqueda que tiene el interés de recabar información de unas 8700 revistas especializadas de todo el mundo. A principios del 2005, este servicio sumó 850.000 artículos científicos (de 252 revistas) publicados en la primera mitad del siglo XX, De esta manera, este motor permite acceder en un sólo sitio a una amplia colección de revistas y al conjunto de sus publicaciones a lo largo de un periodo importante de tiempo. Se pueden entonces hacer búsquedas de la bibliografía completa, de las referencias citadas, de los trabajos que citan a unos en particular y brindan también el acceso al texto completo de la publicación. Este sitio es seguramente más completo ya que la búsqueda se realiza en los índices de prácticamente todas las revistas científicas relevantes. El mayor inconveniente es que no es gratuito. Por este motivo, en nuestro país muy pocas instituciones están suscriptas al Web of Science.

Nuevas formas de trabajar

Como ya mencionamos, las TIC cambiaron la manera en que los físicos buscamos bibliografía sobre determinado tema y nos enteramos de las producciones científicas de nuestros colegas. La consulta de revistas especializadas en bibliotecas ha disminuido notablemente en los últimos años.

El uso del correo electrónico, combinado con el programa LaTeX mencionado anteriormente, simplifica notablemente la colaboración de investigadores de distintos lugares geográficos. Así se pueden llevar adelante proyectos de investigación intercambiando resultados preliminares y borradores de trabajos por e-mail. Aunque no tan eficiente como la discusión personal, esta manera de trabajar es desde hace varios años absolutamente común entre los físicos.

Están empezando a utilizarse también las videoconferencias, tanto para discusiones de trabajo como para el dictado de charlas o seminarios. Esta modalidad no está aun muy difundida en nuestro país, aunque hay ya algunos antecedentes (por ejemplo se realizaron videoconferencias en la reunión de la Asociación Física Argentina del año 2004, y en la Secretaría de Ciencia y Tecnología con motivo del Año de la Física en el 2005). Seguramente en el futuro cercano podremos colaborar con nuestros colegas delante de la pantalla de la PC como si estuviesen en nuestra oficina.

Finalmente, las presentaciones en los congresos científicos también suelen estar disponibles en la web. Luego de concluido el evento, en muchos casos se suele poner a disposición de toda la comunidad los archivos que contienen las conferencias dictadas por los participantes. Es posible encontrar presentaciones en formato pdf o power point. En algunos casos está disponible también el audio y hasta la filmación completa de la conferencia. Ver por ejemplo las excelentes clases y conferencias para el público no especializado (en inglés), del renombrado físico Kip Thorne.