La digitalización de la biblioteca del Vaticano
¿Vieron que hay personas a las que uno lee simplemente por conocer su nombre y porque previamente a leido cosas interesantes de ellos? Bueno, eso me pasa con Ariel Torres que es columnista de tecnología desde hace muchos años en La Nación.
Cuando vi una nota de él titulada "Luciano Ammenti, un ingeniero entre incunables" no me llamó la atención, pero por ser de él la leí , y me llevé una sorpresa.
Ammenti es el director de tecnología de la información de la Biblioteca del Vaticano, y desde hace seis años está al frente del proceso que digitalizará y pondrá en Internet 82.000 manuscritos (algunos de más de 2000 años) y unos 8000 incunables (es decir, aquellas obras publicadas antes de 1501).
Además tienen un millón de libros impresos y de esos unos 8000 son anteriores a 1501.
El trabajo implica almacenar en forma digital 40 millones de páginas que esperan ocupen 2,8 petabytes, o sea 2.926.000 gigabytes, (
1 petabyte equivale a 1.049.000 gigabytes),
La rareza y fragilidad de esos manuscritos con cientos de años encima implican una tarea muy sensible para protegerlos y a su vez poder convertirlos en imágenes.
Un dato muy llamativo es que
en la Biblioteca tienen 82.000 manuscritos, pero sólo han catalogado 25.000, en la mayoría no saben lo que hay.
Otro dato muy extraño, los pergaminos se usaban más de una vez, se podía escribir algo encima de una cosa previa.
El sólo hecho de llevar los manuscritos desde el búnker donde se los almacena hasta la sala de lectura expondría esas páginas a virus, bacterias y cambios de temperatura. En muchos casos esas páginas son extremadamente antiguas, están hechas de pergamino. Para que se de una idea de lo que estamos hablando, el pergamino era tan costoso que con mucha frecuencia lo pintaban y volvían a escribir encima, un poco como se hacía también con la pintura. Con el proyecto de digitalización descubrimos que muchos manuscritos habían sido escritos varias veces.
-¿Pueden leer por debajo de cada capa?
-Así es, tenemos un procedimiento para eso. Por medio de scanners de alta resolución y luz ultravioleta podemos ir 24 bits por debajo de la superficie visible, eliminarla y ver lo que hay debajo, y luego de nuevo a una profundidad de otros 8 bits, y así tres veces.
....
¿cuánto tiempo les va a llevar digitalizar todo eso?
-No es tanto una cuestión de tiempo, sino de respetar el flujo de datos. Primero, el manuscrito pasa por la oficina de restauración, donde se evalúa su vitalidad y el tipo de scanner que puede usarse con esa obra. Algunos manuscritos sólo pueden abrirse unos pocos grados y hay que usar dispositivos especiales, como prismas. Una vez que se toma esta decisión al operador le va a llevar 2 minutos o dos minutos y medio escanear cada página.
Miren lo que se comenta respecto del formato de imagen:
-¿PNG?
-Sí, podría ser una solución. Es de código fuente abierto. Nosotros elegimos FITS [siglas de Flexible Image Transport System]. Proviene de la comunidad astronómica y astrofísica, es código fuente abierto, existe desde hace 52 años, su primera versión estándar salió en 1979 y se actualiza cada seis meses por una comunidad cuyos miembros están en muchos lugares del mundo (incluida la Argentina). Decidimos usar este formato porque el abordaje de la astronomía es muy parecido al nuestro.
Si uno va
al sitio web del Vaticano para esta iniciativa ve que emplean unas cámaras de marca
Hasselblad, de 50 megapíxeles.
La página web de inicio para este trabajo es
http://digi.vatlib.it/
Más que ver la imágenes de textos en lenguajes extraños, lo que me interesó es el aspecto tecnológico de la digitalización.
La nota entera pueden leerla
por acá.