Contenidos
Charla «Cómo construir una máquina info-temporal» de TEDxCaFoscariU en español.
Imaginen navegar un Facebook… de la Edad Media. Bueno, puede que no sea para tanto. En una charla divertida e interesante, el investigador e ingeniero Frederic Kaplan muestra la Máquina del Tiempo Veneciana, un proyecto que consiste en digitalizar 80 kilómetros de libros para crear una simulación histórica y geográfica de Venecia que abarque 1000 años. (Filmado en TEDxCaFoscariU.)
- Autor/a de la charla: Frederic Kaplan
- Fecha de grabación: 2013-06-19
- Fecha de publicación: 2014-01-09
- Duración de «Cómo construir una máquina info-temporal»: 620 segundos
Traducción de «Cómo construir una máquina info-temporal» en español.
Esta es una imagen del planeta Tierra.
Se parece mucho a las imágenes del Apolo, tan bien conocidas.
Hay algo diferente; se les puede hacer clic, y al hacerlo uno se acerca a casi cualquier sitio del planeta.
Por ejemplo, esta es una vista de pájaro del campus de la EPFL.
En muchos casos, también podemos tener la vista de un edificio desde una calle cercana.
Esto es bastante sorprendente.
Pero hay algo que falta en este recorrido maravilloso: el tiempo.
No estoy muy seguro de cuándo se tomó esta foto.
Ni siquiera estoy seguro de que fuera tomada en el mismo momento que la vista a vuelo de pájaro.
En mi laboratorio desarrollamos herramientas para viajar no solo en el espacio sino también en el tiempo.
El tipo de pregunta que estamos haciendo es: ¿Es posible construir algo como Google Maps del pasado? ¿Puedo añadir un control deslizante en la parte superior de Google Maps y cambiar el año, viendo como fue 100 años antes, 1000 años antes? ¿Es posible? ¿Puedo reconstruir las redes sociales del pasado? ¿Puedo hacer un Facebook de la Edad Media? ¿Puedo construir máquinas del tiempo? Tal vez solo podemos decir: «No, no es posible».
O, quizá, podemos pensar en ello desde el punto de vista informativo.
Esto es lo que yo llamo el hongo de información.
En el eje vertical está el tiempo.
En el horizontal, la cantidad de información digital disponible.
Obviamente, en los últimos 10 años, tenemos mucha información.
Y, obviamente, cuanto más vamos al pasado, menos información tenemos.
Si queremos construir un Google Maps del pasado, o un Facebook del pasado, tenemos que ampliar este espacio, tenemos que transformarlo en un rectángulo.
¿Cómo lo hacemos? Una forma es la digitalización.
Hay mucho material disponible: periódicos, libros impresos, miles de libros impresos.
Puedo digitalizar todo.
Puedo extraer información de allí.
Claro, cuanto más nos adentramos en el pasado, menos información habrá.
Puede no ser suficiente.
Entonces puedo hacer como los historiadores.
Puedo extrapolar.
Esto es lo que llamamos, en ciencias de la computación, simulación.
Si tomo un libro de registro, puedo considerar que no solo es el libro de registro de un capitán veneciano que hizo un viaje en particular.
Puedo considerar que es un libro de registro representativo de muchos viajes de la época.
Estoy extrapolando.
Si tengo la pintura de una fachada, puedo considerar que no solo es de ese edificio en particular, sino que quizá también comparte la misma gramática de los edificios en los que hemos perdido información.
Así que si queremos construir una máquina del tiempo, necesitamos 2 cosas.
Necesitamos archivos muy grandes y excelentes especialistas.
La Máquina del Tiempo Veneciana, el proyecto del que les hablaré, es un proyecto conjunto entre la EPFL y la Universidad de Venecia Ca’Foscari.
Hay algo muy peculiar en Venecia, y es que su administración ha sido muy, muy burocrática.
Ellos han hecho seguimiento de todo, casi como Google hoy.
En el Archivio di Stato, hay 80 kilómetros de archivos que documentan cada aspecto de la vida de Venecia durante más de 1000 años.
Están todos los botes que zarparon, todos los botes que arribaron.
Están todo los cambios realizados en la ciudad.
Todo eso está allí.
Estamos estableciendo un programa de digitalización a 10 años con el objetivo de transformar este archivo inmenso en un gigante sistema de información.
El objetivo es digitalizar 450 libros al día.
Por supuesto, digitalizar no es suficiente porque la mayor parte de estos documentos está en latín, en toscano, en dialecto veneciano, así que hay que transcribirlos, traducirlos en algunos casos, para indexarlos, y esto obviamente no es fácil.
En particular, el método óptico tradicional de reconocimiento de caracteres que puede usarse para manuscritos impresos, no funciona bien en documentos escritos a mano.
La solución es inspirarse en otro dominio: el reconocimiento de voz.
Este es un dominio de algo que parece imposible, que puede hacerse, poniendo restricciones adicionales.
Si uno tiene un muy buen modelo de un lenguaje empleado, si uno tiene un muy buen modelo de un documento, si están bien estructurados —estos son documentos administrativos, están muy bien estructurados en muchos casos— si uno divide este archivo enorme en subconjuntos más pequeños que compartan características similares, entonces hay una posibilidad de éxito.
Si llegamos a esa etapa, entonces hay algo más: podemos extraer eventos de este documento.
Quizá puedan obtenerse 10 000 millones de eventos de este archivo.
Y este gigante sistema de información puede buscarse de muchas formas.
Uno puede preguntar cosas como: «¿Quién vivió en este palacio en 1323?» «¿Cuánto costaba un besugo en el mercado de Realto en 1434?» «¿Cuál era el salario de un fabricante de vidrio en Murano en una década?" Uno puede hacer incluso preguntas más grandes porque estará codificado semánticamente.
Y luego se lo puede poner en el espacio porque mucha de esta información es espacial.
Y a partir de esto se pueden hacer cosas como reconstruir este viaje extraordinario de esa ciudad que logró tener un desarrollo sustentable durante más de 1000 años, logrando tener todo el tiempo una forma de equilibrio con su medio ambiente.
Uno puede reconstruir ese viaje, y visualizarlo de muchas maneras diferentes.
Pero, claro, no se puede comprender Venecia si solo se mira la ciudad.
Hay que ponerla en un contexto europeo más grande.
Por eso la idea es documentar también las cosas a nivel europeo.
Podemos reconstruir también el viaje del imperio marítimo veneciano.
Cómo fue que controló de manera progresiva el Mar Adriático, cómo se transformó en el imperio medieval más poderoso de su tiempo, controlando la mayor parte de las rutas marítimas desde el este hacia el sur.
Pero también se pueden hacer otras cosas, porque en estas rutas marítimas hay patrones regulares.
Podemos ir un paso más allá y crear un sistema de simulación, crear un simulador mediterráneo capaz de reconstruir incluso la información perdida que nos permitiría hacer preguntas como si tuviésemos un planificador de rutas.
«Si estoy en Corfú en junio de 1323 y quiero ir a Constantinopla, ¿dónde puedo tomar un bote?» Probablemente podemos responder esta pregunta con 1, 2 o 3 días de precisión.
«¿Cuánto costará?» «¿Cuáles son las probabilidades de encontrarse con piratas?» Por supuesto, como comprenderán, el reto científico central de un proyecto como este es calificar, cuantificar y representar la incertidumbre y la inconsistencia en cada paso del proceso.
Hay errores en todas partes; errores en el documento, error en el nombre del capitán, algunos de los barcos nunca zarparon.
Hay errores de traducción, sesgos interpretativos, y encima de eso, si sumamos procesos algorítmicos, tendremos errores de reconocimiento, errores en la extracción, por eso tenemos datos muy, muy inciertos.
Entonces, ¿cómo podemos detectar y corregir estas inconsistencias? ¿Cómo podemos representar esa incertidumbre? Es difícil.
Algo que podemos hacer es documentar cada paso del proceso, no solo codificar la información histórica sino también lo que llamamos la información meta-histórica, cómo se construye el conocimiento histórico, documentar cada paso.
Eso no garantizará la convergencia hacia una única historia de Venecia, pero probablemente podamos reconstruir una historia potencial de Venecia totalmente documentada.
Tal vez no haya un solo mapa.
Quizá haya varios mapas.
El sistema debe permitir eso, porque tenemos que enfrentar una nueva forma de incertidumbre, algo nuevo para este tipo de gigantescas bases de datos.
Y ¿cómo deberíamos comunicar esta nueva investigación a un público más amplio? Una vez más, Venecia es extraordinaria para eso.
Con los millones de visitantes que recibe cada año es uno de los mejores lugares para tratar de inventar el museo del futuro.
Imaginen que en el eje horizontal ven el mapa reconstruido de un año dado, y en el vertical, ven el documento usado para la reconstrucción, pinturas, por ejemplo.
Imaginen un sistema inmersivo que permita meterse, bucear y reconstruir la Venecia de un año dado, una experiencia que podría compartirse en grupo.
O al contrario, imaginen que parten de un documento, un manuscrito veneciano, y muestran lo que se puede construir a partir de eso, cómo se decodifica, cómo puede recrearse el contexto de ese documento.
Esta es la imagen de una muestra que actualmente se lleva a cabo en Ginebra con ese tipo de sistema.
Para concluir, podemos decir que la investigación en humanidades está a punto de experimentar una evolución quizá similar a lo ocurrido con las ciencias de la vida hace 30 años.
Es realmente una cuestión de escala.
Vemos proyectos que exceden lo que puede hacer un simple equipo de investigación y esto es realmente nuevo para las humanidades, que muy a menudo tienen el hábito de trabajar en pequeños grupos o solo con un par de investigadores.
Cuando uno visita el Archivio di Stato siente que excede el trabajo de un solo equipo, y que debe ser un esfuerzo conjunto y mancomunado.
Este cambio de paradigma requiere fomentar una nueva generación de «humanistas digitales» que estén preparados para el cambio.
Muchas gracias.
(Aplausos)
https://www.ted.com/talks/frederic_kaplan_how_to_build_an_information_time_machine/