Contenidos
Charla «Cómo podemos almacenar datos digitales en el ADN» de TEDxVienna en español.
Desde los disquetes a las memorias USB, todo método de almacenamiento de datos se vuelve obsoleto eventualmente. ¿Y si pudiéramos encontrar una forma de almacenar todos los datos del mundo para siempre? La bioinformática Dina Zielinski nos muestra la ciencia detrás de una solución que ha existido durante algunos miles de millones de años: el ADN.
- Autor/a de la charla: Dina Zielinski
- Fecha de grabación: 2017-10-21
- Fecha de publicación: 2019-03-06
- Duración de «Cómo podemos almacenar datos digitales en el ADN»: 774 segundos
Traducción de «Cómo podemos almacenar datos digitales en el ADN» en español.
Pude colocar todas las películas que existen dentro de este tubo.
Si no pueden verlas, esa es la idea.
Antes de comprender cómo es esto posible, es importante entender el valor de esta hazaña.
Todos nuestros pensamientos y acciones actuales en fotos, videos, incluso nuestras actividades físicas son almacenadas como datos digitales.
Salvo cuando nos quedamos sin espacio en nuestros teléfonos, casi no pensamos en nuestra huella digital.
Pero la humanidad ha generado de forma colectiva más datos en los últimos años que en toda la historia humana precedente.
Los macrodatos se han convertido en un gran problema.
El almacenamiento digital es muy caro, y ninguno de los dispositivos creados ha superado aún la prueba del tiempo.
Hay una página web sin fines de lucro llamada «Internet Archive».
Además de acceder a libros y películas gratuitas, pueden también ver páginas web de hasta 1996.
Esto es muy tentador, pero decidí buscar los humildes comienzos del sitio web de TED.
Como pueden ver, ha cambiado un poco en los últimos 30 años.
Esto me llevó a la primera charla TED, en 1984, una charla de un ejecutivo de Sony que explicaba cómo funciona un disco compacto.
(Risas) Es realmente increíble poder retroceder en el tiempo y acceder a este momento.
También es fascinante que después de 30 años, después del primer video TED, aún hablemos sobre almacenamiento digital.
Retrocedamos otros 30 años, a cuando IBM lanzó su primer disco duro en 1956.
Aquí ven cómo lo cargan a un barco y hay una pequeña audiencia observando.
Contenía el equivalente a una canción MP3 y pesaba más de una tonelada.
A USD 10 000 el megabyte, no creo que a nadie aquí le interese comprar esta cosa, excepto como un objeto de colección.
Pero era lo mejor que podíamos hacer en esa época.
Hemos avanzado tanto en el almacenamiento de datos.
Los dispositivos han evolucionado dramáticamente.
Pero todos ellos eventualmente se agotan o se vuelven obsoletos.
Si alguien les entregara hoy un disquete para respaldar su presentación, probablemente lo mirarían de forma extraña, quizá se reirían, pero no tendrían la menor idea de cómo usarlo.
Estos dispositivos ya no satisfacen nuestras necesidades de almacenamiento, aunque algunos de ellos pueden usarse de otras formas.
Toda tecnología a la larga muere o se pierde, junto con nuestros datos, todos nuestros recuerdos.
Es una ilusión pensar que el problema de almacenamiento está resuelto, en realidad simplemente lo externalizamos.
No nos preocupamos de almacenar nuestros correos y nuestras fotos.
Simplemente los dejamos en la nube.
Pero detrás de escena, el almacenamiento es problemático.
Después de todo, la nube es solo un montón de discos duros.
La mayor parte de los datos digitales, podría discutirse, no son esenciales.
Sin duda podríamos simplemente borrarlos.
Pero
¿cómo saber qué es realmente importante hoy en día?
Hemos aprendido mucho sobre la historia de la humanidad de dibujos y escrituras en cuevas; de tablas de piedra.
Hemos descifrado lenguajes de la piedra de Rosetta.
Sin embargo, nunca tendremos la historia completa.
Nuestros datos son nuestra historia, especialmente hoy.
No tendremos nuestro registro grabado en tablas de piedra.
Pero no tenemos que elegir lo que es importante ahora.
Hay una forma de almacenarlo todo.
Resulta que hay una solución que ha existido durante miles de millones de años, y ahora está en este tubo.
El ADN es el dispositivo de almacenamiento más antiguo de la naturaleza.
Después de todo, contiene toda la información necesaria para construir y mantener a un ser humano.
Pero
¿qué hace que el ADN sea tan genial?
Pues bien, tomemos como ejemplo nuestro propio genoma.
Si tuviéramos que imprimir los tres mil millones de A, T y G en una fuente estándar, en un formato estándar, y luego apiláramos todos esos papeles, la pila tendría unos 130 metros de altura, una altura entre la Estatua de la Libertad y el Monumento a Washington.
Si convertimos todas esas A, T y G a datos digitales, a ceros y unos, el espacio sería menor.
Y eso es en cada célula de nuestro cuerpo.
Tenemos más de 30 billones de células.
Entienden la idea: el ADN puede almacenar una tonelada de información en un espacio minúsculo.
El ADN también es muy duradero, y ni siquiera requiere electricidad para su almacenamiento.
Sabemos esto porque los científicos han recuperado ADN de humanos ancestrales que vivieron hace cientos de miles de años.
Uno de ellos fue Ötzi, el Hombre de Hielo.
Resulta que es austríaco.
(Risas) Se lo encontró en lo alto de las montañas entre Italia y Austria, bien preservado.
Y resulta que tiene parientes genéticos vivos en Austria hoy en día.
Uno de Uds.
puede ser primo de Ötzi.
(Risas) Lo importante es que tenemos más oportunidades de recuperar información de un humano ancestral que de un teléfono antiguo.
También es mucho menos probable que perdamos la habilidad de leer ADN, que la de leer los dispositivos inventados por el hombre.
Cada formato nuevo de almacenamiento requiere una nueva forma de lectura.
Siempre seremos capaces de leer el ADN.
Si ya no podemos secuenciarlo, tendremos mayores problemas que el almacenamiento de datos.
Almacenar datos en el ADN no es algo nuevo.
La naturaleza lo ha hecho durante miles de millones de años.
De hecho, cada ser vivo es un dispositivo de almacenamiento de ADN.
Pero
¿cómo almacenamos datos en el ADN?
Esta es la fotografía 51.
Es la primera foto que se tomó del ADN, hace cerca de 60 años.
Se trata más o menos de la misma época en que IBM lanzó aquel disco duro.
Nuestra comprensión del almacenamiento digital y del ADN han coevolucionado.
Primero aprendimos a secuenciar o leer el ADN y, muy poco después, cómo escribirlo o sintetizarlo.
Es muy parecido a cómo aprendemos un nuevo idioma.
Y ahora tenemos la habilidad de leer, escribir y copiar el ADN; lo hacemos en el laboratorio todo el tiempo.
Absolutamente cualquier cosa que pueda almacenarse como ceros y unos puede ser almacenada en el ADN.
Para almacenar algo digitalmente, como esta fotografía, la convertimos en bits, o dígitos binarios.
Cada píxel en una foto en blanco y negro es solo un cero o un uno.
Y podemos escribir ADN como una impresora puede imprimir letras en una página.
Solo tenemos que convertir nuestros datos, todos esos ceros y unos, en A, T, C y G, y luego lo enviamos a una empresa que lo sintetice.
Los escribimos, podemos almacenarlos, y cuando queremos recuperar nuestros datos solo los secuenciamos.
Lo divertido de todo esto es decidir qué archivos incluir.
Somos científicos serios, así que incluimos un manuscrito decente para la posteridad.
También incluimos una tarjeta de regalo de Amazon de 50 dólares.
No se emocionen, ya se gastó, alguien la decodificó.
Agregamos además un sistema operativo, una de las primeras películas inventadas y una placa de la Pioneer.
Algunos de Uds.
quizá la conozcan, es una representación de un hombre y una mujer aparentemente típicos, y nuestra ubicación aproximada en el sistema solar, en caso de que la nave espacial Pioneer se encuentre con extraterrestres.
Una vez que decidimos qué tipo de archivos queremos codificar, empaquetamos los datos, convertimos estos ceros y unos en A, T, C y G y luego enviamos este archivo a una empresa para que lo sintetizara.
Y esto es lo que obtuvimos.
Nuestros archivos estaban en este tubo.
Todo lo que teníamos que hacer era secuenciarlo.
Esto suena bastante sencillo, pero la diferencia entre una idea verdaderamente genial y divertida y algo que en realidad podamos usar es superar estos desafíos prácticos.
Aunque el ADN es más robusto que cualquier dispositivo hecho por el hombre, no es perfecto.
Tiene algunas debilidades.
Recuperamos nuestro mensaje secuenciando el ADN, y cada vez que los datos se recuperan, perdemos el ADN.
Es parte del proceso de secuenciación.
No queremos quedarnos sin datos, pero por suerte existe una forma de copiar el ADN que es incluso más barata y sencilla que sintetizarlo.
Probamos una forma de hacer 200 billones de copias de nuestros archivos, y recuperamos todos nuestros datos sin ningún error.
La secuenciación también introduce errores en nuestro ADN, dentro de las A, las T, las C y las G.
La naturaleza resuelve esto en nuestras células.
Pero nuestros datos son almacenados en ADN sintético dentro de un tubo, por lo que tuvimos que encontrar nuestra forma de solucionar este problema.
Decidimos usar un algoritmo que se usa para reproducir videos.
Al reproducir un video, esencialmente lo que se hace es recuperar el video original, el archivo original.
Cuando tratamos de recuperar nuestros archivos originales, simplemente secuenciamos.
Pero en realidad ambos procesos se basan en recuperar suficientes ceros y unos para volver a juntar nuestros datos.
Debido a nuestra estrategia de codificación pudimos empaquetar todos nuestros datos de forma tal que nos permitiera hacer millones y billones de copias y aun así recuperar siempre todos nuestros archivos.
Esta es la película que codificamos.
Es de las primeras películas filmadas, y ahora la primera en ser copiada más de 200 billones de veces en ADN.
Poco después de la publicación de nuestro trabajo, participamos en un «Ask me Anything» en la página web de reddit.
Si son colegas nerd, estarán muy familiarizados con esta página.
La mayoría de preguntas fueron sesudas.
Algunas fueron cómicas.
Por ejemplo, un usuario quería saber cuándo tendría un dispositivo en su pulgar Ahora bien, la cuestión es nuestro ADN ya almacena todo lo necesario para hacernos quienes somos.
Es mucho más seguro almacenar datos en ADN, en ADN sintético en un tubo.
Escribir y leer datos del ADN obviamente requiere mucho más tiempo que simplemente guardar todos los archivos en un disco duro.
Por ahora.
Inicialmente, debemos centrarnos en el almacenamiento a largo plazo.
La mayoría de los datos son efímeros.
Es más difícil entender qué es importante hoy en día, o qué será importante para las futuras generaciones.
Pero el punto es que no tenemos que decidirlo ahora.
Hay un programa fantástico de la UNESCO llamado «Memoria del Mundo».
Se creó para preservar materiales históricos que se consideran valiosos para toda la humanidad.
Los objetos son nominados para sumarse a la colección, como esa película que codificamos.
Aunque es una maravillosa forma de preservar el patrimonio humano, no tiene que ser una opción.
En lugar de preguntar a la generación actual, a nosotros, qué podría ser importante en el futuro, podríamos almacenar todo en el ADN.
El almacenamiento no se basa solo en la cantidad de bytes, sino en cuán bien podemos almacenar los datos y recuperarlos.
Siempre ha habido esta tensión entre cuántos datos podemos generar y cuántos podemos recuperar, y cuántos podemos almacenar.
Cada avance en la escritura de datos requiere una nueva forma de leerlos.
Ya no podemos leer los medios antiguos.
¿Cuántos de Uds.
tienen una lectora de discos en su portátil?
Ni hablar de una lectora de disquetes.
Esto nunca sucederá con la lectura del ADN.
Mientras estemos aquí, el ADN está aquí, y encontraremos formas de secuenciarlo.
Archivar el mundo que nos rodea es parte de la naturaleza humana.
Este es el progreso que logramos en el almacenamiento digital en 60 años, en un momento en que apenas empezamos a entender el ADN.
Logramos un progreso similar en la mitad de tiempo con los secuenciadores de ADN, y mientras existamos nuestro ADN nunca estará obsoleto.
Gracias (Aplausos)
https://www.ted.com/talks/dina_zielinski_how_we_can_store_digital_data_in_dna/