Contenidos
Charla «Vídeos falsos de personas verdaderas, y cómo detectarlos» de TED2018 en español.
¿Crees que eres bueno para detectar vídeos falsos, donde personas famosas dicen cosas que nunca dijeron en la vida real? Veamos cómo se hacen esos vídeos en esta sorprendente charla con demo. El experto en informática Supasorn Suwajanakorn nos muestra cómo, siendo estudiante de posgrado, aplicó la inteligencia artificial y el modelado en 3D para crear vídeos falsos que aparentan ser reales, donde la persona está sincronizada con audio. También nos habla de las implicancias éticas y las posibilidades creativas de esta tecnología, así como de las medidas que se están tomando para combatir su uso indebido.
- Autor/a de la charla: Supasorn Suwajanakorn
- Fecha de grabación: 2018-04-10
- Fecha de publicación: 2018-07-25
- Duración de «Vídeos falsos de personas verdaderas, y cómo detectarlos»: 435 segundos
Traducción de «Vídeos falsos de personas verdaderas, y cómo detectarlos» en español.
Observen estas imágenes y díganme cuál de estos es el Obama verdadero.
(Vídeo) Barack Obama: Ayudar a las familias a refinanciar sus casas, invertir en producción de alta tecnología, en energía no contaminante y en infraestructura que genera puestos de trabajo.
Supasorn Suwajanakorn:
¿Alguien lo sabe?
La respuesta es ninguno.
(Risas)
Ninguno es el verdadero.
Les diré cómo llegamos a este punto.
Para este trabajo, me inspiré en un proyecto destinado a preservar nuestra última oportunidad de saber del Holocausto a través de sus sobrevivientes.
Se llama «Nuevas dimensiones en testimonio», y permite mantener una conversación interactiva con el holograma de un verdadero sobreviviente del Holocausto.
(Vídeo) Hombre:
¿Cómo sobrevivió al Holocausto?
(Vídeo) Holograma:
¿Cómo sobreviví?
Sobreviví posiblemente porque la Providencia velaba por mí.
SS: Estas respuestas fueron previamente grabadas en un estudio.
Sin embargo, el efecto es impresionante.
Sentimos una conexión estrecha con su historia y con él como persona.
Pienso que la interacción humana tiene algo especial.
Es mucho más profunda y personal que lo transmitido a través de libros, clases o películas.
Cuando vi esto empecé a preguntarme:
¿es posible crear un modelo como este con cualquier persona, un modelo que se vea, hable y actúe como la persona real?
Así que decidí intentarlo, y finalmente se me ocurrió una solución para construir el modelo de una persona utilizando solo esto que vemos aquí: fotos y vídeos de esa persona.
El hecho de poder usar información que ya existe, como fotos y vídeos que encontramos por allí, es la clave para poder modelar cualquier persona.
Por cierto, este es Richard Feynman, quien, además de haber ganado el Premio Nobel de física, también fue un legendario profesor.
¿No sería maravilloso poder rescatarlo para que diera sus clases e inspirara a millones de jóvenes, no solo en inglés, sino en otros idiomas?
O poder pedir consejos a nuestros abuelos y oír esas palabras reconfortantes aunque ya no estén con nosotros.
O quizá con esta herramienta los escritores, vivos o no, podrían leer sus libros en voz alta a quienes estén interesados.
Las posibilidades creativas son infinitas y, en mi opinión, esto es sumamente interesante.
Les mostraré cómo funciona por ahora.
Primero, usamos una nueva técnica para reconstruir un rostro en 3D con un alto nivel de detalle a partir de cualquier imagen, sin haber hecho nunca un escaneo en 3D de la persona.
Este es el mismo modelo obtenido, visto desde distintos ángulos.
Se puede hacer lo mismo con vídeos, ejecutando el mismo algoritmo en cada cuadro del vídeo y generando un modelo móvil en 3D.
Aquí vemos el mismo modelo obtenido, desde distintos ángulos.
Esta técnica presenta numerosos desafíos, pero el truco consiste en analizar de antemano una gran colección de fotos de la persona.
Si la persona es George W.
Bush, basta con buscar en Google.
De allí se puede construir un modelo de base, perfeccionado iterativamente para recuperar la expresión en sus detalles finos, como las arrugas y líneas de expresión.
Lo fascinante es que la colección de fotos puede hacerse a partir de fotos comunes de la persona, cualquiera sea la expresión de su rostro o el lugar donde se tomó la foto.
Lo que importa es que haya gran cantidad.
Pero todavía nos falta el color, así que a desarrollamos una nueva técnica de mezcla que funciona mejor que un simple promedio y produce texturas y colores faciales definidos.
Y esto se puede aplicar a cualquier expresión.
Ahora podemos controlar el modelo de una persona, a través de una secuencia de fotos estáticas.
Observen cómo aparecen y desaparecen las líneas del rostro según la expresión.
También se puede usar un vídeo para manejar el modelo.
(Vídeo) Daniel Craig: Sí, pero de alguna manera, logramos atraer más gente increíble.
SS: Y aquí tenemos otra demo entretenida.
Estos son modelos controlables de personas que construí a partir de fotos disponibles en la web.
Trasladando el movimiento del vídeo original, podemos manejar todos los modelos juntos.
George W.
Bush: No es una ley fácil de aprobar porque es un tema muy complejo y los procesos legislativos a veces son difíciles.
(Aplausos)
SS: Retomando lo anterior, nuestro objetivo principal es captar los gestos típicos o el modo particular de hablar y sonreír de cada persona.
Para lograrlo,
¿es posible enseñarle a la computadora a imitar cómo habla una persona con solo mostrarle vídeos de ella?
Lo que yo hice exactamente fue mostrarle a la computadora 14 horas de vídeos con discursos de Barack Obama.
Y esto es lo se puede obtener tan solo con el audio.
(Vídeo) BO: Los resultados son claros.
Las empresas en EE.
UU.
han creado 14,5 millones de puestos de trabajo en un período de 75 meses.
SS: En este caso sintetizamos solo la parte de la boca.
Les mostraré cómo lo hacemos.
Nuestro sistema de datos usa una red neuronal para convertir audio e ingresarlo en estos puntos de la boca.
(Vídeo) BO: Lo conseguimos mediante nuestro trabajo, Medicare o Medicaid.
SS: Luego sintetizamos la textura, mejoramos los detalles y los dientes, y lo incorporamos a la cabeza y al fondo del vídeo original.
(Vídeo) BO: La mujer tiene derecho al chequeo gratuito.
No se le puede cobrar más solo por ser mujer.
Los jóvenes tienen la cobertura del plan de sus padres hasta los 26.
SS: Creo que estos resultados son muy realistas y fascinantes, pero al mismo tiempo son aterradores, incluso para mí.
Nuestra idea fue crear el modelo exacto de una persona, no tergiversarla.
Pero hay algo que me preocupa, y es su potencial de ser usado indebidamente.
Este problema es motivo de preocupación hace tiempo, desde que Photoshop entró al mercado por primera vez.
Como investigador, también trabajo en tecnología de prevención, y formo parte de «AI Foundation», donde combinamos el aprendizaje automático con el control humano para detectar imágenes y vídeos falsos, combatiendo mi propio trabajo.
Una de las herramientas que queremos lanzar se llama «Reality Defender», un complemento para el navegador que detecta contenido potencialmente falso automáticamente en el buscador.
(Aplausos)
Pero, aun así, los vídeos falsos pueden causar un gran daño, incluso antes de ser chequeados.
Por eso es fundamental que la gente esté al tanto de este tipo de cosas y pueda sacar las conclusiones correctas y juzgar lo que ve.
Todavía falta mucho para llegar a modelar completamente una persona en particular y garantizar la seguridad de esta tecnología.
Pero estoy entusiasmado y lleno de esperanza, porque si esta herramienta se usa con buen juicio puede permitir amplificar enormemente el impacto positivo de cualquier persona en el mundo y ayudarnos a forjar el futuro que queremos.
Gracias.
(Aplausos)
https://www.ted.com/talks/supasorn_suwajanakorn_fake_videos_of_real_people_and_how_to_spot_them/