Se está volviendo extremadamente fácil (y no creo que solo sea bueno) alterar un video, y los últimos desarrollos en IA son realmente impresionantes.
Una colaboración entre gigantes (la Universidad de Stanford y Princeton más el Instituto Max Planck de Informática y Adobe) hace posible alterar el discurso en un video simplemente modificando la transcripción textual y sin crear el efecto de "doblaje".
En otras palabras, la persona que está hablando en video literalmente cambiará las palabras de su discurso, también modificará los movimientos de los labios.
Para lograr este resultado un tanto inquietante, el algoritmo "aprende" los fonemas y su pronunciación del sujeto en el video y crea un modelo 3D preciso de su rostro, capaz de replicar todos los sonidos y movimientos: en ese momento bastará con editar el texto del discurso y el algoritmo reemplazará la oración original.
Actualmente, el algoritmo necesita al menos 40 minutos de video para "entrenar" para replicar a una persona en un video.
Aquí hay un video que muestra cómo funciona el sistema:
Enormes dudas éticas
Está claro que este mecanismo crea la posibilidad de que cualquiera pueda modificar un discurso (quizás de figuras políticas o figuras públicas) insertando elementos de odio o desinformación, y difundiéndolos como originales y naturales: esto solo aumenta las preocupaciones sobre la propagación de sistemas basados en deepfake
Por otro lado, hay algunos aspectos positivos, y está en el enorme ahorro que conseguirá el montaje al evitar volver a rodar escenas enteras por pequeños errores de pronunciación.
Por lo demás, estoy seguro de que también se desarrollarán otros métodos "antifalsificación" para vídeos: marcas de agua dinámicas o marcas de agua que complejicen aún más el trabajo de la inteligencia artificial, en una competición entre realidad y manipulación que ya parece destinada a caracterizar los próximos años.