Se está volviendo extremadamente fácil (y no creo que sea solo bueno) alterar un video, y los últimos desarrollos en IA son realmente impresionantes.
Una colaboración entre gigantes (la Universidad de Stanford y Princeton más el Instituto Max Planck de Informática y Adobe) permite alterar el discurso en un video simplemente modificando la transcripción textual y sin crear el efecto de "doblaje".
En otras palabras, la persona que está hablando en video literalmente cambiará las palabras de su discurso, también modificará los movimientos de los labios.
Para lograr este resultado algo perturbador, el algoritmo "aprende" los fonemas y su pronunciación del sujeto en el video y crea un modelo 3D preciso de su rostro, capaz de replicar todos los sonidos y movimientos: en ese momento, simplemente edite el texto del discurso y el algoritmo reemplazará la oración original.
Actualmente, el algoritmo necesita al menos 40 minutos de video para "entrenar" a replicar a una persona en un video.
Aquí hay un video que muestra cómo funciona el sistema:
Enormes dudas éticas
Está claro que este mecanismo crea la posibilidad de que cualquiera pueda modificar un discurso (quizás de figuras políticas o figuras públicas) insertando elementos de odio o desinformación, y difundiéndolos como originales y naturales: esto solo aumenta las preocupaciones sobre la propagación de sistemas basados en deepfake
Por otro lado, hay algunos aspectos positivos, y es en los enormes ahorros que logrará la edición al evitar volver a filmar escenas enteras debido a pequeños errores de pronunciación.
Por lo demás, estoy seguro de que también se desarrollarán otros métodos "anti-falsificación" para los videos: filigranas dinámicas o filigranas que hacen aún más complejo el trabajo de la inteligencia artificial, en una competencia entre realidad y manipulación que ya parece destinada a caracterizar la próximos años.