VASA-1, la IA de Microsoft crea personajes súper realistas a partir de una sola foto

Abril 19 2024

Tecnología

VASA-1, el revolucionario modelo de inteligencia artificial de Microsoft, lleva las caras parlantes generadas por computadora a un nuevo nivel de realismo.

comparte

La época de los asistentes de IA está cada vez más cerca: la interfaz con rostros y avatares digitales se está convirtiendo rápidamente en una parte integral de nuestra vida diaria. ¿Hasta dónde pueden llegar estos rostros digitales para replicar el realismo de una persona real? Muy lejos, a juzgar por VASA-1, el innovador modelo de inteligencia artificial que acaba de desarrollar Microsoft Research. Aquí puedes encontrar el documento.

VASA-1 puede generar vídeos ultrarrealistas de caras parlantes en tiempo real a partir de una única imagen y un archivo de audio. Ampliará los límites de lo que es posible en la creación de avatares digitales, con aplicaciones que van desde videollamadas hasta contenido de entretenimiento y mejora de la accesibilidad para personas con discapacidad auditiva.

VASA-1, realismo sin precedentes

Lo que hace que VASA-1 sea verdaderamente revolucionario es el nivel de realismo que es capaz de alcanzar. Los vídeos generados por este modelo de IA son prácticamente indistinguibles de los de personas reales.

Esto es posible gracias a una serie de características innovadoras. En primer lugar, VASA-1 ofrece una sincronización perfecta entre los movimientos de los labios y el audio. Independientemente del idioma o de la presencia de ruido de fondo, los labios del avatar se mueven en perfecta sincronía con las palabras pronunciadas, creando un efecto de sorprendente realismo.

Además, VASA-1 es capaz de capturar y reproducir una amplia gama de expresiones faciales, desde los matices más sutiles hasta las emociones más marcadas. Esto añade un nivel extra de profundidad y autenticidad a los avatares generados y al "personas digitales".

Finalmente, los movimientos de la cabeza se generan de forma natural y fluida, contribuyendo a la impresión de estar frente a una persona real y no una imagen estática.

Generación en tiempo real y alta calidad.

Encuentro impresionante la capacidad del VASA-1 para generar estos vídeos ultrarrealistas en tiempo real. Actualmente tiene una resolución de 512x512 píxeles y una velocidad de hasta 40 fotogramas por segundo, pero son avatares que hablan en vivo, sin retrasos ni interrupciones.

Esto allana el camino para una serie de aplicaciones innovadoras. Por ejemplo, VASA-1 podría usarse para crear avatares personalizados para videollamadas, haciendo que las interacciones virtuales sean más atractivas y realistas. También podría usarse para generar personajes interactivos en videojuegos o para crear contenido de video educativo y entretenido con presentadores virtuales.

Hacia una mayor accesibilidad

Una de las aplicaciones potenciales más interesantes de VASA-1 es la accesibilidad. Al generar vídeos de caras parlantes a partir de un archivo de audio, este modelo de IA podría utilizarse para crear versiones accesibles de contenido de vídeo para personas con discapacidad auditiva.

Imagine poder ver un discurso o una conferencia con el avatar de un orador articulando claramente las palabras en sincronía con el audio. Esto podría hacer que los contenidos sean mucho más utilizables para personas con dificultades auditivas, abriendo nuevas posibilidades de aprendizaje y participación.

Pido disculpas en nombre de Microsoft :)

El futuro de VASA-1 y la comunicación virtual

Los investigadores de Microsoft no están satisfechos y ya están trabajando para mejorar aún más el rendimiento de VASA-1. En el futuro, podemos esperar avatares parlantes de calidad aún mayor, incluso más fluidos y con resoluciones más altas. Sin mencionar los tiempos y costos de películas y animaciones: serán totalmente cambiados.

Quienes recordéis la pionera serie de televisión"Max Headroom“¿? Allí "resucitó" un periodista real como avatar virtual. Una serie visionaria, de hace 30 años, que pronto quedará totalmente superada por los hechos. A medida que VASA-1 y tecnologías similares avanzan, la línea entre la comunicación virtual y la interacción cara a cara puede volverse cada vez más borrosa.

Por supuesto, esta perspectiva también plantea cuestiones éticas y sociales. Será importante desarrollar directrices y regulaciones para garantizar el uso responsable y transparente de estas tecnologías, protegiendo la privacidad y previniendo posibles abusos como la creación de deepfakes.

Dicho esto, los beneficios potenciales de modelos como VASA-1 son enormes.

Desde una comunicación más atractiva hasta un aprendizaje mejorado, desde un entretenimiento más interactivo hasta una mayor accesibilidad, las aplicaciones son amplias y prometedoras.

VASA-1 nos ofrece una visión fascinante de un futuro en el que la comunicación virtual será cada vez más indistinguible de la comunicación cara a cara. Es un futuro donde los avatares ultrarrealistas pueden transmitir no sólo palabras, sino también emociones, expresiones y presencia. Un futuro en el que la distancia física será una barrera menor y en el que la accesibilidad al contenido mejorará enormemente.

Tengo mucha curiosidad por ver cómo VASA-1 (y sus sucesores) transformarán la forma en que nos comunicamos, aprendemos y nos entretenemos en los próximos años. La revolución de los rostros digitales acaba de comenzar y el futuro parece más realista que nunca.

gianluca riccio, directora creativa de Melancia adv, redactora y periodista. Forma parte del Instituto Italiano para el Futuro, World Future Society y H+. Desde 2006 dirige Futuroprossimo.it, el recurso italiano de Futurología.

Para informar sobre investigaciones, descubrimientos e invenciones, contacta con el equipo editorial! Siga Futuro Prossimo en Whatsapp: noticias y actualizaciones exclusivas (gratis).

FP sobre Fatto Quotidiano
Alberto Robiati y Gianluca Riccio guían a los lectores a través de escenarios del futuro: las oportunidades, riesgos y posibilidades que tenemos para crear un mañana posible.

Sobre el mismo tema:

El último

VASA-1, la IA de Microsoft crea personajes súper realistas a partir de una sola foto

Tecnología

comparte

VASA-1, realismo sin precedentes

Generación en tiempo real y alta calidad.

Hacia una mayor accesibilidad

El futuro de VASA-1 y la comunicación virtual

Dicho esto, los beneficios potenciales de modelos como VASA-1 son enormes.

Armas autónomas, la conferencia de Viena: "actúen ahora para proteger a la humanidad"

Osteoartritis, un análisis de sangre con IA supera a los rayos X y la predice 10 años antes

Te llevaré al futuro del entretenimiento “automatizado” y generado por IA.

Ayrton Senna, 30 años después: su trágico final cambió el futuro de la F1

Armas autónomas, la conferencia de Viena: "actúen ahora para proteger a la humanidad"

Agricultura vertical: ¿cuánto sabes? 4 mitos para disipar

Del escaneo corporal a la relajación: RO, el chaleco robótico que calma tus nervios

El estiércol de ganado convierte los desechos médicos en abono: estudio indio