Aquí hay una IA que puede predecir los próximos 25 fotogramas de una película

8 Noviembre 2019

9111e53b 814e 4a68 8861 c83fb5141ae6 e1573163524251

Tecnología

Una inteligencia artificial es capaz de predecir con bastante precisión cuáles serán los 25 cuadros futuros de esta película.

comparte

Los algoritmos de inteligencia artificial y aprendizaje automático están mejorando para predecir acciones en videos.

El mejor de los algoritmos actuales puede predecir con bastante precisión a dónde irá una pelota de béisbol después de haber sido lanzada, o la aparición de un camino en la secuencia por venir. ¿En otras palabras? Predicción de cuadros en el futuro de una película.

Un nuevo enfoque propuesto por investigadores de Google, la Universidad de Michigan y Adobe avanza el estado del arte con modelos a gran escala que generan videos de alta calidad a partir de unos pocos fotogramas.

“Con este proyecto pretendemos obtener pronósticos de video precisos. Optimizaremos las capacidades de una red neuronal ", los investigadores escribieron en un documento que describe su trabajo.

El modelo de equipo

El modelo central del equipo se basa en una arquitectura estocástica de generación de video, con un componente que gestiona las predicciones de los marcos siguiendo los considerados.

El equipo entrenó y probó diferentes versiones del modelo por separado de los conjuntos de datos personalizados basados en tres categorías de pronóstico: interacciones entre objetos, movimiento estructurado y observabilidad parcial.

Para la primera tarea (interacciones con objetos) Los investigadores seleccionaron 256 clips de un bloque de videos que mostraban un brazo robótico mientras interactuaban con las toallas.

Para el segundo (movimiento estructurado) editaron clips de Human 3.6M, un bloque que contiene clips de humanos que realizan acciones como sentarse en una silla.

En cuanto a la tercera (actividad de observabilidad parcial), utilizó un conjunto de datos de conducción KITTI de código abierto recopilados de imágenes de cámaras montadas en los tableros del automóvil.

Después de este "entrenamiento", el modelo de IA generó hasta 25 cuadros en el futuro.

Los investigadores informan que los evaluadores prefirieron las "predicciones" el 90,2%, el 98,7% y el 99,3% del tiempo, respectivamente, a los tres tipos de vídeo: interacciones entre objetos, movimiento estructurado y tareas de observabilidad parcial. respectivamente.

Cualitativamente, el equipo observa que la IA ha representado de manera nítida brazos y piernas humanos y ha hecho "Predicciones muy precisas que parecían realistas en comparación con las escenas representadas en el video" .

El modelo de inteligencia artificial al tiempo que proporciona marcos de datos de video de acciones humanas

El modelo de inteligencia artificial al tiempo que proporciona marcos de datos de video de la cámara de un automóvil.

"Hemos descubierto que maximizar la capacidad de tales modelos mejora la calidad de la predicción de video", los coautores escriben. Esperamos que nuestro trabajo aliente al campo a avanzar en direcciones similares en el futuro. Por ejemplo para ver hasta dónde podemos llegar ”.

¿Cuántos minutos del futuro te puedes imaginar?

gianluca riccio, directora creativa de Melancia adv, redactora y periodista. Forma parte del Instituto Italiano para el Futuro, World Future Society y H+. Desde 2006 dirige Futuroprossimo.it, el recurso italiano de Futurología.

Para informar sobre investigaciones, descubrimientos e invenciones, contacta con el equipo editorial! Siga Futuro Prossimo en Whatsapp: noticias y actualizaciones exclusivas (gratis).

FP sobre Fatto Quotidiano
Alberto Robiati y Gianluca Riccio guían a los lectores a través de escenarios del futuro: las oportunidades, riesgos y posibilidades que tenemos para crear un mañana posible.

Sobre el mismo tema:

El último

Aquí hay una IA que puede predecir los próximos 25 fotogramas de una película

Tecnología

comparte

Los algoritmos de inteligencia artificial y aprendizaje automático están mejorando para predecir acciones en videos.

El modelo de equipo

¿Cuántos minutos del futuro te puedes imaginar?

Las novedades que esperamos de 2024: será un año que no podrás creer

Llega Google Gemini y te deja sin aliento: pero ¿cuándo se podrá utilizar?

Fin de la humanidad, las 14 trampas que nadie se atreve a afrontar

Contra la inflación, Francia se lanza a combatir esta práctica

Domesticación antigua: hace milenios el zorro era una mascota

La aplicación “intolerante” que te espía por tu propio bien: la absurda hazaña de Covenant Eyes

Supermercado Orwell: es necesario repensar las compras con reconocimiento facial

Trasplante de ovario: la menopausia “a pedido” divide a la ciencia