Un nuevo dispositivo portátil desarrollado por científicos de Cornell University es capaz de capturar las expresiones faciales de una persona usando un sonar y reproducirlas como un avatar digital. Evitar las cámaras podría mitigar los problemas de privacidad.
EarIO, este es el nombre del dispositivo, es hiper simple. Consta de unos auriculares con micrófono y un altavoz a cada lado, y se puede conectar a cualquier auricular normal. Los altavoces reproducen impulsos de sonido fuera del alcance del oído humano, y sus ecos son captados por micrófonos, al igual que funciona un sonar.
Los perfiles de eco cambian según las expresiones faciales: por este motivo, algoritmos debidamente entrenados reconocen las variaciones recibidas por el sonar y las traducen en imágenes.
EarlO, sonar que “ve” cosas a partir de sonidos
"Gracias al poder de la inteligencia artificial, nuestro algoritmo construye conexiones intrincadas entre el movimiento muscular y las expresiones faciales que los humanos no pueden percibir", dice. ke li, uno de los coautores del estudio. “Se puede utilizar para extraer información muy compleja: la de todo el frente de la cara”. La investigación fue publicada en la revista Actas de la Asociación de Maquinaria Informática sobre Tecnologías Interactivas, Móviles, Portátiles y Ubicuas. Y te lo enlazo aquí.
El equipo probó el sonar EarIO en 16 participantes, ejecutando el algoritmo en un teléfono inteligente normal. Y el dispositivo pudo reconstruir las expresiones faciales como lo haría una cámara / cámara normal. Los ruidos de fondo como el viento, las conversaciones o el ruido de la calle no interfirieron en lo más mínimo con su capacidad para grabar rostros.
Tecnología de 007
Los investigadores señalan que el sonar tiene varias ventajas sobre el uso de uno cámara. Los datos acústicos consumen mucha menos energía y capacidad de procesamiento, lo que le permite utilizar dispositivos más pequeños y livianos. Las cámaras también pueden recopilar mucha información personal adicional que los usuarios pueden no querer compartir, por lo que el sonar puede ser más seguro.
Por supuesto, volando con mi imaginación, imagino que esa tecnología se "deslizó" silenciosamente en un auricular normal, y creo que puede transmitir movimientos de labios y expresiones a distancia, incluso con fines de vigilancia. Esta vez, sin embargo, veo usos más prácticos.
¿Cual? En primer lugar, los del sector de los videojuegos: una forma práctica de replicar expresiones faciales físicas en un avatar digital para juegos, realidad virtual o el metaverso. Ahora el equipo está trabajando para descartar otras interferencias, como cuando el usuario gira la cabeza, y simplificar el sistema de entrenamiento para el algoritmo de IA.
Ya veremos. Es decir, escuchar. En resumen, lo entiendes.