Entre los nuevos algoritmos y los avances de TI, las máquinas ahora pueden aprender modelos cada vez más complejos. Llegan a generar datos sintéticos de alta calidad, como imágenes fotorrealistas, e incluso hojas de vida de humanos ficticios.
ahora un estudio publicado en la revista internacional PLoS Genetics muestra el uso avanzado del aprendizaje automático en datos biométricos. A partir de los biobancos existentes, el sistema genera bloques completos de genoma humano que no pertenecen a humanos reales pero que tienen las características de un genoma real.
Pasando por alto el problema de la privacidad
"Las bases de datos genómicas existentes son un recurso invaluable para investigación biomédica," dado Burak Yelmen, primer autor del estudio y Junior Research Fellow de Modern Population Genetics en la Universidad de Tartu. "El problema es que no son de acceso público ni están protegidos de los largos y agotadores procedimientos de solicitud debido a preocupaciones éticas válidas. Esto crea una barrera científica importante para los investigadores. Un genoma generado por una máquina, un 'genoma artificial', puede ayudarnos a superar el problema dentro de un marco ético seguro”.
:format(jpg):extract_cover()/https%3A%2F%2Fscx1.b-cdn.net%2Fcsz%2Fnews%2F800a%2F2021%2F13-machinelearn.jpg)
El equipo multidisciplinario realizó más análisis para evaluar la calidad del genoma generado por aprendizaje automático en comparación con el real. "Sorprendentemente, este genoma imita las complejidades que podemos observar dentro de las poblaciones humanas reales y, para la mayoría de las propiedades, son indistinguibles de los otros genomas del biobanco utilizado para entrenar nuestro algoritmo. Excepto por un detalle: no pertenecen a ningún donante de genes”, dijo el Dr. Luca Pagani, uno de los autores principales del estudio y compañero de Mobilitas Pluss.
Un genoma generado por una máquina, un "genoma artificial", puede ayudarnos a superar el problema dentro de un marco ético seguro
Burak Yelmen

¿Es realmente el genoma original o una copia "escupida"?
El estudio también contempla la evaluación de la proximidad del genoma artificial al genoma real para verificar si se preserva la privacidad de las muestras originales. "Si bien la detección de fugas de privacidad en miles de genomas puede parecer como buscar una aguja en un pajar, la combinación de múltiples medidas estadísticas nos permite monitorear de cerca todos los modelos. Curiosamente, la exploración detallada de los complejos de patrones de dispersión a su vez conduce a otras mejoras en el evaluación de GAN y alimentará el campo del aprendizaje automático ". Esto es lo que el Dr. jay flora, coordinador de estudios e investigador del CNRS, Centro Nacional Francés de Investigaciones Científicas).
Con todo, los enfoques de aprendizaje automático ya proporcionados caras, biografías y muchas otras características a un puñado de seres humanos imaginarios. Ahora también sabemos más sobre su biología. Estos humanos ficticios con genomas realistas podrían servir como banco experimental en lugar de genomas reales que no están disponibles públicamente.