Futuro cercano
Sin resultado
Ver los Resultados
Abril 1 2023
  • Inicio
  • Tecnología.
  • salud
  • Ambiente
  • Energía
  • Transporte
  • Spazio
  • AI
  • Conceptos
  • H+
Comprender, anticipar, mejorar el futuro.
CES2023 / Coronavirus / Rusia-Ucrania
Futuro cercano
  • Inicio
  • Tecnología.
  • salud
  • Ambiente
  • Energía
  • Transporte
  • Spazio
  • AI
  • Conceptos
  • H+

Comprender, anticipar, mejorar el futuro.

Sin resultado
Ver los Resultados
Tecnología

AudioLM, la IA de Google escucha un fragmento de una canción y lo completa

Un nuevo sistema de inteligencia artificial es capaz de crear música (y palabras) a partir de sonidos después de escuchar unos segundos de audio o canciones.

Octubre 8 2022
gianluca ricciogianluca riccio
⚪ 4 minutos
Compartir69Pin17Tweet43EnviarCompartir12CompartirCompartir9

LEE ESTO EN:

AudioLM, el sistema desarrollado por los investigadores de Google, genera todo tipo de sonidos, incluso complejos como música de piano en una canción o personas hablando, casi indistinguibles del fragmento inicial que se le envía.

La técnica es muy prometedora y puede ser útil de muchas maneras. Por ejemplo, puede acelerar el proceso de entrenamiento de la IA o generar automáticamente música para acompañar videos. Pero es mucho más que eso.

Tócala de nuevo, Sam

Ya estamos acostumbrados a escuchar audio generado por inteligencia artificial. Cualquiera que pelee cada día con Alexa o Google Nest lo sabe bien: nuestros asistentes de voz procesan el lenguaje natural.

Hay, sin duda, también sistemas entrenados en música: recuerda Jukebox por OpenAI? Te lo dije aquí. Todos estos sistemas, sin embargo, se basan en un "entrenamiento" largo y complejo, que pasa por la catalogación y administración de muchas "ideas". Nuestras inteligencias artificiales tienen hambre de datos y quieren más y más.

El artículo continúa después de los enlaces relacionados.

Cuando la IA conduce al suicidio: el caso que sacude el mundo de la tecnología

Tree Canopy, la superarma de Google contra el calor en las ciudades

El siguiente paso es hacer que la IA "piense" permitiéndole procesar la información que escucha más rápidamente, sin necesidad de un largo entrenamiento. Algo similar a lo que intentas hacer con los sistemas de conducción autónoma.

Cómo funciona AudioLM

Para generar el audio, se introducen unos segundos de canción o sonido en AudioLM, que literalmente predice lo que sigue. No es Shazam, no busca la pieza entera y la vuelve a proponer. No hace un collage de sonidos que tiene en la memoria. Él los construye. El proceso es similar a la forma en que modelos lingüísticos como GPT-3 predicen frases y palabras.

Los clips de audio publicados por el equipo de Google suenan muy naturales. En particular, la música de piano generada por AudioLM parece más fluida que la generada con las actuales inteligencias artificiales. En otras palabras, es mejor para capturar la forma en que producimos una canción o un sonido.

"Es realmente impresionante, sobre todo porque indica que estos sistemas están aprendiendo algún tipo de estructura en capas", dice. roger dannenberg, investigador de música generada por computadora en la Universidad Carnegie Mellon.

Canción o sonido, la IA lo reproduce todo
AudioLM procesa y predice sonidos de formas sin precedentes

No solo una canción

Imagina hablar con AudioLM, dos palabras y parar. El sistema continuará el discurso aprendiendo tu cadencia, tu acento, tus pausas, incluso tu respiración. En resumen, exactamente como hablas. No hay necesidad de hacer un entrenamiento específico: lo puede hacer casi solo.

Como un loro repitiendo las cosas que escuchas. Solo que este es un loro capaz de recibir y producir cualquier sonido, y completar de forma autónoma los que quedan en medio.

En resumen? Tendremos muy pronto (y en estos casos quiere decir muy pronto) sistemas capaces de hablar con mucha más naturalidad, y de componer una canción o sonar exactamente como Desde E 2, MidjourneyAI y otros crean imágenes, o Hacer un vídeo crea clips basados ​​en nuestra entrada.

¿Quién tiene los derechos de una canción?

Si bien estos sistemas podrán crear contenido casi por sí mismos, ese "casi" todavía marca la diferencia en el mundo y hace que sea necesario considerar las implicaciones éticas de esta tecnología.

Si digo "Entonces, hazme un final diferente a Bohemian Rapsody" y esta cosa va a hacer una canción en ese sentido, ¿quién puede reclamar los derechos y cobrar las regalías por la canción? Sin mencionar el hecho de que los sonidos y los discursos ahora indistinguibles de los humanos son mucho más convincentes y están abiertos a una difusión de desinformación sin precedentes.

En el documento publicado para presentar esta IA (lo enlazo aqui), los investigadores escriben que ya están considerando cómo mitigar estos problemas insertando formas de distinguir los sonidos naturales de los producidos con AudioLM. Yo creo poco. Muchos de los propósitos para los que se creó esta IA se perderían.

Más generalmente, el riesgo es producir un fenómeno que yo llamaría "desconfianza de la realidad". Si todo puede ser verdad, nada puede serlo. Nada tiene valor.

Intentamos entrenar nuestra inteligencia natural para estos cambios mientras pensamos en cómo la inteligencia artificial puede producirlos. Si no lo hacemos, tendremos una canción con un final muy amargo.

Tags: audiogoogleinteligencia artificial


GPT Chat Megafácil!

Guía concreta para quienes se acercan a esta herramienta de inteligencia artificial, también pensada para el mundo escolar: muchos ejemplos de aplicaciones, indicaciones de uso e instrucciones listas para usar para entrenar e interrogar a Chat GPT.

Para enviar artículos, divulgar los resultados de una investigación o descubrimientos científicos escribir a la redacción

Más leído del mes

  • AirCar, el coche volador de Lazzarini es un coche de carreras de 750 km/h con 4 plazas

    397 Comparte
    Compartir 159 Tweet 99
  • Oculus visita VR a la casa de Ana Frank

    199 Comparte
    Compartir 80 Tweet 50
  • Animales que saben vivir para siempre y dónde encontrarlos.

    952 Comparte
    Compartir 380 Tweet 238
  • Duras verdades: ¿China ya sería más fuerte que Estados Unidos en un conflicto?

    5 Comparte
    Compartir 2 Tweet 1
  • Energía solar marina: Seavolt está a punto de revolucionar la industria

    4 Comparte
    Compartir 1 Tweet 1
  • Hablaremos con los animales: la revolución bioacústica pasa por la IA

    5 Comparte
    Compartir 1 Tweet 1
  • Monjes cerveceros alemanes: “adiós botellas y gastos de transporte, aquí está la cerveza en polvo”

    4 Comparte
    Compartir 1 Tweet 1

Ingresa al canal de Telegram de Futuroprossimo, haga clic aquí. O síguenos en Instagram, Facebook, Twitter, Mastodonte e LinkedIn.

El diario de mañana.


Futuroprossimo.it ofrece noticias sobre el futuro de la tecnología, la ciencia y la innovación: si hay algo que está por llegar, aquí ya llegó. FuturoProssimo es parte de la red Reenviar a, estudios y habilidades para escenarios futuros.

FacebookTwitterInstagramTelegramLinkedInMastodontePinterestTikTok
  • Ambiente
  • arquitectura
  • Inteligencia artificial
  • Gadgets
  • Conceptos
  • Diseño
  • medicina
  • Spazio
  • Robotica
  • Trabajar
  • Transporte
  • Energía
  • Edición francesa
  • edición alemana
  • versión japonesa
  • Edición en inglés
  • Edición Portuguesa
  • Русское издание
  • edición en español

Suscríbete al boletín

  • Los editores
  • Publicidad en FP
  • Política de Privacidad

© 2022 Futuropróssimo - Licencia Creative Commons
Este trabajo se distribuye bajo licencia Creative Commons Reconocimiento 4.0 Internacional.

Sin resultado
Ver los Resultados
Comprender, anticipar, mejorar el futuro.
  • Inicio
  • Tecnología.
  • salud
  • Ambiente
  • Energía
  • Transporte
  • Spazio
  • AI
  • Conceptos
  • H+