La nueva herramienta de inteligencia artificial de Meta, AudioCraft, promete a sus usuarios explorar nuevas composiciones sin tener que interpretar una sola nota en un instrumento.
AudioCraft es una herramienta basada en IA que depende de tres modelos de lenguaje: AudioGen, EnCodec y MusicGen. La idea es que podamos obtener pistas de audio por medio de tan solo una descripción en texto de lo que queremos escuchar. La modelo funciona tanto para música como para sonidos, compresión y generación.
De los tres modelos, MusicGen es el que ha sido entrenado específicamente para generar música a partir de texto. Para ello han utilizado miles de temas musicales licenciados por Meta.
«Creemos que MusicGen puede convertirse en un nuevo tipo de instrumento, al igual que los sintetizadores cuando aparecieron por primera vez»,
dijo la compañía en un comunicado.
La compañía dice que AudioCraft necesita código abierto para diversificar los datos utilizados para entrenarlo.
«Reconocemos que los conjuntos de datos utilizados para entrenar nuestros modelos carecen de diversidad. En particular, el conjunto de datos de música utilizado contiene una porción más grande de música de estilo occidental y solo contiene pares de audio-texto con texto y metadatos escritos en inglés»
agregó Meta
Los modelos ya han sido lanzados y su código puede ser descargado a través de Hugging Face o su respectiva página de Github.