Meta presenta AudioCraft: Nueva herramienta AI generativa de música

Comparte este artículo

Meta presentó una nueva herramienta de inteligencia artificial generativa para crear música a partir de textos y anuncia su disponibilidad de código abierto para fines de investigación.

La nueva herramienta, llamada AudioCraft, consta de tres modelos: MusicGen, AudioGen y EnCodec.

Durante el mes de Junio, la empresa de Mark Zuckerberg informó que utilizó 20,000 horas de música con licencia para entrenar MusicGen, que incluyó 10,000 pistas de música con licencia de alta calidad. En ese momento, los investigadores describieron en un documento los desafíos éticos que encontraron en torno al desarrollo de modelos de inteligencia artificial generativa como la herramienta mencionada.

Recientemente, la compañía matriz de Facebook e Instagram anunció que mientras MusicGen fue entrenado con música de propiedad de Meta y con licencia específica, AudioGen fue capacitada con efectos de sonido públicos para generar audio a partir de textos.

También actualizaron su decodificador EnCodec, que permite «generación de música de mayor calidad con menos artefactos«.

Además, Meta está lanzando sus modelos preentrenados de AudioGen, lo que permite a los usuarios generar diversos sonidos ambientales y efectos de sonido, como ladridos de perros, bocinas de autos o pasos en pisos de madera.

«Estamos compartiendo estos modelos como código abierto, brindando acceso a investigadores y profesionales para que puedan entrenar sus propios modelos con sus propios conjuntos de datos por primera vez y ayudar a avanzar en el campo del audio y música generados por inteligencia artificial«, dijo Meta.

VER MAS  Aquí está el trailer de The Marvels: Capitana Marvel, Ms. Marvel y Capitana Monica se unen

También afirmaron que se simplificó el diseño general de modelos generativos para audio en comparación con trabajos anteriores en el campo, proporcionando a los usuarios «la receta completa para experimentar con los modelos existentes» que Meta ha estado desarrollando en los últimos años.

Estas nuevas herramientas buscan abordar los desafíos en el campo de la generación de audio en inteligencia artificial en comparación con los modelos diseñados para imágenes, videos y texto. Meta reconoció que la complejidad de modelar señales y patrones de audio a diferentes escalas, especialmente para la música, ha sido un desafío.

«La música es posiblemente el tipo de audio más desafiante de generar, ya que está compuesta por patrones locales y de largo alcance, desde una suite de notas hasta una estructura musical global con múltiples instrumentos«, dijo la compañía.

Con AudioCraft, Meta afirma que permite a músicos y creadores obtener inspiración, generar ideas y crear composiciones de manera innovadora con su interfaz fácil de usar.

Meta imagina que MusicGen podría evolucionar potencialmente en un nuevo tipo de instrumento, similar al impacto que tuvieron los sintetizadores cuando surgieron por primera vez.

Se espera que AudioCraft de Meta compita con MusicLM de Google, una herramienta que también puede generar música de alta fidelidad a partir de textos y zumbidos, que fue puesta a disposición del público en mayo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *