Google lanza herramientas GenAI para la creación de música
A medida que las herramientas GenAI comienzan a transformar la industria de la música de maneras increíbles, y en algunos casos éticamente problemáticas, Google está aumentando sus inversiones en tecnología de inteligencia artificial para crear nuevas canciones y letras.
El gigante de la búsqueda presentó hoy MusicFX, una actualización de MusicLM, la herramienta de generación de música que Google lanzó el año pasado. MusicFX puede crear melodías de hasta 70 segundos de duración y bucles de música, ofreciendo lo que Google afirma que es una generación de música de “mayor calidad” y “más rápida”.
MusicFX está disponible en la AI Test Kitchen de Google, una aplicación que permite a los usuarios probar sistemas experimentales alimentados por IA de los laboratorios de la compañía. Técnicamente, MusicFX se lanzó para usuarios seleccionados en diciembre, pero ahora está disponible de forma general.
Y no es terrible, debo decir.
Al igual que su predecesor, MusicFX permite a los usuarios ingresar un indicador de texto (“dos guitarras de nylon tocando estilo flamenco”) para describir la canción que desean crear. La herramienta genera dos versiones de 30 segundos de forma predeterminada, con opciones para alargar las pistas (a 50 o 70 segundos) o para unir automáticamente el principio y el final para hacer un bucle.
Una nueva adición son las sugerencias de palabras descriptivas alternativas en los indicadores. Por ejemplo, si escribes “estilo country”, es posible que veas un menú desplegable con géneros como “estilo rockabilly” y “estilo bluegrass”. Para la palabra “pegajoso”, el menú desplegable podría contener “chill” y “melódico”.
Debajo del campo para el indicador, MusicFX proporciona una nube de palabras de recomendaciones adicionales para descripciones relevantes, instrumentos y tempos para agregar (por ejemplo, “avant garde”, “rápido”, “emocionante”, “tambores 808”).
¿Y cómo suena? Bueno, en mis pruebas breves, las muestras de MusicFX eran… ¿buenas? Para ser sincero, las herramientas de generación de música están llegando al punto en el que es difícil para este escritor distinguir entre las salidas. El estado actual de la técnica produce pistas impresionantemente limpias y nítidas, pero tienden a ser aburridas, carentes de inspiración y sin foco melódico.
Tal vez sea la tristeza (SAD) lo que me está afectando, pero uno de los indicadores que elegí fue “una canción de música house con ritmos funky que sea bailable y alegre, con vibraciones de verano en la azotea”. MusicFX cumplió, y las pistas no estaban mal, pero no puedo decir que se acerquen a ninguno de los mejores sets de DJ que he escuchado recientemente.
Escucha por ti mismo:
Cualquier cosa con instrumentos de cuerda suena peor, como una muestra MIDI barata, lo cual quizás refleja el conjunto de entrenamiento limitado de MusicFX. Aquí hay dos pistas generadas con el indicador “una melodía conmovedora tocada en instrumentos de cuerda, orquestal, con un núcleo melódico fuerte”:
Y para cambiar de ritmo, aquí está la interpretación de MusicFX de “una canción melancólica en guitarra, tempo lento, en una noche de luna” (Perdona el error ortográfico).
Hay ciertas cosas que MusicFX no generará y que no se pueden eliminar de las pistas generadas. Para evitar problemas de derechos de autor, Google filtra los indicadores que mencionan artistas específicos o incluyen vocales. Y está utilizando SynthID, una tecnología de marca de agua inaudible desarrollada por su división DeepMind, para dejar claro qué pistas provienen de MusicFX.
No estoy seguro de qué lista maestra está utilizando Google para filtrar artistas y nombres de canciones, pero no encontré que fuera tan difícil de derrotar. Aunque MusicFX se negó a generar canciones al estilo de SZA y The Beatles, felizmente aceptó un indicador que hacía referencia a Lake Street Dive, aunque las pistas no eran para escribir a casa, debo decir.
Generación de letras
Google lanzó una nueva herramienta de generación de letras, TextFX, en AI Test Kitchen que está destinada a ser una especie de compañero de MusicFX. Al igual que MusicFX, TextFX ha estado disponible para un pequeño grupo de usuarios durante algún tiempo, pero ahora está más ampliamente disponible y mejorado en términos de “experiencia de usuario y navegación”, según Google.
Como explica Google en la aplicación AI Test Kitchen, TextFX fue creado en colaboración con Lupe Fiasco, el rapero y productor discográfico. Está impulsado por PaLM 2, uno de los modelos de IA generadores de texto de Google, e “[toma] inspiración de las técnicas líricas y lingüísticas [Fiasco] ha desarrollado a lo largo de su carrera.”
Este periodista esperaba que TextFX fuera más o menos un generador automático de letras. Pero ciertamente no es eso. En cambio, TextFX es un conjunto de módulos diseñados para ayudar en el proceso de escritura de letras, incluido un módulo que encuentra palabras en una categoría que empiezan con una letra elegida y un módulo que encuentra similitudes entre dos cosas no relacionadas.
TextFX tarda un poco en hacerse la idea. Pero puedo ver que se convierte en un recurso útil para letristas, y escritores en general, francamente.
Sin embargo, querrás revisar de cerca sus salidas. Google advierte que TextFX “puede mostrar información inexacta, incluida sobre personas”, y logré hacer que sugiriera que el cambio climático “es un engaño perpetrado por el gobierno chino para dañar a las empresas estadounidenses.” ¡Vaya!
Quedan preguntas
Con MusicFX y TextFX, Google está señalando que está muy invertido en la tecnología GenAI para la música. Pero me pregunto si su preocupación por mantenerse al día con la competencia en lugar de abordar las difíciles preguntas que rodean a la música GenAI le servirá bien en el futuro.
Cada vez más, las pistas caseras que utilizan GenAI para conjurar sonidos familiares y voces que pueden ser presentadas como auténticas, o al menos lo suficientemente cercanas, se han vuelto virales. Las discográficas han sido rápidas en señalar las pistas generadas por IA a socios de streaming como Spotify y SoundCloud, citando preocupaciones de propiedad intelectual. En general, han tenido éxito. Pero aún hay una falta de claridad sobre si la música "deepfake" viola los derechos de autor de artistas, discográficas y otros titulares de derechos.
Un juez federal dictaminó en agosto que el arte generado por IA no puede tener derechos de autor. Sin embargo, la Oficina de Derechos de Autor de EE. UU. aún no ha tomado una postura al respecto, comenzando recientemente a solicitar opiniones públicas sobre cuestiones de derechos de autor en relación con la IA. También no está claro si los usuarios podrían encontrarse en problemas por violar la ley de derechos de autor si intentan comercializar música generada al estilo de otro artista.
Google está intentando trazar un camino cuidadoso hacia la implementación de herramientas de música GenAI en el lado de YouTube de su negocio, que está probando modelos de IA creados por DeepMind en colaboración con artistas como Alec Benjamin, Charlie Puth, Charli XCX, Demi Lovato, John Legend, Sia y T-Pain. Eso es más de lo que se puede decir de algunos de los competidores de GenAI de la gran tecnología, como Stability AI, que sostiene que el "uso justo" justifica la formación en contenido sin permiso del creador.
Pero con las discográficas demandando a los proveedores de GenAI por letras con derechos de autor en los datos de entrenamiento y los artistas expresando su descontento, Google tiene trabajo por delante, y no permite que ese hecho incómodo lo desacelere.