Un robot DJ

MusicLM : une IA de Google capable de produire de la musique à partir d’un texte ou d’un fredonnement

© Dreamstudio/Florence Banville

Google travaille à l'équivalent de ChatGPT mais pour la musique. La firme ne prévoit pas encore de rendre son utilisation publique.

Vos petites inventions musicales fredonnées ou sifflées innocemment pourraient se transformer en quelques secondes en musique techno, chœur de chorale, et autre solo de guitare... C’est la promesse de MusicLM, une intelligence artificielle développée par Google. Pour le moment, il ne s’agit pas d’un produit fini mais d’un projet de recherche. L’article qui présente ses capacités a été mis en ligne le 26 janvier. Sur GitHub, on peut écouter des dizaines d’enregistrements produits par cette intelligence artificielle générative

MusicLM est également capable de créer une toute nouvelle musique à partir d’un simple texte. Le principe est le même que pour les intelligences artificielles génératrices de texte comme ChatGPT ou d’images comme Midjourney. Vous écrivez un « prompt », ce court texte qui sert de consignes à l’intelligence artificielle, et vous obtenez un résultat. L’indication peut être très courte et assez large – « techno berlinoise des années 90 ». Ou très détaillée :   « Une fusion de reggaeton et de musique électronique, avec un son spatial, venant d'un autre monde. La musique évoque un sentiment d'émerveillement et de crainte, tout en étant dansante. » Le prompt peut indiquer un genre musical, une période ou un instrument particulier. Plus étonnant : l’IA peut également être « nourrie » avec une photo et sa légende. 

Il est possible d’indiquer à MusicLM un changement de style dans le même morceau en lui précisant le timing. Par exemple « musique électronique de jeu vidéo 0:00 - 0:15, musique de méditation jouée à côté d’une rivière (0:15-0:30) ». 

Dans tous les cas, l’algorithme parvient à générer un fichier audio en haute-fidélité cohérent de plusieurs secondes, voire plusieurs minutes. La qualité est parfois bluffante, d'autres fois le son est robotique ou distordu. 

Léger problème de copyright

Selon les auteurs du papier, MusicLM serait plus performant que les modèles similaires (Mubert et Riffusion) déjà existants. Une qualité notamment permise grâce aux bases de données sur lesquelles l’IA a été entraînée : une première base de données de 280 000 heures de musique. Puis une seconde baptisée MusicCaps, mise au point par les chercheurs de Google : soit 5 500 musiques accompagnées de leur description précise en texte. Toutefois, les chercheurs notent dans leur article un léger problème de copyright : 1 % des musiques créées par MusicLM copient des morceaux sur lesquels le modèle a été entraîné. Ce qui explique que pour le moment Google n’envisage pas de rendre public l’utilisation de cet outil, explique TechCrunch

Des expérimentations musicales avec l’intelligence artificielle ont lieu depuis plusieurs années. Le compositeur et musicien français Skygge s’y essaie depuis 2015. Il a notamment produit deux albums avec l’aide d’algorithmes. « L’IA pose la question du rôle de l’artiste. La curation prend une plus grande place dans son processus créatif. On doit écouter les résultats. Les machines n'ont aucune idée de ce qui est beau ou même correct musicalement. Ça bouscule quelque peu l’ego du musicien qui doit accepter de céder une part de contrôle », expliquait-il en 2022 à L’ADN

On attend le ChatGPT de la musique

Aujourd’hui, les IA musiciennes sont surtout testées par une petite frange de professionnels intéressés par ces nouvelles technologies, mais on pourrait imaginer qu’un outil comme celui de Google démocratise la pratique. De la même manière que ChatGPT a réussi à rendre « grand public » la génération de textes.

Marine Protais

À la rubrique "Tech à suivre" de L'ADN depuis 2019. J'écris sur notre rapport ambigu au numérique, les bizarreries produites par les intelligences artificielles et les biotechnologies.
commentaires

Participer à la conversation

Laisser un commentaire