Greenroom

Dans le labo qui invente le tube parfait à coups d’algorithmes

Logée au cœur d’un sous-sol parisien, l’intelligence artificielle Flow Machines est capable de produire de la pop au kilomètre. Une première mondiale dû au talent d’une petite équipe de chercheurs français, travaillant d’arrache-pied au sein du studio Sony CSL. Récit d’une aventure informatique, où il est question de café froid, de mathématiques et de variété française.

Dans un coin du studio traîne un piano droit Wilhelm Schimmel, du nom de la marque allemande fondée à la fin du XIXème siècle. Juste à côté, une platine vinyle poussiéreuse sur laquelle est négligemment posée un 45 tours des Temptations. Au centre de la pièce, enfin un peu de modernité. Voilà un ordinateur portable Apple relié à un écran flambant neuf. Léo, la vingtaine, moitié du duo The Pirouettes, pianote en silence sur un clavier Akaï LPK 25, sous les yeux de Vickie, sa petite amie et moitié créatrice. Lorsqu’il clique sur l’engin, une mélodie s’échappe des enceintes, dans le style naïf et entraînant caractéristique du duo. Les paroles, en revanche, ont quelque chose d’étrange : ce n’est pas du français, ni même une autre langue, mais un assemblage désordonné de syllabes. « On appelle cette option le ‘Mash Mellow’, indique Benoît Carré, taulier des lieux depuis septembre dernier. C’est un outil qui analyse une voix, la découpe en petits morceaux puis la reconstruit. A la fin, on a un nouveau texte. » Ce jour-là, au studio SCL (pour « Sony Computer Science Laboratory »), dans un sous-sol du centre de Paris, s’échappe donc des baffles un refrain généré par ordinateur, et pourtant bien crû : « Je veux ton cul ».

Depuis septembre 2016, Benoît Carré travaille au studio CSL, en compagnie d’un assistant un peu particulier : une intelligence artificielle baptisée Flow Machines. Régulièrement, ce quadra reçoit dans son sous-sol de jeunes musiciens français, tels Lescop, les Naive New Beaters ou Housse de Racket. Première étape : expliquer aux artistes le fonctionnement de la machine. « Je leur demande à chaque fois de me trouver six ou sept chansons dont ils aiment la composition. Ces morceaux sont transformés en partitions, ou ‘lead sheets’, puis intégrés dans Flow Machines. A partir de toutes les lead sheets qu’ils ont rentré, une nouvelle partition va être générée. Ce sera notre base de compo. » Les Pirouettes ont choisi d’intégrer dans leur « base de données » certains de leurs propres titres, mais aussi « Sanza Tristesse » de Francis Bebey, « Génération Désenchantée » de Mylène Farmer ou « What’s a Girl to Do » de Fatima Yamaha. Ensuite, le processus créatif consiste à jouer avec l’intelligence artificielle, solliciter ses idées puis retenir les pistes les plus intéressantes. « C’est un générateur très riche, poursuit Carré, montre-calculatrice au poignet. Comme si tu étais en face d’un groupe hyper prolifique qui se fout un peu des règles, qui a mille idées à la seconde et qui t’envoie de la musique en permanence. Et toi, tu captes. » Vickie confirme : « La machine crée des petits bouts de mélodie, tu coupes, tu prends ce qui t’intéresse et tu en crées une autre. »

Ressusciter les Beatles ?

« La première fois que j’ai entendu le morceau, je me suis demandé si j’avais le droit d’aimer, sachant qu’il n’y a pas trop d’âme derrière, souffle Léo. C’était étrange, mais très intéressant. » A l’automne 2016, la presse internationale se pose moins de questions. De Pitchfork à Complex, tous s’emballent pour la première « pop song » composée par une intelligence artificielle. Le morceau se nomme « Daddy’s Car », comptabilise plus d’un million et demi de vues sur YouTube et certains annoncent un « nouveau morceau des Beatles ». Et pour cause : « Daddy’s Car » a été composé par Flow Machines à partir de quarante-cinq partitions de chansons des Fab Four. « C’était un peu une manière de s’attaquer à l’Everest », affirme le directeur du laboratoire François Pachet. Une forme d’aboutissement, pour cet admirateur de Paul McCartney, dont la bibliothèque est remplie de livres sur la « science des hits ». « Et pourtant, je n’ai jamais rien lu qui dise quoi que ce soit de tangible, profond et vrai, déplore ce quinqua. C’est pareil pour les tableaux, avec la loi des tiers. On dit toujours qu’une bonne image est coupée en trois. Alors oui, plus ou moins, pas toujours, peut-être, vaguement… Ces espèces de lois universelles ne me convainquent pas. »

 

 

En 1988, Pachet fait son premier stage de recherche à l’IRCAM, prestigieux institut de recherche fondé par Pierre Boulez. Plus tard, il travaille comme maître de conférences à l’université Pierre-et-Marie-Curie. Déjà, ses recherches portent sur l’intelligence artificielle. « J’en entends parler depuis tout petit. La première réalisation d’IA liée à la musique date probablement de 1958 : un morceau vocal, à quatre voix, dans le style de Bach, composé par ordinateur, avec des techniques à base de statistiques et de probabilités. » Pachet travaille désormais chez Sony. Depuis cinq ans, le voici à la tête du projet Flow Machines, une équipe d’une douzaine de personnes composée de thésards, de post-doctorants et de développeurs. A la différence des autres laboratoires, le Sony CSL planche sur la musique dite « populaire », celle vouée à passer à la radio ou à être reprise à la guitare sèche sur une plage de sable fin. « Avec un morceau de musique expérimentale, vous pouvez faire n’importe quoi, au hasard, vous pourrez toujours dire que c’est intéressant, soutient Pachet. Alors que si vous faîtes une mauvaise chanson, qu’elle passe à la radio et que tout le monde dit que c’est mauvais, et bien c’est mauvais, voilà tout. »

Dans les années 90, c’est avec le projet Continuator que François Pachet a attiré l’attention de la communauté scientifique. Dans son bureau, entouré d’épais manuels aux titres éloquents, tels que Creativity in the Digital Age ou Algorithmic Composition, son collègue Pierre Roy fouille dans les dossiers de son Mac, avant de cliquer sur un fichier vidéo. Sur le clip, un enfant joue quelques notes sur un clavier Roland. Silence. Puis l’algorithme Continuator improvise en s’inspirant de la première séquence. « L’enfant joue, le système apprend puis joue quelque chose de proche, l’enfant rejoue, et ainsi de suite. C’est un dialogue, explique Roy, chercheur au CSL depuis une dizaine d’années. C’est de la musique sans forme, complètement libre, sans mesure. » Continuator est basé sur le processus mathématique des chaînes de Markov, « un mathématicien russe, mort il y a longtemps, qui a inventé un type de modèle statistique très simple mais puissant, astucieux et facile à entraîner », précise Roy. Seul problème : le modèle de Markov peut certes fabriquer des séquences à l’infini, mais il ne contient pas de notion de durée. Or, l’art d’écrire des chansons réside notamment dans l’enchaînement de mesures formant des courtes séquences musicales : refrain, couplet, pont, et ainsi de suite.

Dès lors, tout l’enjeu pour Flow Machines consiste à permettre de composer de la musique « métrique », c’est à dire avec des barres de mesure. En 2011, à force d’avaler du café froid et de « réfléchir sous la douche », Pachet et ses hommes trouvent la solution : ils élaborent ce qu’ils nomment « les modèles de Markov avec contrainte ». « Concrètement, ce modèle-là permet de dire à la machine : ‘fabrique moi de la mélodie pour deux mesures’ », précise Roy. Ne reste plus qu’à affiner le projet. Benoît Carré, une vieille connaissance de François Pachet, joue un rôle crucial. « Je le connais via son groupe, Lilicub, qui a connu un certain succès dans les années 90 (7ème au Top 50 pour « Voyage en Italie » lors du printemps 1996, ndlr), resitue le directeur du labo. Comme je connaissais sa copine, qui était aussi membre du groupe, on se voyait de temps en temps. Par hasard, je lui ai dit qu’on pourrait essayer de travailler ensemble. » Au début, Benoît Carré vient comme testeur. Puis se prend au jeu. Désormais, l’auteur-compositeur travaille chaque jour avec l’intelligence artificielle, ouvre son studio aux musiciens curieux mais, surtout, fait remonter les bugs aux chercheurs. « Parfois, il n’y a pas de résultats lorsqu’on clique. D’autres fois, la note se répète sans cesse. »

Les robots à l’assaut des charts ?

Pour l’heure, Flow Machines reste un pur projet de recherche en informatique musicale, développé par Sony Corporation, une filiale du géant japonais Sony. Une aventure de cinq ans, subventionnée à hauteur de deux millions d’euros par l’European Research Council, prévue pour prendre fin en juillet 2017. Un album multi-artistes baptisé Shadow, conçu autour de Benoît Carré, devrait sortir d’ici la fin de l’année, manière de couronner ce quinquennat de travail. « Comme fil rouge, je me sers du concept de l’ombre, un conte d’Andersen racontant l’histoire d’une inversion entre un personnage et son ombre, dévoile Carré. Cet album est fait à 80%, je commence à travailler avec un réalisateur qui va le mixer. » A plus long terme d’autres pistes sont évoquées pour le prototype.

En attendant, certaines questions reviennent inlassablement, comme inscrites dans l’air du temps : et si un jour l’intelligence artificielle remplaçait les artistes ? Et si les robots piquaient à terme le job des musiciens ? Côté Sony, on ne répond pas encore aux questions concernant d’éventuelles applications commerciales pour Flow Machines. Surtout que d’ici à une révolution des charts dominés par des logiciels, il reste du boulot. « Il faut travailler sur la robustesse, il manque une meilleure interface et des serveurs plus rapides, insiste François Pachet. Il y a des algorithmes qu’on pourrait améliorer, mais il faut le temps de les définir, de bien les implémenter. » A minima, « un jour, l’intelligence artificielle sera incluse dans les logiciels de production musicale », parie de son côté Carré. Aux plus alarmistes, François Pachet dégaine un argument historique : « Les premiers synthétiseurs numériques sont sortis en 1984. Ils proposaient un son de piano très réaliste, un son d’orchestre, alors certains ont dit que c’était la fin des musiciens, la fin des orchestres, la fin de tout. Peu après sont apparus les premiers échantillonneurs numériques, ce qu’on appelle les sampleurs. Aujourd’hui, on se rend compte qu’il n’y a jamais eu autant de musique depuis l’arrivée de ces outils. » La tête dans ses machines, Léo de The Pirouettes se prend à rêver. « Pour l’instant, c’est vraiment l’homme qui apporte le côté cool au morceau. Mais j’adorerais qu’un jour le logiciel s’améliore et fasse directement des trucs mortels. » Immédiatement, il se redresse. « Pour l’instant, on est supérieurs au robot donc ça va, mais s’ils continuent à s’améliorer, ça peut devenir flippant. »