L’Intelligence artificielle (IA) et la Création musicale – par Greco Casadesus, compositeur.

Actualités L’Intelligence artificielle (IA) et la Création musicale – par Greco Casadesus, compositeur. Voici l’extrait d’un article paru dans « Les Échos » en 1996 : Plus l’œuvre mise à disposition est segmentée, plus l’accès à cette fragmentation autorise une ré-ordination dans laquelle le droit moral ne peut être respecté, et ceci tout simplement parce que l’artiste n’a plus aucun moyen physique d’exiger l’intégrité de son œuvre. L’informatique, outil fabuleux, par le biais d’intelligences artificielles de plus en plus affinées, se substitue à l’esprit de conception, à l’âme et à la notion d’originalité qu’elle bafoue en la mystifiant. Lorsque j’ai écrit ces lignes voici vingt-huit ans[1], je n’imaginais pas que l’IA prendrait sa place de façon aussi exponentielle. Certes, certains outils de l’époque – que j’appelle la lutherie électronique (les synthés, les ordinateurs, en bref la place croissante de l’électronique dans l’élaboration des musiques) – m’indiquaient qu’une conflagration allait manifestement se produire, mais il m’était impossible de prévoir une période d’aboutissement. Aujourd’hui, c’est avéré : l’IA s’est immiscée dans nos vies, dans nos textes et dans nos musiques, de façon aussi insidieuse que fulgurante ! En 2006, lors d’un nouvel écrit[2], j’avais bien pris conscience qu’une prolifération des créateurs s’annonçait, que l’œuvre et son ersatz allaient se confondre dans un amalgame organisé par des réseaux de l’industrie technomusicale ayant flairé un marché prometteur et foisonnant. Nous y sommes ! Certes, l’IA générative (et non créative…) n’est qu’un outil analytique à la puissance de calcul incroyablement rapide ; mais elle n’a pas de conscience, elle ne doute pas et ne sait pas se remettre en cause. Donc, a priori, elle ne peut pas avoir d’intuition, donc d’imagination, en tous les cas comme un humain. Il n’y a pas longtemps, on se moquait des piètres résultats musicaux de l’IA ; mais chaque jour, ceux-ci sont de plus en plus bluffants, ce qui bouleverse nos repères. Et cette évolution est galopante ! L’audiovisuel : un domaine impacté. Le domaine de l’audiovisuel sera très largement impacté. L’état de crise s’accentuera avec d’un côté, en petits nombres, les créatrices et créateurs éminents, influents, bankables, demandés pour des raisons de qualité, de sensibilité et de marketing. Ils seront approchés par des productions soucieuses de préserver et d’appliquer certaines valeurs fondamentales. Et pour les autres, très nombreux, une véritable compétition avec l’IA a déjà commencé ! Des équipes de réalisation vont préférer l’immédiateté, les coûts réduits, le dialogue avec les machines plutôt qu’avec des humains, machines auxquelles on lancera  des requêtes illimitées… Dans un premier temps, ces productions concerneront des ambiances musicales et sonores plutôt que de belles envolées lyriques et enivrantes. Je mentionne « sonores », car il n’y a aucune raison que le domaine des bruitages et autres effets ne soient pas concernés. Les principales caractéristiques d’une séquence d’images seront analysées et rapprochées des bases d’entraînement : le rythme du montage, l’expression faciale et corporelle des acteurs, le déplacement des objets, les variations de couleurs, les mouvements de caméra, la bande-son, etc. Les requêtes concerneront de nombreux critères : les sentiments à transmettre, le tempo, les couleurs et styles musicaux, mais aussi les césures souhaitées ou tout élément intentionnel ou aléatoire… Insatisfait, le réalisateur (ou tout autre membre de l’équipe) pourra reformuler des requêtes illimitées. Puis, en cas de validation, se posera la délicate question de la paternité et les droits susceptibles de découler de cette manipulation… Cette analyse s’applique bien entendu au sous-titrageet au doublage. Le premier se voit déjà largement remplacé par des propositions automatiques dont les résultats ne sont pas toujours convaincants ; donc, afin d’introduire certaines subtilités absentes concernant le sens du message ou les tournures de phrases, le texte est revisité par des professionnels dont la marge de manœuvre, on le comprendra, est plutôt réduite. Mais l’IA apprend en permanence et progresse très très vite… Quant au second, la modélisation (le clonage augmenté) va mettre à mal une économie presque centenaire. Associer à une voix quelconque le timbre (la caractéristique sonore) d’une autre voix (une chanteuse, un comédien ou un politicien) est désormais à portée de tous. Les manipulations malintentionnées (deep fake) sont déjà nombreuses.Ces techniques évoluent très rapidement et l’on peut imaginer dans un avenir plus ou moins proche la voix clonée de Tom Cruise (par exemple) s’exprimanten français, danois ou espagnol, avec ses inflexions originelles associées à une parfaite synchronisation des labiales. La stratégie du producteur ou du diffuseur appliquant ou non la méthode humaine sera déterminante pour préserver le droit et la rémunération de beaucoup de professionnels du doublage. Mais revenons à la musique : je vois au moins trois domaines que l’IA va investir amplement. Générer des idées. À l’origine du message préexiste l’idée. Chez l’humain, du moins. Pas d’idées, manque d’idée ? Pas de problème ! Je joue ou je chante deux notes, et je fais référence à un style ou un échantillon : j’obtiens alors de nombreuses propositions de mélodiesassociées à des accords en cohérence avec les règles de l’harmonie et de l’orchestration (il serait temps…) Ces propositions seront associées àdes sonorités adaptées offertes par les gigantesques librairies d’instruments virtuels désormais pilotées par leur propre IA. Je rappelle que les instruments virtuels sont des générateurs sonores qui, soit imitent les vrais instruments avec un réalisme de plus en plus convaincant, soit inventent des sonorités inconnues. La MAO (Musique Assistée par Ordinateur) va devenir une MAIA (Musique assistée par l’Intelligence Artificielle). La modélisation & la transformation des timbres. Nous venons de l’évoquer dans la partie doublage, ressusciter la voix d’un artiste disparu (ou pas) pour l’adapter à un univers musical contemporain (ou le contraire) sera courant. Le musicochimérisme. Dans la mythologie grecque, la chimère est une créature fantastique ayant une tête de lion, un corps de chèvre et une queue de serpent, qui crachait le feu et dévorait les humains. Le musicochimérisme procède du même principe, mais ne dévore pas encore les humains… En déconstruisant nos fichiers audio pour s’approprier la signature sonore de nos œuvres afin de la redistribuer lors de montages complexes dénaturant l’œuvre originale, de nouvelles esthétiques vont apparaître et bouleverser notre secteur. Par exemple, après s’être accaparé les caractéristiques stylistiques d’un Avicii, d’un Ravel et d’un Duke Ellington, l’IA sera capable de produire