habillage
premium1
premium1
Jeune femme, les yeux fermés, sourir aux lèvres, la main sur son oreille dotée d'un écouteur
© Jackson Simmer via Unsplash

Podcast, Clubhouse, streaming... Pourquoi n'avons-nous d'yeux que pour le son ?

Le 19 mai 2021

Source d’inspiration pour les créateurs, medium authentique selon les auditeurs, manne économique pour les plateformes…, le son retrouve ses lettres de noblesse. Pour Ircam Amplify, qui travaille sur des applications concrètes à destination des marques, c’est « un terrain de jeu immense », dont les usages et les technologies sont aujourd’hui décuplés. 

En 2020, difficile d’être passé à côté de la vague audio symbolisée par le réseau social vocal Clubhouse, et avant lui par l’explosion des podcasts et du streaming musical. Vecteur de lien social durant la pandémie, le médium plaît pour sa spontanéité et son usage fluide en mode « mains libres ». 

L’explosion du son

Il faut dire qu’entre les tweets qui assaillent et les vidéos qui agressent, on a surtout besoin de parler et de s’entendre parler, et pour le coup sans aboyer. La preuve, plus de 96% des internautes écoutent chaque mois un contenu audio (Médiamétrie) et pas moins de 70 applications « social audio » ont été créées, dont une majorité ces deux dernières années, rapporte une étude du blog In Bed With Tech.

Du côté des grandes plateformes, « l’effet Clubhouse » a fait des petits. Twitter vient officiellement de lancer Spaces, sa plateforme audio, aux utilisateurs de plus de 600 abonnés. En observant la progression de nos échanges vocaux sur WhatsApp et Messenger, Facebook a aussi investi dans une gamme de technologies, avec l'objectif de rendre l’usage de la voix toujours plus naturel et immersif

Et ce ne sont pas les innovations qui manquent autour de ces nouveaux échanges audio. Entre l’intelligence artificielle et le développement des voix de synthèse, les techniques de spatialisation du son et les expériences sonores et créatives toujours plus immersives, toutes participent à la création d’un web de plus en plus « ambiant ».

La voix retrouve une place qu’elle avait perdue avec le clavier et le tactile.

À Paris, de la recherche expérimentale sous nos pieds

Un constat que l’IRCAM, prestigieux institut de recherche et de coordination acoustique/musique, est l’un des premiers à avoir fait. Dans les entrailles de Paris, sous la place Stravinsky où trône la fontaine Niki de Saint Phalle, chercheurs, créateurs et ingénieurs s’activent et travaillent sur les innovations sonores de demain. Ils œuvrent, depuis près de 40 ans, à la création d’environnements audio expérimentaux : pour les artistes d’abord, qui peuvent donner vie à leurs rêves sonores les plus fous, et aujourd’hui pour les marques avec la filiale Ircam Amplify, lancée en 2019 par son directeur Frank Madlener. 

Ici, les salles sont insonorisées et dotées de hublots pour que l’on puisse zieuter les expériences en cours sans déranger. On y descend en silence, comme dans un sous-marin. À quelques mètres sous le sol, studios et labos de recherche se suivent en enfilade. Ils sont montés sur vérin pour que tout soit parfaitement hermétique aux rumeurs et aux mouvements de la ville. D’ailleurs, tout le monde chuchote et fait attention à son niveau de voix, car pour créer des expériences sonores, il faut du silence, nous dit-on. Dans le fond d’une chambre anéchoïque, une pièce sans écho utile pour toutes sortes de mesures acoustiques, on se dit que la visite a un sacré goût d’actu. 

Pour Nathalie Birocheau, directrice d’Ircam Amplify, ce retour au plus ancien de nos modes de communication n’est pas étonnant. « L'ouïe est un sens incroyablement puissant, plus puissant que la vue. Il renvoie à des effets physiologiques, psychologiques et cognitifs, à ce que vous avez vécu dans votre vie, à l’imaginaire surtout. C’est un sens universel qui touche presque tout le monde de la même manière. » Celle qui travaille à la commercialisation des innovations audio de l’IRCAM dans les domaines du luxe, du retail, des objets connectés ou encore de l’automobile évoque trois raisons principales à cet engouement. 

« La technologie va très vite. Du niveau d’intégration informatique à la bande passante en passant par la puissance de calcul et le machine learning, elle offre énormément de potentialités. D’autre part, on a aujourd’hui affaire à une génération qui n’échange plus qu’en chat vocal. Les interfaces entre l’Homme et la machine mutent et la voix retrouve une place qu’elle avait perdue avec le clavier et le tactile. Enfin, le son est un medium léger, facile à produire et à transporter. C’est un terrain de jeu immense avec un ROI fort et des usages décuplés. »

Avec un contrôle total sur leur voix et son utilisation, tout influenceur, personnalité ou célébrité peut littéralement être à plusieurs endroits à la fois.

Les marques tendent l’oreille

Pas étonnant que les marques s’y intéressent, donc. Souvent, c’est dans l’optique de personnaliser et rendre plus immersive l’expérience de leurs clients, en particulier quand ces derniers n’achètent plus que sur écrans. Avec la filiale de l’IRCAM, L’Oréal a récemment expérimenté un parfum qui s’écoute grâce à un nuancier capable de transposer différentes typologies d’odeurs en sons. Pour faire connaître ses vins de parcelles, la marque de champagne Krug a, elle aussi, fait appel à ses chercheurs pour composer une dizaine de paysages sonores exprimant leurs nuances et subtilités. Une façon plus inventive et moins intrusive de faire de la publicité pour un produit, à mi-chemin entre posts sponsorisés mal ciblés et vidéos invasives. 

Mais ce type d’expérience de marque n’est que la partie visible de l’iceberg et d’autres modalités et innovations sonores sont à surveiller de près. Dans les couloirs de l’IRCAM, la suite de la visite vire rapidement du côté des voix de synthèse, cette technologie qui permet de simuler des paroles et de la voix humaines par ordinateur et qui accompagne déjà notre quotidien. Des smartphones aux assistants vocaux en passant par les véhicules ou les centres d’appels automatisés, la voix artificielle est devenue un mode d’interaction privilégié entre l’humain et la machine et permet d'en fluidifier les rapports. Au rayon des chatbots et de l’expérience client, on s’intéresse depuis longtemps à la capacité d’une machine à s’adapter à l’intonation et aux émotions d’interlocuteurs humains, en bref, à faire preuve d’empathie.

Demain, la voix pourrait même devenir un produit à monétiser. Aujourd’hui, des entreprises proposent déjà de créer des enregistrements de synthèse sur la base de voix humaines préexistantes. C’est le cas de Jukebox, un algorithme lancé en mai 2020 par OpenAI capable de recréer la voix de musiciens décédés, ou encore de la société californienne Veritone qui vient de lancer Marvel.ai. La plateforme, qui permet à quiconque de créer et partager des voix de synthèse personnalisées en différents genres, langues, dialectes ou accents, pourrait bouleverser la manière dont marques et influenceurs gèrent leurs projets. « Avec un contrôle total sur leur voix et son utilisation, tout influenceur, personnalité ou célébrité peut littéralement être à plusieurs endroits à la fois », promet la plateforme. De quoi leur permettre « de multiplier le nombre de projets, de parrainages et de partenariats qu'ils font au cours d'une année. »

Autre challenge, et pas des moindres pour les marques ? Réussir à s’insérer dans des environnements sonores de plus en plus personnalisés, des nouvelles applications audio aux plateformes de streaming et de podcasts par exemple. Car demain, les technologies sonores accompagneront les auditeurs, de leur jogging du matin jusqu’au dîner, tout en s’adaptant à leur environnement, voire à leur état émotionnel, professe l’IRCAM. Expériences sonores, interfaces vocales, data et personnalisation à l’écoute… C’est bien toute la chaîne de valeur du son qui est concernée !

Margaux Dussert - Le 19 mai 2021
premium2
premium2

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.