hackersmartphone

Une I.A. capable de reproduire les voix

Une API capable de reproduire avec exactitude la voix de n’importe qui ? C’est ce que propose Lyrebird : des perspectives redoutables et inquiétantes…

Fin d’année 2016, L’ADN avait mis en exergue la startup Loom.ai et son programme capable de créer des avatars incroyablement réalistes à partir d’une simple image fixe, une photo. Une fonctionnalité déjà inquiétante et d’autant plus avec toutes les nouvelles qui arrivent et pourraient s’y accoler. C’est le cas notamment de Lyrebird une API capable de copier n’importe quelle voix à partir d'un échantillon audio de quelques dizaines de secondes seulement et de lui faire ensuite lire n'importe quel texte, avec l’émotion de son choix. De plus, cette clé est suffisamment robuste pour apprendre à partir d'enregistrements bruyants.

Cet algorithme d’imitation de voix vient d’être dévoilé à Montréal. Des exemples utilisant les voix de Donald Trump, Barack Obama ou Hillary Clinton disponibles sur le site internet lyrebird.ai illustrent l’efficacité de la technologie. « Ses champs d’applications sont vastes et variés: assistants personnels, lecture de livres audio avec des voix connues, objets connectés en tout genre, synthèse de voix pour personnes en situation de handicap, studios de films et de jeux vidéo, etc. » , précise le site dédié.

A qui s’adresse cette technologie ? Aux entreprises et développeurs de nouveaux outils de synthèse de la parole, précise Lyrebird qui pourront notamment générer des dialogues entiers dans une voix de leur choix ou synthétiser de nouvelles voix créées de toutes pièces.

Une question se pose : comment s’assurer que l’API ne tombe dans de mauvaises mains pour commettre des actions frauduleuses. Lyrebird a déjà prévu la réponse : « Les enregistrements audio sont souvent utilisés comme pièces à conviction dans de nombreux pays. Notre technologie pose la question de leur manipulation aux fins de contrefaction ou d’usurpation d’identité. Cela peut avoir des conséquences dangereuses, par exemple en diplomatie ou pour des actes de fraude, et plus généralement dans tout autre cas d’usurpation d’identité. En révélant l’existence de cette technologie et en la rendant disponible, nous souhaitons conjurer l’apparition de tels risques. Nous espérons que le public prendra conscience qu’imiter une voix est devenu possible et que cela doit relativiser à l’avenir la valeur de preuve accordée aux enregistrements audio.

Suffisamment convaincant ? Pas sûr. Lyrebird a déjà réussi à faire dire n’importe quoi à Donald Trump, Barack Obama et Hillary Clinton par le biais de voix artificielles.

A noter que Lyrebird s’appuie sur des modèles d’apprentissage profond développés au laboratoire du MILA de l’Université de Montréal, où ses trois fondateurs sont doctorants : Alexandre de Brébisson, Jose Sotelo et Kundan Kumar. La startup est conseillée par trois des professeurs les plus prolifiques dans le domaine de l’intelligence artificielle: Pascal Vincent, Aaron Courville et Yoshua Bengio. Ce dernier, directeur du MILA et pionnier de l’intelligence artificielle, souhaite faire de Montréal une capitale mondiale de l’intelligence artificielle et cette nouvelle startup s’inscrit dans cette vision.

premium2
commentaires

Participer à la conversation

  1. Onepock dit :

    Après lecture j'étais très enthousiaste. Après écoute, je me dis qu'il leur reste du taf pour qu'on oublie la base robotisée.
    On a encore quelques années devant nous.

  2. Frét dit :

    Là, on parle d'une start up ...( budget limité, etc) si elle est rachetée par un : google, fb ,ou autre il lui faudra quelques mois !!!

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.