premium 1
premium 1 mobile
Game Over

On a trouvé le moyen de détrôner les Gafa

Le 25 oct. 2017

Rand Hindi, fondateur de Snips, l'affirme : la génération automatique de data artificielles fonctionne mieux que les data utilisateurs. Une révolution à suivre... de très près.

Snips a de l’ambition. La start-up française se donne dix ans pour mettre un assistant vocal dans tous les objets de la planète. Rien que ça. Et le compte à rebours a commencé début 2017 avec l’ouverture de sa plate-forme : snips.ai. En quelques clics, elle permet de programmer n’importe quel produit – une télévision, une voiture, ou une machine à café – afin qu’il puisse être activé à partir d’une demande exprimée en langage naturel. En lieu et place des boutons, des télécommandes et autres clés électroniques, nous pourrions bientôt nous contenter de commander : « Branche-moi sur la chaîne météo » ; « Verrouille les portes » ; « Un café serré, vite ! »… La chose est en soi intéressante, et de fait, l’accueil client a été excellent. Mais la valeur ajoutée de Snips va plus loin, beaucoup plus loin.
Pour lancer un assistant vocal, il faut maîtriser un certain nombre de technologies – la reconnaissance vocale évidemment, l’intelligence artificielle, le machine learning… Mais tout cela reste insuffisant. Pour faire tourner l’ensemble, il faut aussi de la data, beaucoup de data. Aucune machine à café ne sera foutue de faire le moindre expresso sur simple demande orale si elle n’a pas d’abord saisi les mille et une manières dont vous pourriez le lui commander. Or, contrairement aux GAFAM, Snips n’a aucune donnée pour entraîner ses algorithmes. Un handicap qui a obligé ses équipes à penser la question autrement. Privées de données utilisateurs, elles ont appris à générer de la donnée synthétique, et elles ont constaté qu’elles obtenaient ainsi non seulement plus de données, mais surtout une donnée de meilleure qualité. Étonnant ? Oui. Carrément révolutionnaire même. Et sans aucun doute un véritable avantage compétitif pour Snips. « Nous n’avons plus besoin d’attendre des mois que des utilisateurs puissent révéler les 100 000 façons de commander un café, l’algorithme d’apprentissage va simuler toutes les manières de le faire, pour pouvoir ensuite continuer de s’améliorer avec de vrais utilisateurs. Cela fait gagner un temps précieux », explique Rand Hindi, fondateur. Et du même coup, le système permet d’anticiper sur l’étape suivante. Car retranscrire du langage oral en langage informatique ne sert à rien si l’on doit, ensuite, reconnaître les termes discriminants et signifiants qui y apparaissent.
Rand Hindi

« Nous avons besoin de ce couple : comprendre la phrase prononcée par l’utilisateur, puis y détecter les éléments signifiants – longueur, sucre, température… Il faut pouvoir combiner les deux. C’est ça le véritable enjeu. Notre solution force la diversité, et les attributs à extraire sont connus. L’ensemble du processus devient donc automatisable. »

Et ça marche. Bien. Très bien. Beaucoup mieux même que les systèmes formés par des données utilisateurs.

Là où les assistants vocaux développés par Google, Facebook, Amazon, Microsoft ont des performances qui oscillent entre 69 et 73 % de réponses de qualité, celles de Snips montent à 93 %. Une performance déjà remarquable. Mais l’idée n’est pas juste d’être mieux, « notre but est de nous rapprocher de 100 %, tout simplement parce que l’on souhaite obtenir des solutions qui marchent. Or, 69 ou 73 %, ce n’est pas seulement moins que 93, c’est surtout loin de quelque chose qui marche. Aujourd’hui, les assistants vocaux tels que Siri ou Alexa sont encore jugés peu fiables. C’est une limite que nous voulons dépasser. »

La génération automatique de données est-elle la solution aux problèmes parfois insolubles dans lesquelles les Big data nous ont plongé ? « Dans les deux ou trois ans qui viennent, ce sera un sujet énorme. Je ne serais pas surpris que Google lui-même se mette à affirmer que la valeur de l’intelligence artificielle n’est plus la data, mais la génération de data. En termes de performance, c’est strictement meilleur. Il n’existe aucune raison de ne pas le faire. »

Et c’est une bonne nouvelle. Cela pourrait permettre de redistribuer les cartes. Il n’aura échappé à personne que les géants du Net occupent sur le marché de la data une position très largement dominante qu’ils ont su monnayer âprement au détriment souvent de leurs clients. Avec l’appétit déclaré de l’intelligence artificielle pour les données, on pouvait craindre qu’ils trouvent là une nouvelle matière à domination. La génération automatique de données pourrait donner aux entreprises une formidable opportunité de garder sur leurs projets d’assistants vocaux une souveraineté qu’ils ont trop souvent bradée sur d’autres chantiers numériques. Une très, très bonne nouvelle on vous dit !

 


Cet article est paru dans la revue 12 de L’ADN : Ordre et Chaos. A commander ici.


 

Commentaires
  • Sauf que les GAFA utilisent DEJA les data artificielles en plus des data utilisateurs : Exemple machine learning chez Google : AlphaGo Zero qui progresse toute seule...

  • Sauf que les GAFA utilisent DEJA les data artificielles en plus des data utilisateurs : Exemple machine learning chez Google : AlphaGo Zero qui progresse toute seule...

  • Ceci est certes intéressant mais Google pour ne citer que lui le fait deja avec AlPHAGO ZERO. D'autant plus que le titre de l'article qui utilise le mot détrôner n'est pas approprié, à mon goût. Bon courage à lui quand même 🙂

  • Ceci est certes intéressant mais Google pour ne citer que lui le fait deja avec AlPHAGO ZERO. D'autant plus que le titre de l'article qui utilise le mot détrôner n'est pas approprié, à mon goût. Bon courage à lui quand même 🙂

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.