couple (1)

Dans les secrets de l'algo : les datas derrière votre prochain coup de foudre

Avec happn

Qui ne s’est jamais demandé comment étaient faits les algorithmes au cœur des applications de rencontre ? Alors que l’IA est le sujet le plus chaud du moment, happn nous emmène dans les coulisses et ouvre le capot. Modération, algorithmes de recommandation, modélisation des comportements… Allan Belliti, Manager data scientist au sein d’happn, vous dit tout.

L’ADN : L’algorithme de recommandation d’happn est-il un secret industriel aussi bien gardé que la recette du Coca-Cola ? 

Allan Belliti : Non ! Notre marque de fabrique, c’est la géolocalisation. Vous avez beaucoup plus de chance de voir quelqu’un que vous avez croisé et qui a l’application que d’être mis en relation grâce à l’algorithme de recommandation. En revanche, en plus de cette fonctionnalité centrale de la géolocalisation, il y a en effet un algorithme de recommandation : de la même manière que Netflix va suggérer des films, on va suggérer des profils qui pourraient plaire à l’utilisateur ou l’utilisatrice. 

La différence ? Puisque nous sommes une application de rencontre, il faut que le profil que l’on vous propose vous plaise, mais aussi que vous plaisiez au profil qu’on vous propose. L’interaction doit être bilatérale, ce qui est compliqué à mettre en place en termes de processus d’optimisation et d’algorithme. 

Quels critères sont pris en compte pour mettre en contact deux personnes ?  

Le critère de la géolocalisation primera toujours. Pour la partie recommandation, on analyse les intérêts de chaque utilisateur ou utilisatrice. Selon qui vous aimez, on observe si des utilisateur·rice·s ont des goûts similaires aux vôtres. Si c’est le cas, on s'appuie sur ce qu’ils aiment pour vous faire des recommandations.

Si on reprend l’exemple de Netflix, si Paul et Louis ont aimé les mêmes films, on peut considérer que les films que va voir Paul peuvent être recommandés à Louis. Bien sûr, il s’agit ici d’un exemple avec deux utilisateurs ; dans un modèle de recommandation on a un échantillon beaucoup plus large et le processus mathématique est beaucoup plus fin. 

Les aspects physiques des utilisateur·rice·s sont-ils modélisés ?

Le modèle de recommandation que nous utilisons ne prend pas du tout en compte les critères physiques. On ne veut pas juger des personnes sur leur physique et c’est le genre de modèle qui peut comporter des biais. En revanche, on travaille la qualité d’une photo. Par exemple, on fait la différence entre une photo devant un mur blanc et une photo où il y a un contexte qui permet d’en apprendre davantage sur le ou la célibataire. 

Les préférences physiques sont néanmoins indirectement modélisées par les intérêts. Par exemple, si un·e utilisateur·rice aime les hommes tatoués et crée ce genre d'interaction, on va par ricochet proposer aux utilisateur·rice·s dont les goûts sont similaires des hommes tatoués.

Comment nos comportements influencent-ils l’algorithme (par exemple, les personnes qui likent tout le monde versus celles qui sont très sélectives) ? 

Comme pour tout modèle, quelqu’un qui like à tout va, pose problème puisqu’on n’arrive pas à déceler ses goûts ou des attirances particulières. Il aura peut-être plus de choix, mais ils ne lui correspondront pas forcément. A contrario, si la personne est trop sélective, on a du mal à détecter d’autres personnes qui ont des goûts similaires. Son comportement est trop atypique.

ll n’est donc pas possible de dompter l’algorithme

Sur des plateformes comme YouTube ou Spotify, ça fait sens car il y a un choix immense. Chez happn, les limites géographiques - ça ne sert à rien de vous faire rencontrer quelqu’un dans un autre pays - vont limiter les interactions possibles entre les utilisateur·ice·s. Il est donc beaucoup plus difficile de le dompter. L’idéal est d’être honnête pour avoir davantage de chances d’avoir des recommandations optimales.

Comment fait-on le pont entre les comportements des utilisateur·rice·s, le fonctionnement mystérieux de l’amour et l’algorithme ? Les ingénieurs travaillent-ils avec des sociologues ?

On ne travaille pas avec des sociologues. Avec les différentes analyses, l’exploitation de la donnée, et nos connaissances personnelles, on s’est construit une bonne connaissance sur le sujet. Après 10 ans dans le monde du dating, nous devenons de véritables expert·e·s. On arrive à savoir quoi analyser, quoi faire, ou quelles choses améliorer.  

Les intérêts communs peuvent être indirectement liés. Si je fais beaucoup de randonnées, j’ai des chances d’aimer quelqu’un qui a la fibre écologique. Est-il possible de faire ces connexions ? 

C’est ce à quoi on tend grâce à l’IA générative. Ces modèles ont cette faculté à trouver des points communs beaucoup plus subtils. Avec les anciens modèles, il aurait été difficile de faire le rapprochement entre quelqu’un qui a gravi le Kilimanjaro et quelqu’un qui aime la marche. Les modèles d’IA génératifs comprennent ces choses là.

C’est-à-dire qu’avant il aurait fallu encoder ces liens alors qu’aujourd’hui ils se font de manière naturelle ? 

Oui. Mais même les encoder nécessitait d’avoir des modèles assez puissants. Aujourd’hui on a des résultats beaucoup plus puissants et pertinents. Les avancées de ces dernières années en matière de data science sont immenses.

Comment évitez-vous l’effet boite noire ?

Il faut imaginer que l’on fournit des données en entrée à un modèle, et ce modèle fournit des données en sortie. Ce sont les prédictions. L’effet boîte noire est le fait de ne pas comprendre pourquoi le modèle a fait telle prédiction. On voit les résultats mais on ne peut pas les expliquer. 

C’est quelque chose qui arrive beaucoup plus avec les nouveaux modèles. Cela crée notamment le risque d’avoir des biais et d’avoir des modèles qui vont à l’encontre des règles initiales.

Pour limiter cet effet, on va appliquer en amont du modèle des règles métier très strictes et ciblées, qui encadrent et orientent son fonctionnement. Notamment en excluant certaines données pouvant être considérées comme indésirables. 

Il y a un très gros effort d’analyse de résultat pour être sûr de bien les comprendre et repérer s’il y a des biais que nous n’avions pas envisagés. On travaille activement entre experts pour bien contrer cet effet. 

Ne faudrait-il pas expliquer ce fonctionnement de l’algorithme aux utilisateur·ices, voire leur donner un contrôle dessus ? Par exemple, indiquer que l’on souhaite davantage d’hommes intéressés par l’écologie ou le féminisme (ou les deux). 

Pourquoi pas. Mais c’est un sujet complexe qui peut créer des craintes. On peut aussi avoir des mauvaises interprétations. Les hommes ne comprennent pas forcément ce que vivent les femmes sur les applications, et vice versa. En ajoutant de la complexité, on peut créer encore plus d’incompréhensions. 

Finalement, les humains sont plus sujets aux biais que la machine… 

Nous avons tous de nombreux biais liés à notre éducation, notre culture, notre société… Les utilisateur•ices d’happn sont à l’image de la société - c’est ce qui rend tout cela intéressant !

Lorsqu’une personne rencontre l’amour, vous perdez un client. Est-ce un paradoxe qui est pris en compte dans l’algorithme ?

Non. Si quelqu’un part de l’application parce qu’il a trouvé l’amour, c’est une victoire pour nous. Si nous parvenons à créer une application où tout le monde rencontre l’amour, nous sommes les gagnants.

Peut-on encoder le coup de foudre ? 

A mon avis, non. Pour moi, le coup de foudre ne peut arriver qu’en se rencontrant physiquement. La façon de parler, d’être, le charme, la prestance sont autant de points indispensables du coup de foudre. Faire apparaître ça sur une application de rencontre est très dur, le modéliser ou le détecter à partir des données l’est encore plus. Par contre, en augmentant les possibilités de rencontres et de date, on multiplie les chances de coup de foudre. Mais on ne le remplace pas.  

Discutez en temps réel, anonymement et en privé, avec une autre personne inspirée par cet article.

Viens on en parle !
Universités d'été de l'économie de demain
commentaires

Participer à la conversation

Laisser un commentaire