Talkwalker à la recherche des fonctionnalités de veille de demain

L'intelligence artificielle est un des buzzwords du moment. Mais s'il n'est pas rare d'entendre parler d'ensembles d'apprentissage (« training sets ») et de réseaux neuronaux (« neural networks ») chez Talkwalker, l'IA reste encore méconnue du grand public.

Pourtant, comme Facebook, IBM et Google, nous nous intéressons de près à ce sujet passionnant. Bon nombre de nos prospects sont d'ailleurs surpris d'apprendre à quel point les fonctionnalités de Talkwalker reposent sur le « deep learning » et les réseaux neuronaux.  

Pour découvrir les bases de l'IA et comprendre pourquoi cette technologie est essentielle, j'ai discuté avec Benedikt Wilbertz, qui est en charge de l'apprentissage automatique et de la science des données chez Talkwalker et est titulaire d'un doctorat dans ce domaine.

Benedikt, partons du principe que je ne connais rien à l'informatique. Quelle est la différence entre l'intelligence artificielle, l'apprentissage automatique et le « deep learning » ?

Vous ne connaissez rien à l'informatique ? Ouh la la...

L'intelligence artificielle (ou IA pour les fans d'acronymes) désigne une machine qui reproduit les fonctions cognitives généralement associées au cerveau humain, comme l'apprentissage ou la résolution de problèmes. Ce concept date des années 60, quand les premiers modèles reposant sur des règles ont obtenu des résultats intégrant une part d'intelligence artificielle.

Intelligence Artificielle

Ce visuel décrit l'évolution de l'intelligence artificielle.
Crédit image : Michael Copeland/Nvidia

Par la suite, la puissance de calcul disponible pour résoudre des problèmes grâce à l'apprentissage statistique a augmenté. C'est là qu'est apparu le terme « apprentissage automatique ». Prenons un exemple. Vous voulez qu'un ordinateur soit capable de reconnaître le chiffre « 3 » manuscrit. Pour cela, il n'est pas nécessaire de dire à la machine à quoi ressemble un trois. Dans le cadre de son apprentissage, cette dernière s'appuie sur des algorithmes pour analyser de grands ensembles d'exemples manuscrits.

 En 2012, l'explosion de la puissance de calcul a donné un nouvel essor aux réseaux neuronaux artificiels. Enfin, le « deep learning » est une technique consistant à entraîner des architectures de réseaux similaires au cerveau humain avec toutes ses connexions en s'appuyant sur nos connaissances dans ce domaine.

Suivez les discussions autour de l'intelligence artificielle
sur les réseaux sociaux

 Si on prend l'exemple d'une photo de chat, comment est-ce que ça fonctionne ?

 Un réseau neuronal complexe commencerait par décomposer l'image, petit bout par petit bout, avant de s'intéresser progressivement aux traits plus généraux.

réseau neuronal

Les réseaux neuronaux profonds découpent l'information en morceaux
puis remontent progressivement les différentes couches jusqu'à 
ce qu'ils puissent obtenir une réponse à la question de départ.
Crédit image : Neuralnetworksanddeeplearning.

 En 2012, Geoff Hinton de l'université de Toronto et son équipe ont réussi à concevoir des réseaux neuronaux époustouflants, qui ont suscité un grand intérêt.

Et aujourd'hui, que ce soit avec Siri ou Google, nous recevons de plus en plus de recommandations générées par une intelligence artificielle. Si cette technique existe depuis les années 60, comment expliquer cet élan
tardif ?

 Du point de vue technologique, il s'agit d'une combinaison de plusieurs facteurs. Le traitement n'a jamais été aussi rapide et les processeurs graphiques essentiels à l'apprentissage sont de plus en plus puissants. De plus, grâce à la digitalisation, il est plus facile de créer de grands ensembles de données étiquetées, indispensables au « deep learning ».

 Pour obtenir des résultats de qualité, il faut entraîner les réseaux avec des centaines de milliers voire des millions d'images. Chaque jour, nous ajoutons 300 millions d'articles à la base de données de Talkwalker et notre technologie de reconnaissance d'images analyse plus de 100 millions d'images.

OK, je comprends. Mais quel est le lien entre IA et veille sociale ?

 La veille du web et des réseaux sociaux implique des défis de taille, qui étaient jusqu'à présent relevés par des humains. Par exemple, la plupart des spécialistes de la veille des médias sociaux emploient des programmeurs qui passent manuellement au crible les résultats de la journée pour évaluer un sentiment. Mais compte tenu de l'explosion des données sur Internet, il est rarement possible d'effectuer des tâches cognitives basiques sur des millions de documents ou d'images par jour. L'objectif est de concevoir une IA capable d'effectuer ces tâches aussi bien que les humains.

J'espère juste que votre équipe ne développera pas une IA capable de rédiger du contenu. Je n'ai pas envie de me retrouver au chômage... Comment Talkwalker a-t-elle réussi à se faire une place sur ce marché ?

Le nombre d'images partagées est la principale difficulté pour de nombreuses entreprises. Début 2016, nous avons lancé une fonction de reconnaissance d'images. Il s'agit de la première application de « deep learning » capable de reconnaître 30.000 marques et logos dans les images partagées sur les réseaux sociaux. Depuis, nous avons rapidement enrichi nos applications reposant sur l'IA en ajoutant des fonctions de détection du décor, des objets, du genre et de l'âge.

Le traitement du langage naturel est également une tendance que nous avons adoptée depuis le début. Ces derniers mois, nous avons réalisé de grandes avancées qui profiteront bientôt à l'ensemble de notre plateforme. Les marques ont besoin d'une grande précision pour effectuer une analyse du sentiment à partir de millions de résultats. C'est dans ce domaine que le « deep learning » nous permettra de passer à la vitesse supérieure l'année prochaine.

Parlons des ressources. Ne serait-il pas plus intéressant de faire appel à un prestataire d'envergure pour cela ? Pourquoi développons-nous une AI en interne ?

Maintenant c'est moi que vous voulez mettre au chômage ?

J'essaie de faire preuve d'ouverture...

Les coûts d'adaptation de cette technologie sont minimes et c'est là l'un de ses intérêts majeurs. J'ai déjà mentionné qu'il était très avantageux de pouvoir utiliser de grands ensembles de données gérés en interne. En les développant nous-mêmes, nous pouvons contrôler la précision de nos modèles directement dans nos systèmes de production. Au moindre problème de qualité, nous pouvons ré-entraîner immédiatement nos modèles. C'est la seule méthode garantissant de façon continue une qualité élevée et à notre niveau, il serait impossible pour un prestataire externe d'en faire autant.

Je suppose que cela doit entraîner quelques difficultés ?

Je dirais que nous sommes actuellement confrontés à trois défis. Tout d'abord, les applications reposent sur la technique de l'apprentissage supervisé, qui nécessite des ensembles d'apprentissage composés de millions d'instances étiquetées. Il est difficile d'établir ces ensembles de données, surtout compte tenu de nos exigences de qualité.

Ensuite, pour chaque problème, nous devons mettre en œuvre un algorithme spécifique. Sachant qu'on sait rarement à quoi ressemble le meilleur algorithme, je vous laisse imaginer l'ampleur de la tâche.

Enfin, chacune des étapes requiert une importante puissance de calcul. Les réseaux neuronaux ne peuvent être entraînés avec des ordinateurs classiques. Ils ont besoin de processeurs graphiques adaptés. Cela génère un certain nombre de défis liés au calcul de haute performance (« High Performance Computing »).

Comment évoluent les choses ? Pouvez-vous nous dire de quoi demain sera fait ?

Le boom de l'IA n'est pas anodin. Les technologies reposant sur l'apprentissage automatique font déjà partie de notre quotidien et cette tendance va perdurer. Des entreprises comme Google, Salesforce et Microsoft utilisent l'IA pour booster leurs produits. Au mois d'avril, Talkwalker a été sélectionné pour intégrer le programme NVIDIA Inception qui soutient des start-ups d'exception qui révolutionnent différents secteurs en s'appuyant sur l'IA et la science des données. C'est une opportunité fantastique pour nous et nous continuons à exploiter l'expertise de l'entreprise pour proposer de nouvelles fonctions et fonctionnalités.

En ce qui concerne la veille du web et des réseaux sociaux, dans le domaine du sentiment, la technologie va enfin être à la hauteur des promesses faites par certains fournisseurs depuis des années. D'autres domaines vont également être bouleversés, mais je ne peux pas en dire plus pour l'instant !

Merci, Benedikt ! Rendez-vous bientôt sur notre site pour aller plus loin.

Si vous souhaitez en savoir plus sur la technologie primée de reconnaissance d'images de Talkwalker, contactez l'un de nos consultants.

 

veille réseaux sociaux Talkwalker

Topics

Share it