Publicité digitale : la révolution algorithmique

Marketing digital

Dossier : Marketing digitalMagazine N°746 Juin 2019

Par Charles MONZANI (2010)

La masse de données collectées en permanence dans le monde numérique permet de mesurer de façon très fine l’efficacité de la publicité digitale et ainsi de la piloter de façon optimale, en s’appuyant sur des algorithmes de plus en plus perfectionnés. L’industrie publicitaire s’en trouve transformée et de nouveaux acteurs y voient le jour.

Il y a toujours eu une affinité très forte entre publicité digitale et IA : la publicité digitale met à disposition relativement simplement une très grande quantité de données, il est donc possible d’itérer très rapidement et de tester différents modèles pour définir celui qui a le plus grand pouvoir prédictif. Enfin, dans le cas où un modèle diverge, le risque industriel est bien évidemment moindre que dans d’autres secteurs (comme la finance ou la santé) : on peut facilement rattraper quelques jours de contre-performance sur une campagne publicitaire qui s’étale sur plusieurs semaines ou plusieurs mois. Ce sont ces raisons qui font du secteur de la publicité digitale un champ d’expérimentation privilégié pour l’IA (et donc pour les centres de recherche comme le laboratoire informatique de l’École polytechnique – le LIX).

REPÈRES

Deux événements ont marqué la naissance de l’internet : la mise en open source du logiciel World Wide Web par Tim Berners-Lee au CERN en 1993 ; et la naissance en 1998 d’une start-up dont l’unique actif était un algorithme capable de révolutionner la manière dont on pouvait effectuer des recherches sur le Web. Les fondateurs de Google – la start-up en question – avaient déjà compris que les données – la data – allaient être le pétrole du XXI^e siècle et que les algorithmes et la puissance de calcul, le moyen d’exploiter cette nouvelle manne.

Machine learning et cloud computing

Quand on parle d’intelligence artificielle (IA) en 2019, nous faisons de fait référence à deux choses : d’un côté les algorithmes, ce qu’on appelle communément le machine learning et de l’autre la virtualisation / parallélisation des ressources informatiques, le cloud computing. Pour comprendre à quel point ces innovations sont en train de révolutionner notre monde, il suffit de regarder la courbe qui mesure l’évolution du coût du séquençage du génome humain : il était de 95 millions de dollars en 2002, il coûte moins de 1 000 dollars aujourd’hui. Cette évolution sans précédent de la puissance de calcul rend totalement obsolète la loi de Moore ; c’est ce rapport puissance / coût qui rend aujourd’hui possible le déploiement de la forme la plus aboutie du machine learning, le fameux deep learning, dans la plupart des industries, dont celle de la publicité et du marketing.

“La constitution du jeu
de données est aussi importante que le choix du modèle”

Trois familles d’algorithmes

Plus concrètement, quels sont les cas d’usage ? Comment les algorithmes sont utilisés dans la publicité digitale et le marketing ? Tout d’abord, il convient de rappeler qu’il existe trois grandes familles d’algorithmes de machine learning. Tout d’abord, ceux effectuant des classifications supervisées, c’est-à-dire qu’ils cherchent à prédire un événement identifié (le label) ; ils vont être particulièrement utiles pour optimiser le ciblage d’une campagne en fonction des performances constatées. D’autres algorithmes, dits de classification non supervisée (sans label prédéfini), vont permettre de segmenter automatiquement les utilisateurs d’un service ou une base de clients (« CRM ») bien au-delà des critères habituellement utilisés (sociologiques, démographiques, professionnels…) et donc de mieux identifier les cibles (voire les microcibles). Enfin, les algorithmes d’apprentissage par renforcement, qui reçoivent, à chaque décision prise par le modèle, un retour de leur environnement qui permet la mise à jour des paramètres et le choix de la prochaine décision. Cette approche est parfaitement adaptée au calcul itératif de l’allocation du budget dans un mix médias afin d’obtenir un meilleur retour sur investissement.

Ciblage en publicité digitale — © Andrey Popov

Trouver les bons jeux de données

Pour chacun de ces modèles, la constitution du jeu de données (dataset) est aussi importante que le choix du modèle. La découverte et l’ajout de nouvelles dimensions sont d’ailleurs au cœur de la problématique IA, c’est ce qu’on appelle le feature engineering, l’ajout dans un dataset de toute nouvelle donnée susceptible d’augmenter son pouvoir prédictif : dimensions temporelles, relations sociales, appétence pour tel ou tel produit ou tel ou tel contenu… Là où l’exercice devient vertueux, c’est que l’ajout de ces dimensions, en plus d’améliorer les performances du modèle, permet également de découvrir de nouveaux aperçus à très forte valeur ajoutée pour les directions marketing (une meilleure compréhension des combinaisons de dimensions qui infèrent un événement comme un acte d’achat pour un produit ou un service donné).

De solides sous-jacents mathématiques

Toutes ces approches algorithmiques reposent sur de solides sous-jacents mathématiques : régression logistique, statistique itérative comme la méthode des plus proches voisins ou celle des discriminants linéaires, arbre de décision, réseaux de neurones profonds ou deep learning. Le deep learning est à l’origine de la révolution en reconnaissance d’image avec une architecture basée sur l’empilement de fonctions élémentaires, notamment le réseau AlexNet, gagnant du concours ImageNet de 2012. C’est encore cette approche qui donne aujourd’hui les meilleurs résultats, grâce notamment à l’utilisation de réseaux de neurones récurrents à mémoire court terme / long terme qui sont des modèles capables de reconnaître des motifs dans des séquences de tailles variables. Ces modèles donnent des résultats tout à fait remarquables en analyse de texte (traduction automatique, auto-complétion de message…) et c’est l’état de l’art de ces mêmes modèles que l’on retrouve au cœur du projet AlphaGo qui a battu les meilleurs joueurs mondiaux de go après avoir simulé des dizaines de millions de parties. Demain, ce sont ces modèles qui contribueront collectivement au projet de voiture autonome (où interviennent la reconnaissance de l’environnement, l’apprentissage de la conduite, le trajet optimal…). Ces méthodes d’apprentissage profond ont apporté un regard radicalement nouveau et des solutions à une multitude de problèmes. Ce n’est donc pas surprenant de voir les trois pionniers du deep learning, Yann LeCun, Yoshua Bengio et Geoffrey Hinton, se voir attribuer collectivement cette année le prix Turing, la plus haute distinction en informatique.

Publicité sur différents supports — © Rasulov

Des gains d’efficacité allant jusqu’à 50 %

Ces approches appliquées à la publicité vont permettre de définir des indicateurs de performance plus objectifs (par exemple la mesure d’un incrément sur les ventes, sur l’engagement…). Depuis l’émergence de la publicité dans les années 50, il existe une plaisanterie bien connue sur Madison Avenue : « La moitié des sommes dépensées en publicité le sont en pure perte mais impossible de savoir de quelle moitié il s’agit. » L’ambition ici est précisément de faire mentir cet adage en permettant une compréhension beaucoup plus fine de la manière dont la valeur se crée pour une marque consécutivement à une exposition publicitaire et donc la possibilité réelle d’optimiser significativement tout indicateur de performance avec un gain qui avoisine souvent les 50 % et avec en plus d’énormes gains en termes de productivité des équipes opérationnelles (qui peuvent donc se concentrer sur la compréhesion de leurs métiers – business intelligence).

Une des conséquences fortes de cet état de fait est qu’il n’existe plus de véritable barrière entre le descriptif – les insights – et le prédictif – l’activation – : ce sont les mêmes modèles et les mêmes données qui nourrissent l’un et l’autre. Cela va induire de grands changements dans l’organisation de l’industrie publicitaire : évolution des profils avec notamment de plus en plus de profils quantitatifs, data analysts et data scientists, une prise de conscience de plus en plus aiguë des problématiques légales liées à l’utilisation de la donnée, au regard notamment de la protection de la vie privée aujourd’hui et de l’identité numérique demain. L’identification des utilisateurs sur leurs différents écrans et dans la durée devient un élément central de la problématique et c’est d’autant plus vrai avec l’arrivée de la 5G et de la délinéarisation de la télévision ¬ les téléviseurs vont devenir des smartphones avec des écrans de 42 pouces – évolution qui va complètement digitaliser l’achat d’espace roi, celui des spots TV. Cela va permettre d’atteindre le graal espéré par tous les publicitaires : la réconciliation du branding et de la performance, c’est-à-dire la possibilité de suivre les prospects et les clients sur une très longue période, de la création de notoriété pour la marque (le branding) jusqu’à la transaction finale (achat du bien ou du service proposé par cette marque, ce qu’on appelle traditionnellement en publicité la performance) avec une mesure objective de la valeur créée par la publicité tout au long de cette chaîne de valeur.

Délinéarisation

Ce terme désigne le passage à une télévision qui rompt avec le direct. Le téléspectateur devient l’acteur de sa consommation, en choisissant ce qu’il veut regarder, quand il le veut et où il le veut.

Une industrie en pleine mutation

Les GAFA ont bien anticipé tous ces mouvements et ils s’organisent pour équiper les différents acteurs en plateforme marketing et cloud à même de les aider à tirer parti de ce nouveau paradigme IA, dupliquant à cet effet un modèle qui a déjà fait ses preuves avec SAP et Salesforce (et en anticipant le changement de génération au niveau des responsables marketing – CMO – qui auront sans doute des profils plus scientifiques que leurs prédécesseurs).

Toutes ces transformations vont radicalement changer l’industrie de la publicité en ouvrant le marché à de nouveaux acteurs, les sociétés de conseil, qui voient dans cette plateformisation et ces approches quantitatives un moyen de vendre à leurs clients un nouveau type de prestations et même l’arrivée de nouveaux acteurs globaux, à l’image de S4 Capital de Sir Martin Sorrell qui veut créer « l’agence du futur », essentiellement positionnée autour de la problématique IA + Data.

Nous avons toujours eu en France un savoir-faire reconnu en matière de publicité et plus récemment en intelligence artificielle grâce à l’excellence de nos formations scientifiques. Il y a une opportunité historique pour notre pays (et pour l’Europe) de faire émerger de nouveaux acteurs à même d’aller conquérir le monde et de rivaliser demain avec leurs concurrents américains et chinois.

Alors soyons agiles et audacieux, ne ratons pas cette opportunité.

Pour en savoir plus sur la publicité digitale, consultez notre dossier sur le marketing digital