Data 1st party : Ce que les médias devraient apprendre des GAFA.

Dépasser ses first party data pour mieux vendre de la publicité.

En acquérant CCM Benchmark au mois d’octobre 2015, le Groupe Figaro avait pour objectif de devenir le groupe digital leader en France, en terme de visites d’une part, avec 24 millions de visiteurs uniques mensuels, et de data d’autre part, en diversifiant ses données 1st party. Son alliance avec l’éditeur de sites communautaires lui permet, en effet, de récupérer un autre type de données first party, comme les logs des internautes sur les forums. Une belle promesse publicitaire.

Le groupe, à l’instar des autres médias en presse et en télévision, a pris conscience d’une nécessité nouvelle : la  qualification véritable de son audience. Ainsi, avec le passage du média planning à l’audience planning, et la généralisation des DMP chez les annonceurs, ces derniers sont devenus exigeants. Les médias ont une promesse à tenir : une audience qualitative, et donc qualifiée. Exit les abus des premières heures de la publicité en ligne, pour le moins en apparence ; les éditeurs de contenu jurent avoir réglé les soucis de visibilité, de brand safety, et de fraude.

La combinaison de la data 1st et 3rd party : « connaître les inconnus ».

Internet a permis aux éditeurs de récolter de nouvelles données 1st party, plus précises, grâce aux web analytics : les données nominatives pour les utilisateurs loggés, les données comportementales pour tout visiteur (temps passé sur le site, durées d’écoute ou de lecture, moments de « décrochage » de lecture ou de visionnage, etc), la géolocalisation. Néanmoins, pour pouvoir vendre de la publicité ciblée, cette donnée 1st party de l’éditeur ne suffit plus car, si elle permet d’analyser le trafic et les comportement en ligne des internautes, le pourcentage de personnes loggées en presse écrite ou en radio reste très faible, ce qui ne permet pas de les identifier précisément. C’est notamment la raison pour laquelle les plateformes de catch-up TV de chaînes comme M6 ou TF1 obligent désormais leurs utilisateurs à se créer un compte afin de visionner des contenus.

Il a donc fallu enrichir ces profils avec de la data 3rd party, vendue ou louée par des acteurs tiers. Celle-ci apporte un autre type d’information sur l’internaute anonyme qui arrive sur un site, grâce aux « traces » qu’il a laissé lors de sa navigation, hors du site. Les acteurs de la 3rd party data, tels que Weborama, collectent les données des cookies et des tags, afin de définir des profils d’audience.

La combinaison de la data 1st et 2nd party  – Mieux cibler le consommateur visé par l’annonceur grâce à ses données.

Afin de parfaire le ciblage publicitaire, un autre type de données est injecté dans les plateformes d’achat d’inventaire : la donnée 2nd party, c’est-à-dire les données du partenaire commercial. L’annonceur peut ainsi tenter de cibler précisément, chez le média, les profils de sa base de donnée. Le croisement de la data 2nd party (de l’annonceur) avec la data 1st party (de l’éditeur) permet donc d’améliorer la qualité et la valeur du ciblage publicitaire : ce n’est plus la quantité d’impressions délivrées qui est valorisée, mais la qualité du ciblage du prospect.

D’un point de vue publicitaire, les médias traditionnels s’emploient donc à rattraper leur retard sur la collecte de données en ligne et le ciblage publicitaire. En revanche, ils sont encore loin d’optimiser la valeur de cette data, notamment 1st party, en les mettant au service de leurs contenus.

Traiter ses datas au service du contenu également.

Collecter des données ne suffit pas, c’est leur traitement qui apporte de la valeur à la data. Les données collectées sur l’audience en ligne pourraient permettre aux médias de recréer des marques fortes en optimisant le contenu et le personnalisant pour chaque utilisateur. Utiliser la data à des fins uniquement publicitaires est un palliatif fragile à la baisse des revenus : si l’audience déserte les contenus, c’est également à terme la disparition du « temps de cerveau disponible » si cher aux annonceurs. Or pour l’instant, les DMP semblent avoir du mal à quitter les régies pour rejoindre également les rédactions.

Pour la majorité des éditeurs, les algorithmes de recommandation autour du contenu sont encore loin d’être une réalité à l’exception de Melty, premier groupe médias chez les jeunes. Son business modèle repose ainsi sur « Shape », son algorithme prédictif. Celui-ci permet au média en ligne d’anticiper les sujets qui plairont à l’audience et deviendront viraux. Il influence aussi bien le fond, en s’inspirant des requêtes Google des tranches d’âge concernées et en faisant évoluer l’article en fonction des comportement de lecture, que la forme, en conseillant la sémantique la plus à-même de faire remonter l’article dans les moteurs de recherche.

 C’est pour s’aligner avec Google News ou la recommandation du News Feed de Facebook que les éditeurs traditionnels cherchent, de plus en plus, à créer une page d’accueil évolutive et personnalisée. Le Washington Post, depuis son rachat par Jeff Bezos, utilise ainsi deux nouveaux outils pour renforcer son audience en ligne. D’une part, Bandito lui offre la possibilité de publier un article avec cinq titres, photos et traitements de l’histoire différents, arbitrés par un algorithme en fonction de la combinaison générant un engagement maximal du lecteur. D’autre part, Loxodo lui permet de mesurer son « lead » : la qualité perçue d’un article par rapport à ceux d’autres éditeurs, ou la réaction provoquée par une notification mobile.

En améliorant leur contenu grâce au traitement de la donnée, les « marques» média tels que Le Elle, les Échos ou le Figaro susciteraient une attention plus captive. Ce cercle vertueux autour de la data permet aussi une diversification : opérations spéciales, événements, location ou vente d’emailing à des entreprises partenaires. Néanmoins, l’utilisation de la 1st party data à des fins d’amélioration et de personnalisation des contenus n’est pas encore une réalité pour la majorité des éditeurs dits « traditionnels ». Ceux-ci se limitent encore à une valorisation publicitaire.

Les GAFA et NATU, très en avance sur le traitement des données.

Face à eux, des acteurs tels que Google ou Netflix ont construit leurs business model autour de la donnée 1st party. Ils n’excellent pas seulement dans le traitement de leur data, via des algorithmes auto-apprenant (deep learning et machine learning) et de recommandation qui permettent d’améliorer constamment l’expérience de l’utilisateur, ils ont également pris une longueur d’avance sur la quantité de données stockées. On pourrait presque évoquer un phénomène de « vinification » des datas, dans le sens où, Facebook, comme Google, a segmenté, croisé, fait « macérer » des données comportementales, émotionnelles, transactionnelles, contextuelles depuis dix ans.

Si les médias aujourd’hui, commencent à « profiler » leur base de données, la supériorité des GAFA[1] est donc incontestable en terme d’expérience dans la connaissance de leurs utilisateurs (consumer centric).

La vraie supériorité : avoir une donnée 1st party assez puissante pour se passer de la 3rd.

 Ces nouveaux acteurs ont donc dépassé la nécessité d’acquérir une donnée autre que leur 1st party data grâce à leur expérience son traitement. Des entreprises, telles que Netflix,  dont l’algorithme est devenu la proposition de valeur, peuvent se passer d’intermédiaires de la 3rd party en intégrant leurs outils à leur algorithme propriétaire.

Celui de Netflix développe ainsi de la 1st party data dès son premier contact avec son utilisateur : il se log dès le premier mois d’abonnement (gratuit sur le modèle freemium), ce qui permet à la plateforme d’associer précisément la donnée nominative et comportementale, affinitaire, émotionnelle ou transactionnelle. Si la data ne permet pas de produire des contenus originaux, elle guide les choix de production et leur suggestion au consommateur[2]. L’algorithme de recommandation se base sur les goûts et le profil du client ainsi que sur un système de filtrage à partir de profil similaire (look-alike). Netflix ne faisant que croître, ce modèle éditeur est devenu un best case, au regard de l’importance du traitement de la 1st party data.

En conclusion, la question n’est pas tant de se demander pourquoi aller au delà de la first party mais quelle sera sa nature, qui la possèdera et comment l’utiliser. La vraie bataille sera celle de la data, entre nouveaux détenteurs de la données (GAFA, FAI) et médias, qui en auront besoin tant pour orienter leurs contenus que pour les monétiser. L’importance d’aller au-delà de la 1st party data découle aussi de l’emprise des FAI sur cet actif naturel des médias.

 

[1] Google, Amazon, Facebook, Apple

[2] Pour se faire les programmes sont “taggés” et “séquencés” pour en déduire des dénominateurs communs à partir de facteurs tels que : le rythme de visionnage, le contenu de ces programmes ou le genre notamment.

Claire Manzano

Comments are closed here.