Recevez chaque semaine un article comme celui-là directement sur votre boite mail en vous abonnant (gratuitement) à La Lettre des Nouvelles Narrations.
Nous vivons dans un monde de données, de plus en plus quantifiable, mesurable. Open-data et big data sont déjà devenues des marronniers médiatiques qui plongent certains dans la perplexité, d’autres dans l’expectative optimiste d’un monde toujours mieux huilé, et les derniers dans une crainte profonde d’une atteinte à leur vie privée. Quelque soit votre avis sur la question, il est indéniable que donner du sens à cet océan d’informations est devenu une priorité pour ceux qui veulent comprendre et faire comprendre le monde.
Or la tâche est dantesque. Il faut déjà parvenir à collecter et identifier les données intéressantes, bien sûr, mais il faut également les contextualiser, les visualiser, les transmettre au public en évitant les abus, les déformations, les mauvaises interprétations. Ce qui importe finalement, ce n’est donc pas la donnée brute mais l’histoire qu’elle raconte et qu’elle permet de raconter. C’est pourquoi je suis allé à la rencontre de WeDoData, une agence créative dont la mission est de « faire parler les données ».
Par le passé, nous avions déjà remarqué quelques unes de leur production, comme Le Pariteur – une application qui permet de « changer le sexe de votre fiche de paie » et de voir quel serait votre salaire, à poste équivalent, si vous étiez de l’autre genre – ou encore Carbon Story – une expérience interactive qui raconte l’humanité à travers ses émissions de CO2, de la préhistoire à notre futur proche.
La donnée, partout
« Nous avons lancé WeDoData il y a un peu plus de six ans, quand la data était la nouvelle vague forte. Ce moment d’euphorie est passé » estime François Prosper, cofondateur de l’agence. « Aujourd’hui, nous sommes dans une phase de rationalisation de ce que la donnée peut apporter à un client, à un média. »
Il y a seulement quelques années, leur mission consistait parfois à construire des bases de données jusqu’alors inexistantes. Car pour beaucoup d’acteurs, il ne s’agissait absolument pas d’une source de valeur. Même s’il faut encore faire preuve de beaucoup de pédagogie, la situation s’est améliorée rapidement. « Les données sont plus accessibles et plus structurées qu’avant » selon Brice Terdjman, datadesigner. « Nous avons également plus d’outils et une large communauté qui s’entraide et partage des ressources. »
Chez les grands médias, clients historiques de WeDoData, beaucoup de compétences ont été internalisées. Des équipes de datajournalistes réalisent de façon autonome bon nombre de modules simples pour visualiser des données. Le travail des membres de WeDoData a donc dû évoluer pour « continuer à innover et ne pas se faire dépasser ». Et il reste beaucoup de chantiers d’envergure : « ce n’est pas parce qu’il y a davantage de données que les gens savent mieux les raconter » selon Brice. « Encore faut-il savoir par quel bout prendre un sujet. Nous gardons donc notre rôle de faire parler les données ! »
Les projets de WeDoData sont donc progressivement devenus plus ambitieux, intégrant de façon pionnière des technologies émergentes et les appliquant à leur mission de parler à l’oreille des données.
ExtraData, la réalité augmentée au service des données
La campagne présidentielle française est un temps fort de la consommation d’actualités alors les différents médias rivalisent à coup de dispositifs plus ou moins innovants. Alors que beaucoup relancent des projets de comparateurs de programmes électoraux et autres applications « classiques » en période électorale, WeDoData décide de développer en interne une solution plus novatrice, sans attendre une commande…
L’agence « observe les signaux faibles » comme le formule Brice Terdjman, les tendances émergentes dans les mondes de la technologie et de l’information. L’an dernier, elle s’investit dans la réalité augmentée. De cette envie est née ExtraPol, une application mobile permettant d’afficher des contenus en réalité augmentée lorsque vous pointez votre téléphone vers une affiche de campagne.
« Nous avons réalisé ce projet sur nos fonds propres » rappelle Brice, « avec un résultat qui nous semble bon puisque nous avons enregistré entre 30 000 et 40 000 scans d’affiches de campagne. »
Une belle réalisation en elle-même mais qui n’est en rien une finalité. ExtraPol n’était que la première étape d’un projet plus large, baptisé lui ExtraData.
Fort d’une dotation de la Digital News Initiative de Google et des enseignements tirés de cette première expérience, l’équipe développe désormais un véritable outil, permettant aux professionnels de construire eux-mêmes un projet similaire à ExtraPol. Avec une différence majeure : tout cela se fera sans application mobile. « Lorsque nous avons voulu aller vendre ce concept à des médias, ils nous ont dit « super… mais pas dans une application ». » Il leur faut donc parvenir à proposer une expérience similaire mais via le navigateur du téléphone. Un enjeu technique énorme pour l’équipe puisqu’une telle technologie n’existe pas vraiment ailleurs.
« Nous en sommes au stade de la R&D car nous voulons créer un véritable outil qui permettra à un client de paramétrer lui-même l’image qui est reconnue et le contenu qui s’affiche en réalité augmentée. » D’un projet de période électorale, ExtraData mue en un outil grâce auquel les professionnels peuvent créer de façon autonome des expériences de réalité augmenté ! Un beau défi à suivre.
DataNews, des bases de données à partir des dépêches AFP
Chaque jour, l’AFP publie 5 000 dépêches. Dans chacune se trouve des données, parfois exploitées par certains médias, parfois pleinement délaissées. Dans tous les cas, ces données ne sont pas consolidées dans des bases et plus le temps passe, plus il devient difficile de les exploiter.
Et WeDoData a un projet pour résoudre cela, DataNews, dont l’objet est « d’identifier des données et constituer des bases de données inédites qui risqueraient sinon de passer sous le radar ». A terme, l’ensemble des dépêches AFP sera scanné et les données extraites et classées automatiquement.
Pour réussir cela, WeDoData se repose sur des techniques de machine learning, c’est à dire sur des algorithmes qui vont apprendre à traiter de plus en plus finement cette foule de données. « Identifier le chiffre 97 dans une dépêche n’est pas difficile. Mais l’enjeu sera de reconnaître qu’il s’agisse d’un nombre de morts, que ces morts sont dus à un accident de la route, qui a eu lieu à tel endroit, à telle date, etc. »
Que vont ensuite devenir ces nombreuses bases de données ? L’horizon est ouvert… Si l’équipe de WeDoData a déjà quelques idées, il s’agit aussi de créer un outil de rêve pour les datajournalistes en inversant la « charge de la donnée ». D’ordinaire, il s’agit bien souvent d’aller chercher des données qui vont servir un sujet. Ici, ce sont les données saillantes qui peuvent inciter le journaliste à développer un sujet particulier.
« C’est vraiment ce que l’on appelle du data-driven journalism » pour François Prosper. Une méthode que met d’ores et déjà en pratique WeDoData au sujet de la présidence Macron avec leur projet au très long cours, ScreenGov. « La plupart des médias se réveillent tous les quatre ans et demi au moment de faire des bilans et essaient de remonter le fil d’un quinquennat » estime Nicolas Boeuf, développeur et journaliste. « De notre côté, nous avons choisi de tout collecter au fur et à mesure. »
Pendant cinq ans seront analysés l’ensemble des tweets des élus, les agendas du président et du premier ministre, les projets de lois votés à l’assemblée, etc. Cela leur permettra de disposer d’énormément de contenu en 2020, à l’heure des bilans, mais aussi d’exploiter des données au fil du temps. « Nous pouvons déjà, au bout de six mois, voir des angles émerger. Nous pouvons par exemple identifier les bons et mauvais élèves de l’assemblée, ceux qui ont voté le plus dans le sens de leur parti ou non. Nous avons des données qui nous permettent de savoir ceux qui sollicitent le plus d’audience auprès du président ou du premier ministre, ceux qui les citent le plus dans leur tweets… »
Un exemple de plus de la proactivité de cette équipe qui, loin d’attendre la commande, semble toujours vouloir la précéder.
La donnée n’est pas une finalité
Ce qui apparaît clairement lorsque l’on observe ces ambitieux projets, c’est que les données, les bases de données, ne sont pas en soi des innovations. Elles deviennent des constantes de notre monde, des évidences. En revanche, l’innovation réelle réside dans la lecture qui en est faite, ainsi que dans la manière de les collecter. A mesure que les bonnes pratiques s’établissent et que les outils se démocratisent, il devient de plus en plus urgent de se tourner vers les réalisations d’agences comme WeDoData, car c’est chez eux que se construisent les véritables moyens de comprendre notre monde.
Si cet article vous a été utile, jetez un oeil à mes livres sur les nouvelles narrations et rejoignez ma page Facebook pour davantage de contenus.