Une histoire de la dataviz

Quels étaient les ancêtres de nos visualisations actuelles ? Et comment ont-elles évolué jusqu''aux applications interactives qui nous entourent maintenant ?

page.alt

Une histoire de la dataviz

Les données sont aujourd’hui partout, et tout le monde veut les représenter. Les entreprises se basent sur leurs données pour prendre leurs décisions. Les équipes marketing améliorent la qualité de leurs campagnes grâce aux données. Les journalistes s’appuyent sur des enquêtes ou des données publiques pour vérifier les dires des politiques ou plus généralement décrire notre société. Bref, la dataviz a le vent en poupe.

Ce n’est pourtant pas nouveau ! Les premières cartographies des étoiles datent d’il y a plus de 16 000 ans, et certains graphiques représentent des données déjà complexes depuis le Moyen-Âge - comme l’arbre de Jessé, visible dans l’image ci-dessus.

Au final, nos visualisations actuelles sont-elles si différentes de celles d’hier ?


Les précurseurs

Les usages de la dataviz sont déjà variés dès le XIXe siècle, même sans le panel de techniques de représentation graphique des données dont nous disposons aujourd’hui.

nightingale Source : Wikimedia

En 1858, Florence Nightingale, infirmière britannique, rend compte à la reine Victoria des causes de mortalité de ses soldats engagés en guerre de Crimée, à l'aide de ce graphique. Celui-ci met bien en évidence une épidémie (en bleu) qui a été bien plus meurtrière que les blessures au combat (en rose) ou toute autre cause (en noir).

minard Source : Wikipedia

Ici, Charles Joseph Minard, ingénieur civil français, représente les pertes colossales de l'armée française dans la campagne de Russie au début du XIXe siècle. Cette fameuse carte de flux raconte l'histoire de cette armée, qui arrive à Moscou avec moins d'un quart de son effectif de départ, avant de se faire à nouveau décimer sur le voyage du retour.

beck Source : Wikipedia

Au début du XXe siècle, Harry Beck, dessinateur technique britannique, créé la première carte diagrammatique du métro de Londres. Il choisit une représentation moins proche de la réalité pour simplifier la carte et en augmenter la lisibilité. Elle est très bien reçue et est diffusée au grand public dès 1931.

Au final, l’utilisation de la dataviz pour le reporting, le storytelling ou encore la communication ne datent pas d’hier ! Mais si les usages n’ont pas tant évolué, les outils et méthodes ont quant à eux convergé vers quelque chose de plus construit qu’à l’époque.


La naissance d’une discipline

playfair Source : Wikimedia

William Playfair est l'un des pionniers de la visualisation de données moderne. Cet ingénieur et économiste écossais invente à la fin du XVIIIe siècle trois graphiques simples et encore très utilisés : l'histogramme (ancêtre du bar-chart), le diagramme circulaire (ou pie-chart) et la série temporelle.

En 1967, le cartographe français Jacques Bertin élabore les bases du langage graphique que l’on utilise aujourd’hui pour créer des visualisations dans son ouvrage Sémiologie Graphique. Il décrit les variables graphiques, c’est à dire tous les éléments que l’on peut modifier dans les graphiques pour représenter l’information, telles que la couleur, la taille, ou encore la surface des formes qui composent les visualisations.

Edward Tufte, professeur renommé de statistiques, publie en 1983 son livre The Visual Display of Quantitative Information dans lequel il explore plus précisément ce qui différencie une bonne visualisation d’une mauvaise et comment les améliorer en supprimant par exemple les éléments graphiques superflus.

Aujourd’hui encore, d’autres auteurs continuent à faire avancer la discipline, tel que Ben Shneiderman qui a inventé le Treemap dans les années 1990, ou encore Stephen Few, dont l’ouvrage Information Dashboard Design est une référence dans la conception des tableaux de bord.

Ce sont ces acteurs (et beaucoup d’autres) qui nous permettent aujourd’hui de comparer les visualisations de données pour pouvoir choisir ou concevoir les graphiques les plus adaptés à l’information à représenter.


La révolution numérique

Les avancées dans cette discipline se font en parallèle de l’explosion du besoin : on estime qu’en 2020, environ 1,7 mégaoctet d’information sera produit chaque seconde par individu sur la planète. Et le numérique a aussi transformé la manière de représenter l’information, en passant des supports papiers aux applications interactives !

nyt Source : New York Times

Une équipe du New York Times se consacre entièrement aux visualisations de données. Elle publie en 2015 cette courbe en 3 dimensions pour « prédire l'économie du futur ». Cette page illustre bien l'apport du support interactif pour servir une histoire : sur un écran unique, l'utilisateur peut observer différentes vues des mêmes données, vues illustrées par l'analyse des auteurs. La même représentation dans un journal aurait certainement nécessité plusieurs pages ou des coupes dans l'information.

bloomberg Source : Bloomberg

Si la dataviz précédente mettait en évidence l'apport de l'interactivité pour la manipulation des visualisations des données, elle permet aussi la manipulation des données elles-mêmes. Requêter des grandes bases de données directement depuis le navigateur web donne à l'utilisateur la possibilité de questionner ses données. Un exemple est la page web de Bloomberg pour explorer leurs données sur les milliardaires dans le monde. L'utilisateur peut choisir la donnée à observer et la manière de le faire pour poser les questions qu'il souhaite.


De nouveaux enjeux

Beaucoup de choses sont encore testées ou à développer, comme la réalité augmentée ou le motion design.

Finalement, les nouveaux outils, comme Raw, permettent la création de bonnes dataviz, sans compétence technique. Cela donne une plus grande automomie aux analystes, premiers utilisateurs de la visualisation de données.

La dataviz deviendrait-elle le meilleur moyen de manipuler et d’explorer les données ?