Le mot de la semaine : Data discovery

Data discovery définition | Découverte des données.

page.alt
  • data discovery
  • business intelligence
  • analyse

Le mot de la semaine : Data discovery

Matlo déchiffre pour vous un mot lié à l’univers des datas chaque semaine. Découvrez le sens caché des données. Aujourd’hui, la data discovery.


Une méthode d’analyse des données

La data discovery, ou découverte des données en français, est une méthode d’analyse des données centrée sur l’utilisateur. Elle facilite l’interprétation des données brutes par des individus sans compétence technique en analyse de données grâce à des outils intuitifs. Les professionnels adeptes de la data discovery extraient des données de sources variées et les représentent graphiquement pour révéler rapidement des tendances ou anomalies. La data visualisation interactive fait donc partie des outils incontournables de la data discovery pour la phase d’analyse.

Schéma data discovery Processus d'analyse de données avec un outil de data discovery


La BI moderne

La data discovery est ultérieure à la business intelligence (BI pour les intimes). Dans l’informatique décisionnelle traditionnelle, le data scientist délivre ses analyses via des méthodes de traitement informatisées comme la création de requêtes complexes ou d’algorithmes. Pour répondre à la question posée par le métier, le data analyst doit continuellement affiner sa recherche avec une réactivité de réponse difficile à assurer.

La data discovery naît d’une volonté de se soustraire à ces aller-retours chronophages et va au-delà du simple reporting ou contrôle de performance. Les métiers peuvent maintenant répondre à leurs questions en explorant eux-mêmes leurs données. Le data scientist se concentre alors sur la préparation et le traitement des données sans pour autant abandonner ses compétences avancées d’analyse, nécessaires pour répondre aux questions très complexes des métiers. Il a alors recours aux calculs statistiques ou à l’optimisation mathématique par exemple.


Découverte des données : une tendance à la hausse

Les outils de découverte de données sont de plus en plus plébiscités selon le suivi des tendances BI mené par le groupe de conseil et analyse en solutions logicielles CXP en 2017. Le nombre d’utilisateurs de data discovery a augmenté de 18 % en 4 ans. En 2016, 58 % des sondés l’utilisent déjà et 21 % planifient son usage. Le marché pèserait 1,1 milliard de dollars d’ici 2019 selon une étude Gartner (Forecast Snapshot : Smart Data Discovery, Worldwide, 2016). Pour répondre à l’évolution des usages des métiers, les outils de data discovery se dotent aujourd’hui de versions mobiles.

Interface de data discovery Interface de data discovery


Avantage et inconvénients des outils data discovery

Les outils de data discovery facilitent la prise de décisions par leur :

  • Flexibilité : ils s’adaptent aux besoins spécifiques des métiers tout en restant évolutifs.
  • Réactivité : ils permettent de répondre très rapidement à des questions métiers précises.
  • Simplicité : ils permettent de naviguer à l’intérieur de grands volumes de données sans écrire une seule ligne de code.

Le reproche le plus fréquent qu’on peut entendre à propos des outils de data discovery est qu’ils se concentrent d’abord sur l’analyse humaine du passé et du présent avant de développer des outils d’analyse prédictive.


Aller plus loin

Comment bien choisir son logiciel de data discovery ?

  • il est compatible avec plusieurs sources de données via des connecteurs,
  • il propose des représentations visuelles des données simples à interpréter,
  • il permet d’analyser de grands volumes de données sans délai de réponse de l’application,
  • il permet de partager la restitution d’analyse.

Par exemple, les éditeurs comme Tableau, Qlik ou Matlo proposent des outils libre-service (SaaS) qui répondent à ces critères d’exigence.


L’info à retenir

La data discovery est une méthode simplifiée d’analyse de données. Elle permet à des métiers non spécialistes de la data analyse d’explorer leurs données simplement et d’extraire rapidement l’information recherchée.