Big Data : j’y vais … mais comment ?

Le mot « Big Data » a le vent en poupe mais il est cependant difficile d’obtenir une vision claire et homogène tellement le sujet est vaste. Pour autant, de vraies opportunités business sont à la clé, que cela soit pour des améliorations de productivité ou pour développer de nouveaux produits. Les possibilités sont pour ainsi dire infinies à condition d’avoir été pensées dès le début du projet.

Quatre questions à se poser avant de se lancer dans quoique ce soit sur du Big Data.

Pourquoi ?
Cela peut tomber sous le sens, mais il faut couvrir tous les aspects de la réponse pour orienter ensuite le choix technologique ainsi que les interlocuteurs qui seront intégrés au projet. L’erreur serait d’omettre l’utilisateur final même s’il s’agit d’un besoin interne comme dans la majorité des cas. Seul les métiers (commerce, marketing, logistique, etc) savent de quoi ils ont besoin, il ne faut pas répondre à cette question à leur place. Il est indispensable d’avoir une vision claire de la cible pour ne pas commencer à collecter de la donnée sans avoir une idée précise de ce que l’on souhaite en faire. Perte de temps garantie dans le cas contraire.

Comment ?
Par quel biais collecter les données ? A quel intervalle souhaite-t-on recevoir et consulter ces données ? Ici encore, le sujet est vaste. Tout est faisable, mais il faut se poser sérieusement la question afin de ne pas investir dans un logiciel ou le déploiement d’une infrastructure de Big Data pour se rendre compte au bout d’un trimestre que cela ne répond pas au besoin. L’intervalle de réception et de consultation sera décisif dans le choix de la solution, un extract et un traitement a postériori sera aisément faisable par une ressource IT matérielle déjà en place alors qu’une collecte en quasi temps réel demandera des ressources dédiées (l’investissement sera potentiellement coûteux selon la volumétrie). Autre point important, la collecte des données ainsi que le stockage doit absolument répondre à la législation et au cahier des charges imposé par le RGPD (Règlement Général de la Protection des Données).

Pour qui ?
Cette question a toute son importance. Est-ce consulté par des forces de ventes ? Des clients ? Des exploitants ? Le besoin d’une population « commerciale » n’est pas le même que pour un opérationnel ou encore un client. Autre aspect, on ne donnera pas forcement accès aux mêmes informations à un client qu’à un collaborateur interne à l’entreprise. Si le besoin est multiple, il est indispensable de contrôler qui voit quoi avec une authentification ?

Le format de consultation ?
Non des moindres, comment y accéder ? Via une interface Web ? Un rapport PDF envoyé par email ? Un extrait de données brutes (XML, CSV, XLS, JSON) ? L’interopérabilité est essentielle avec les solutions existantes et la donnée doit être consultable dans un format compréhensible pour le destinataire (ex. n’envoyez pas l’extraction brute d’une Database MySQL à un commercial à moins qu’il soit lui-même un geek …)

Le mot de la fin
S’entourer de spécialistes si cela est stratégique pour l’activité. C’est un métier à part entière que nombre d’administrateurs réseaux et systèmes et/ou développeurs ne sauront mener à bien sans l’encadrement de référents ou d’un chef de projet spécialisé dans ce domaine. Le profil adéquat sur le marché est « Data Scientist » à défaut de passer par un prestataire ou une équipe dédiée.

Renaud GOFFINET
Renaud GOFFINET
Renaud GOFFINET est Responsable Exploitation des Infrastructures Systèmes chez Hub One. Il est passionné par toutes les technologies liées à l’IT au sens large mais aussi par la randonnée et les sports aquatiques en général. Sa technologie préférée : la domotique basée sur de l’Open Source qu’il utilise chez lui.
Pour garder une longueur d'avance, abonnez-vous

Besoin de plus d'informations