La fièvre des Data Lakes
Il suffit de chercher une liste des composants du Big Data pour s'en convaincre : open source, appliance, produit, frameworks et langages de programmation se côtoient. Leur nombre semble déraisonnable et les classifications contradictoires se superposent. Tout cela est d'autant plus brouillé que des solutions historiques se découvrent des appellations Big Data du jour au lendemain.
Face à ce brouhaha, les entreprises ont rencontré des fortunes diverses durant ces trois dernières années. Pour éviter cette complexité, beaucoup se sont perdues dans la recherche d’une solution Big Data unique. Elles ont donc rassemblé toutes leurs données dans un Data Lake (le plus souvent en Hadoop) ou dans une solution propriétaire estampillée Big Data. Bon nombre d’entreprises ont ensuite rencontré des difficultés à réaliser un use case convaincant avec un coût raisonnable. De cela provient l'actuelle prudence à investir dans le Big Data, car beaucoup ont trop dépensé en technique pour pallier aux manques de solution.
Pour autant, le Big Data n'est pas mort. La prudence que l’on sent sur le terrain est signe que les entreprises ont appris de cette période. En effet, si le résultat de ces années de fièvre d'Hadoop et de Data Lake ne sont pas à la hauteur des promesses, toutes les entreprises en ont constaté le potentiel et revoient leur stratégie et plateforme Big Data pour concrétiser l’essai.
Challenge humain et stratégie cohérente
Au centre de cette stratégie doit se trouver l'ensemble des problématiques métiers que l'entreprise ne savait adresser avec ses outils traditionnels. Nous pouvons par exemple citer :
- l’efficacité du SAV,
- la performance commerciale,
- la performance opérationnelle.
Nul besoin d'un Data Lake : il convient de rassembler des données cohérentes par rapport à la stratégie de l’entreprise et de choisir les bons outils selon les use cases. Il s’agit d’être humble et d’avancer pas à pas, de manière cohérente. Le Big Data est un challenge humain, une rupture dans les modes de pensée et de travail, une perte de repère pour tous. Bien constituer son système est la base pour ne pas perdre ses utilisateurs.
Les analystes métier et data, qui étaient habitués à des outils très user friendly, se retrouvent face à des écosystèmes logiciels très programmatiques. Les architectes, qui cherchaient à réduire au maximum le nombre de logiciels, se retrouvent face à des choix multiples d'outils pour servir le besoin. Les développeurs, quant à eux, doivent à nouveau penser bas-niveau. Tous sont impactés.
Pour tirer profit du Big Data, l’entreprise doit penser à ces acteurs et leur donner les moyens de prendre pied dans cette révolution. Pour cela, elle peut par exemple opter pour l'usage d’une solution propriétaire en plus du système Big Data open source afin que les utilisateurs ne soient pas perdus, puis les décommissionner une fois le changement intégré. L’entreprise peut également massivement investir dans de l’accompagnement au changement. Il n’y a pas de solution unique, juste un bon choix à réaliser en fonction des hommes qui utilisent le système.
La maîtrise de l’architecture
Il s'agit surtout d'être pragmatique et de savoir partir petit pour finir grand. La stratégie métier doit être cohérente et choisie pour produire un ROI certain. Pour cela, elle doit impliquer des use cases suffisamment homogènes pour pouvoir opter pour une architecture bien définie. Cela peut-être du batch en Hadoop, de l'opérationnel en SMACK (Spark-Mesos-Akka-Cassandra-Kafka) ou du reporting ad-hoc. Le tout est que cela soit décidé en cohérence par rapport aux données, aux use cases et aux utilisateurs.
Dans un premier temps, l'architecture ne couvrira pas tous les use cases, mais elle en couvrira assez pour asseoir une stratégie et produire un ROI. L'entreprise ne doit pas dépenser son argent en licence et en technique. Bien sûr, ces architectures types peuvent dans certains cas couvrir des use cases où elles sont normalement moins appropriées, mais il faudra toujours être vigilant à ne pas se perdre dans les contournements techniques. Il faudra également prendre soin d’incrémenter le système d'outils pour les utilisateurs. Un vrai travail de test and learn est alors nécessaire afin que le système Big Data ne soit pas un gadget pour expert mais bien un outil au service de l'entreprise.
Une fois cette architecture maitrisée et le ROI récurrent produit, on envisagera d'ajouter des composants pour élargir la stratégie métier.
Conclusion
Les maîtres mots pour réussir son projet Big Data sont donc pragmatisme et humilité. Si la data est le nouvel or noir, force est de constater que beaucoup ont creusé plus qu'ils n'ont trouvé de valeur. Pour réussi, il est surtout important d’avoir un œil avisé et le bon tamis.
Si certaines solutions sont éprouvées, tout évolue très vite dans le domaine du Big Data. Il s’agit donc de se prévenir du changement, en misant sur une architecture souple afin d’être prêt à évoluer rapidement. Les technologies à base de conteneur prennent ainsi une place de choix et donnent au Big Data la flexibilité qui lui manquait.
En savoir plus
Big Data : boostez votre potentiel avec Datavenue
Transformez vos données en informations utiles
Ingénieur de 15 ans d’expérience dans l’architecture, l’urbanisme et les nouvelles technologies, je suis actuellement responsable technique Big Data chez Orange Applications for Business.
Curieux, iconoclaste et avide de challenge, j'ai surtout la volonté de faire de l’informatique et des systèmes d’information un outil qui sert ses utilisateurs, les hommes.