V² pour Big Data


Il est vrai que le terme "V2" est de moi et que mon professeur de mathématiques me réprimanderait pour cela. Le premier V de V2 représente le chiffre romain 5 et le deuxième V correspond à chacun des cinq termes que nous allons aborder maintenant et qui servent de base au Big Data. Le terme n'est pas protégé et est volontiers utilisé comme étiquette dans le marketing.
Tout d'abord, "V" comme volume. Il s'agit ici effectivement des volumes de données importants, voire gigantesques, que chacun d'entre nous et les entreprises peuvent rencontrer aujourd'hui.
Selon différentes sources, la quantité de données stockées dans le monde en 2018 était de 33 ZB (zettaoctets). 1 ZB correspond à 1000 EB (exaoctets) ou 1 milliard de To (téraoctets).
En partant d'une croissance annuelle d'environ 27%, cela correspond à un doublement tous les 3 ans ( !). Il est intéressant de noter que le plus grand producteur de données est l'industrie manufacturière, suivie par le commerce, les services financiers, les infrastructures ainsi que les médias et le divertissement.
Viennent ensuite la santé et les transports, pour lesquels je vois toutefois une forte tendance à la hausse. Surtout si la vitesse de transmission des données (par exemple 5G) augmente.
Il s'agit également de la vitesse d'exécution des grandes quantités de données et des algorithmes parfois complexes. Cette vitesse "Velocity" est le deuxième "V".
La valeur des données est d'autant plus grande qu'elles sont actuelles. Par exemple, si vous consultez un site web avec de la publicité et que vous recevez, grâce aux cookies, la publicité appropriée qu'un fournisseur a achetée pour vous à ce moment-là.
Cela nous amène au troisième "V" de Variety : non seulement les données collectées se présentent sous des formats de fichiers très différents, mais la plupart d'entre elles (environ 80%) sont en outre non structurées, comme des textes, des fichiers audio, des vidéos, des chats, des profils de mouvement, etc.
L'une des attentes du Big Data est de rendre ces données exploitables et donc utilisables. Les données non structurées sont déjà utilisées aujourd'hui pour prédire des catastrophes à venir à partir de la communication dans les régions concernées, en combinaison avec des données météorologiques, historiques et géographiques.
Indépendamment de la quantité de données, les données doivent être valides. D'où le quatrième "V" pour Validity. Ce que je mesure est-il représentatif et quelle est la corrélation avec le comportement que je veux prédire ?
Ainsi, le taux de natalité chez les humains et la population de cigognes sont certes en corrélation, mais il n'y a pas de lien de cause à effet. Inversement, Walmart aurait déjà découvert il y a 20 ans que les couches et la bière se vendent bien ensemble (surtout le vendredi).
Le contexte est que de (soi-disant) jeunes pères ont été envoyés pour acheter des couches et ont ensuite pris de la bière pour eux-mêmes. En raison de la structure des coûts et de la rapidité des systèmes SAP, la collecte et le traitement selon les "V" susmentionnés sont plutôt effectués dans des systèmes extérieurs à SAP et les résultats sont ensuite transférés.
Le cinquième "V" signifie "Value", c'est-à-dire quelle est la valeur des données obtenues grâce au Big Data. Cela va du marketing ciblé aux nouveaux modèles commerciaux, en passant par l'optimisation des processus commerciaux ou des chaînes de création de valeur. Même si le big data offre de nombreuses possibilités, il n'est pas gratuit et l'utilité doit être à la hauteur.
Je ne voudrais pas vous priver du fait qu'il existe d'autres "V" dans la discussion actuelle qui méritent également de l'attention. Il y a par exemple "V" comme "Veracity" (exactitude) : Plus la qualité est élevée, plus l'utilité informative est grande. Ou "Volatility", c'est-à-dire la volatilité, en ce qui concerne la disponibilité des données.
Ou la "viabilité" comme le bon choix des données disponibles. Comme vous pouvez le constater, il existe de nombreuses variables qui déterminent l'utilité des Big Data. Si vous avez lu cette chronique jusqu'au bout et que votre tête ne bourdonne pas encore de tous ces mots en "V", vous pouvez sans crainte faire un "V" comme "Victory".