Si vous croyez que le « big data », et la « data science » en particulier, relève de la magie et est l’affaire de magiciens compétents en mathématique, informatique, visualisation, métier … Lisez ces lignes. Si vous n’y croyez pas… Lisez les aussi.

Pour la plupart des dirigeants et managers de PME, le « big data » et la « data science » en particulier relèvent de la magie. Pour pratiquer ses rites, il faut trouver des magiciens compétents en mathématique, informatique, visualisation, métier … Cette croyance génère deux biais majeurs auprès de ceux qui décident d’initier ce type de projet. La conviction qu’essayer de comprendre comment cela fonctionne serait une perte de temps (et prétentieux). Le sentiment que cadrer le projet devient inutile.

Demande-t-on à un magicien s’il doit faire sortir du chapeau plutôt un lapin ou une grenouille ? Non. On le regarde faire, c’est tout.
Nous allons nous intéresser ici uniquement à ce deuxième biais. Cette exploration se fera sous l’angle décalé de dix conseils pour rater son projet (big) data. Prenons la métaphore de la potion magique pour l’illustrer. Un village voisin des irréductibles gaulois veut aussi avoir une potion magique. Il a bien observé et croit avoir compris le mode d’emploi. Suivons le progresser d’échec en échec (mais à la fin il réussira !)

1- COMMENCER PAR « BIG »

Quand on fait un projet big data il faut être crédible. Allons-y franchement et allons tout de suite là où les ingrédients se ramassent à la pelle : logs web, réseaux sociaux, …
Résultat : il y a de la valeur, mais il faut y mettre le prix, tant en infrastructure qu’en compétence, pour un résultat incertain. Il n’y a pas pourtant besoin de très gros volumes pour exploiter la puissance algorithmique : ce qui compte est moins le nombre des observations que la richesse de chacune.
Les entreprises peuvent commencer par valoriser leurs données internes, moins volumineuses mais intrinsèquement riches et ne nécessitant pas d’infrastructure particulière. Décloisonner les données marketings, comptables, RH, SI, … permet de reconstituer le contexte global de l’entreprise et de produire des analyses algorithmiques percutantes, tant en prédiction qu’en diagnostic. La compréhension d’une sur / sous performance commerciale par exemple doit intégrer toutes ces dimensions. Le coordinateur de ce décloisonnement de l’entreprise par ces données pourrait être le contrôleur de gestion : un scénario à réfléchir.

lire la suite sur L’usine digitale