En décembre 2014 J’ai écrit un article intitulé Trouver la grande sagesse insaisissable dans les mégadonnées. Depuis lors, nous avons fait de grands progrès dans le stockage, le traitement et la gestion de gros volumes de données dans un contexte numérique, mais les humains ont toujours du mal à trouver de manière fiable des pépites pertinentes pouvant améliorer les résultats commerciaux. Je revisite l’idée pour voir jusqu’où nous sommes allés et jusqu’où nous devons encore aller.

Le baseball est l’un des meilleurs exemples de l’impact des données sur une entreprise. Le livre et le film « Moneyball » ont montré comment le directeur général d’Oakland Athletics, Billy Beane, a changé le sport en introduisant une analyse statistique avancée au lieu de simplement se fier aux rapports des éclaireurs humains. Aujourd’hui, le baseball est gouverné par des analystes autant que par des professionnels expérimentés du baseball, mais pourrait-il y avoir trop de données ?

Alex Spier écrivant dans la chronique Sunday Baseball Notes du Boston Globe a récemment souligné que le manager des Red Sox de Boston, Alex Cora, aura 11 entraîneurs dans le personnel cette année pour 26 joueurs. Comparez cela avec Terry Francona en 2011, qui en avait six pour 25, et vous pouvez voir que le nombre a presque doublé.

Spier attribue cela en partie à la quantité croissante de données que les équipes collectent, ce qui nécessite plus de personnes pour observer, interpréter et mettre en œuvre un plan à exploiter. Comme Spier l’a écrit : « Le résultat ? Plusieurs équipes disposent désormais de trois entraîneurs de frappeurs, et le personnel continue de croître dans le but de distiller les montagnes d’informations sous une forme digeste pour les 26 joueurs d’une liste.

« Les startups qui analysent et extraient des informations à partir de données rapides ont suscité un intérêt extrêmement élevé des investisseurs des marchés publics et privés. » Deepak Jeevankumer

Le baseball est comme un laboratoire d’analyses statistiques avancées, et les entreprises pourraient apprendre beaucoup en observant comment le sport gère l’expansion des ensembles de données.

Les entreprises mettent des données dans des lacs de données, bricolent des modèles d’apprentissage automatique et utilisent ce…

Voir la source de cette publication