3 keys successful data science

Les entreprises sont toujours plus nombreuses à se lancer dans des projets Big Data. Résultat, la Data Science joue à présent un grand rôle pour nombre d’entre elles. Une étude menée en 2017 par Continuum Analytics a révélé que 62 % des sociétés américaines utilisent la Data Science au moins une fois par semaine (31 % quotidiennement), et qu’aux Etats-Unis 89 % des entreprises comptent au moins un Data Scientist, chargé de mettre les données au service du business. La tendance à l’adoption du Big Data est confirmée par une autre étude, conduite en 2017 par Dresner Advisory Services, selon laquelle 53 % des sociétés ont à ce jour déjà exploité des Big Data, contre seulement 17 % en 2015. Et chez AT Internet, près des deux tiers des clients ont lancé un projet de Data Science !

 

Cette discipline fait partie des priorités des entreprises. Elle représente un levier de plus en plus important en termes de performances commerciales. Que vous débutiez dans le domaine ou que vous soyez rôdé aux projets Big Data avancés, voici trois critères qui garantissent toujours la réussite de vos initiatives en Data Science. (N’oubliez pas de regarder notre webinar avec Sébastien Foucaud, Data Scientist et Strategist : Harness the power of data science !)

 

Des données pertinentes et de qualité

Ça n’est pas un scoop, mais les données sont le pivot de tout projet de Data Science.

 

Récupérer des données n’est pas un problème. E-commerce, médias, télécommunications… quel que soit votre secteur d’activité, vous en avez probablement des quantités pharaoniques à disposition : données Digital Analytics, données transactionnelles, données CRM, données offline, données des médias sociaux, etc. Plus personne ne manque de données de nos jours, et leur production progresse à un rythme exponentiel.

 

Mais ne vous laissez pas tromper par le « Big » de « Big Data » : avoir accès à tout un stock de données n’est pas suffisant. Pour que votre projet de Data Science porte ses fruits, il vous faut des données de qualité, adaptées à la problématique que vous cherchez à résoudre.

 

« Quand on parle de Big Data, les gens se représentent souvent, à tort, qu’ils auront besoin d’énormément de données, affirme Sébastien Foucaud. Mais ce n’est pas toujours une question de volume. Il est en fait préférable de disposer de données pertinentes, qui délivrent des informations sur les utilisateurs ou sur les transactions concernées, plutôt que de tout une masse de données… muettes. »

 

Vos données analytiques sont en général une excellente source d’informations pertinentes et de qualité (surtout en cas de collaboration avec un éditeur Analytics qui garantit des données non échantillonnées et parfaitement fiables). Leurs spécificités : elles sont complètes, cohérentes et extrêmement détaillées sur les interactions de chacun des utilisateurs avec la marque, quels que soient la plateforme et l’appareil utilisés. Des outils comme Data Flow facilitent l’extraction de ces événements par millions, ainsi que le nettoyage et l’enrichissement des données. Ce genre de technologie permet d’alimenter les projets de Data Science et de Machine Learning en à peine quelques minutes.

 

Donc, en bref : la pertinence et la qualité doivent l’emporter sur la quantité. Avec votre capital de données Digital Analytics, vous avez déjà de quoi prendre un bon départ !

Une technologie à la fois puissante et accessible

Vous disposez des bonnes données. Il vous faut maintenant actionner un deuxième levier : les technologies et l’intelligence artificielle qui feront le gros du travail pour vous.

 

Mais avant cela, petit flashback avec une question toute simple : pourquoi confier ses jeux de données à un ordinateur ?

 

« Les machines sont plus performantes [que les humains] pour reconnaître des schémas », affirme S. Foucaud, qui cite la bourse et les bulletins météorologiques. Deux cas typiques selon lui où « des données historiques sont exploitées pour dégager des tendances et des modèles permettant de prédire l’avenir ». Avec la vague du Deep Learning, ces technologies de reconnaissance de formes atteignent un niveau sans précédent, qui se ressent dans notre vie quotidienne. L’illustration parfaite est par exemple la grande précision de la reconnaissance faciale, pour déverrouiller un téléphone ou identifier rapidement quelqu’un sur un système de vidéosurveillance.

 

Autre aspect sur lequel les machines nous surpassent, l’optimisation de problèmes complexes. « Aujourd’hui, les ordinateurs sont constamment utilisés à des fins d’optimisation, par exemple routière ou logistique », ajoute S. Foucaud. Dès lors qu’il faut atteindre un objectif précis de la façon la plus efficace ou la plus économique, l’intelligence artificielle l’emporte toujours.

 

Les ordinateurs sont donc efficaces en reconnaissance de motifs et en optimisation (et tant mieux.) Mais pourquoi ces technologies sont-elles aussi cruciales dans un projet Analytics ou de Data Science ?

 

Grâce à elles, on peut dépasser l’« Analyse descriptive » (le diagnostic de ce qui s’est déjà produit) pour accéder à l’« Analyse prédictive » (que va-t-il arriver ensuite ?), voire à l’« Analyse prescriptive » (comment influencer les événements à venir ?). Naturellement, plus les leviers détectés par la machine sont efficaces pour améliorer les performances, plus on peut tirer de valeur ajoutée des données.

 

Au cours des quinze dernières années, le Machine Learning et les algorithmes associés sont devenus beaucoup plus accessibles, ce qui a eu pour effet de simplifier la mise en place de projets de Data Science. Plus besoin d’accéder à des technologies propriétaires : il existe une multitude de bibliothèques open source qui comblent tous les profils de Data Scientists.

 

 

Un Data Scientist au profil adéquat

Un projet de Data Science réussi ne se résume pas seulement à des données de qualité et des technologies puissantes. Le troisième ingrédient, à ne pas sous-estimer, est l’intelligence humaine. En d’autres termes, votre Data Scientist.

 

Selon l’étude de Continuum Analytics déjà citée précédement, 56 % des entreprises ont des difficultés à recruter leur Data Scientist idéal(e). (Apparemment, la demande a littéralement explosé quand la profession a été déclarée « métier le plus sexy du XXIe siècle » !) Mais ce n’est pas un simple effet de mode, et la tâche n’est pas toujours évidente.

 

Pour ne rien arranger, les Data Scientists ont parfois des spécialisations assez différentes, ce qui signifie que tous les candidats ne se valent pas forcément face à un projet de Data Science.

 

« Il existe en fait plusieurs profils de Data Scientists, explique S. Foucaud. Ceux qui savent extraire des insights à partir de gros volumes de données et qui travaillent avec les différentes parties prenantes… et les ingénieurs en Machine Learning, capables de coder des algorithmes complexes dans le système d’information de l’entreprise et de collaborer avec l’équipe produit. » Il ajoute : « En général, ce sont deux profils très différents. »

 

La difficulté pour les entreprises est donc de déterminer leur besoin (sachant que cela est étroitement lié au projet de Data Science), puis de savoir quel profil de Data Scientist peut convenir. Sachez qu’il existe des Marketplace d’experts dans ce domaine, comme certace, pour trouver le spécialiste compétent en fonction des besoins. De nombreux Data Scientists préfèrent travailler en freelance, pour choisir leurs projets. De votre côté, vous pouvez compter sur les experts les plus compétents et flexibles pour chacune de vos initiatives.

 

Que votre entreprise débute à peine en Data Science ou qu’elle en récolte déjà les fruits, une chose est sûre : le Big Data et le Machine Learning continueront à figurer parmi les priorités des organisations dans les années à venir. Découvrez dans ce webinar comment exploiter toute la puissance de la Data Science, avec des cas d’usage concrets.

Data Quality guide in post FR
Auteur

Native de la Silicon Valley, Ashley possède 10 ans d’expérience en tant que concepteur-rédacteur marketing, ayant travaillé auparavant dans le marketing B2B digital chez Google. Elle a rejoint l’équipe AT Internet en 2014 où elle contribue à créer et à déployer nos communications internationales dans 6 langues. Le challenge qu’elle préfère : utiliser des mots sans chichis pour transformer l’univers digital, avec toute sa complexité et son évolution perpétuelle, en message clair, captivant et concret.

Comments are closed.