machine_learning

L’intelligence artificielle et le Machine Learning n’appartiennent plus au domaine des films de science-fiction. Reconnaissance automatique et commandes vocales sur les téléphones mobiles, recommandations d’articles personnalisées sur les sites marchands, ou encore reconnaissance faciale sur photos et chatbots utilisés dans la relation client… les exemples d’applications de l’IA et du Machine Learning font partie de notre quotidien.

Même les technologies d’IA et de Machine Learning sont de plus en plus présentes dans nos vies de consommateurs, de nombreuses entreprises se demandent encore si (et comment) elles pourraient surfer sur la vague du Machine Learning et tourner l’intelligence artificielle à leur avantage. Vous vous posez peut-être les questions suivantes :

Le Machine Learning peut-il s’appliquer à tous types d’entreprises ?

Les petites entreprises peuvent-elles se lancer elles aussi ?

Quelles sont les ressources nécessaires pour ce type de projet, et par où commencer ?

Traditionnellement, le Machine Learning et l’IA étaient réservés aux plus grandes marques et entreprises disposant de nombreuses ressources. Mais les choses ont changées. Différents facteurs ont contribué à sa démocratisation :

  • L’accès aux technologies : les solutions de Machine Learning et d’IA prêtes à l’emploi facilitent l’implémentation et l’application de ces technologies. Les systèmes de flux de données et les solutions cloud se sont développés, tout en devenant moins chers et donc plus accessibles.
  • L’abondance des données : il est de plus en plus facile d’acquérir des données ; même les petites entreprises ont en général suffisamment de données exploitables pour poser les bases d’un projet de Machine Learning.

Le ticket d’entrée étant moins élevé, le Machine Learning et la Data Science ne sont plus l’apanage des grandes entreprises. Les sociétés de tous types et de toutes tailles ont à présent la possibilité de mettre en place ces technologies.

Dans cet article, j’aborderai les éléments essentiels aux projets de Machine Learning, les recommandations permettant de réussir leur lancement ainsi que les écueils à éviter.

Vous avez peu de données ? Aucun problème !

Bien entendu, les données seront au cœur de votre projet de Machine Learning. Si vous disposez de gros ensembles de données identifiées (c’est-à-dire « classées » ou « tagguées » d’une manière ou d’une autre, afin de servir de « données d’entraînement »), vous êtes bien parti pour intégrer l’IA à votre entreprise (et vous pouvez même envisager de faire du Deep Learning ou des réseaux neuronaux, si cela répond à vos besoins).

Mais, à l’inverse, si votre jeu de données est réduit, ne désespérez pas : ce n’est pas un point bloquant. Il est possible de concevoir de bons modèles utilisant la régression simple sur un petit ensemble de données ; une fois élaborés, ils ne sont pas difficiles à implémenter et à faire apprendre à une machine.

Avec un jeu de données volumineux, la technologie joue un rôle très important. S’il y a peu de données, les compétences humaines ont plus de poids, et notamment la connaissance du domaine, qu’aucune machine ne pourra remplacer. En associant ces connaissances humaines à une modélisation simple, vous irez loin !

Choisissez bien les parties prenantes du projet

Outre l’automatisation inhérente au projet de Machine Learning, l’humain jouent toujours un rôle clé ; il est particulièrement important de disposer des bonnes compétences et d’adopter une approche adaptée.

Il n’est pas nécessaire de constituer une équipe gigantesque pour faire du Machine Learning. Vous pouvez concevoir un excellent produit avec entre six et neuf professionnels : un responsable produit, un concepteur UI/UX, un ou deux Data Scientists et quelques ingénieurs logiciels (entre deux et quatre, en fonction du rythme de développement souhaité et de la complexité du produit).

Mais il y a une condition : faites vos devoirs avant ! Vous devez savoir quelles problématiques métier vous voulez résoudre et si vous disposez des données nécessaires pour y parvenir (cf. les 8 étapes présentées ci-dessous). C’est la raison pour laquelle il est essentiel de faire appel à un Data Scientist, qui comprend les besoins stratégiques et a de l’expérience dans le développement de produits.

Dans la mesure où la fonction de « Data Scientist » est de plus en plus mal définie, il peut être très difficile pour les entreprises d’identifier l’arsenal de compétences dont elles ont besoin et de savoir avec qui travailler. Il y a différents types de spécialistes de la Data Science (pour en savoir plus, vous pouvez toujours lire cet article), mais voici les trois profils les plus utiles dans le contexte d’un projet de Machine Learning :

  • Le Data Analyst, axé sur les insights : ce type de Data Scientist est capable de travailler avec de grands volumes de données et d’en tirer des conclusions. Au début de votre projet, votre Data Analyst peut vous aider à identifier et à comprendre les tendances qui se dégagent de vos données et à reconnaître les éventuels problèmes à corriger.
  • Le Data Strategist : ce Data Scientist possède l’expertise métier nécessaire pour comprendre les problèmes identifiés, vérifier que l’entreprise dispose des données permettant de les résoudre, et développer des cas d’usage stratégiques.
  • L’ingénieur Machine Learning : ce Data Scientist possède un bagage solide en développement et ingénierie logiciels, et peut jouer un rôle clé dans l’élaboration proprement dite du produit qui apportera une solution au problème soulevé.

Quelle que soit sa spécialisation, la principale compétence du Data Scientist est la statistique appliquée, ainsi que la capacité à tirer des conclusions de gros volumes de données à l’aide de modèles statistiques (acquise par des années d’expérience directe d’exploitation et de manipulation de données). Un bon Data Scientist allie donc un savoir technique approfondi avec suffisamment de connaissance du domaine pour répondre aux besoins de l’entreprise. Par ailleurs, il doit plus généralement être en mesure de diriger des projets de Machine Learning aux côtés d’ingénieurs logiciels et de spécialistes des données. Trouver le Data Scientist est une tâche difficile qui peut prendre du temps. Cependant, vous pouvez entre-temps faire appel à titre temporaire à un expert certifié (sur des plateformes comme certace.com).

8 étapes pour réussir un projet de Machine Learning

Vous disposez des données et des talents nécessaires pour lancer votre projet de Machine Learning. Pour autant, la réussite n’est pas encore assurée. Le facteur déterminant sera la réalisation du projet : l’articulation entre vos ensembles de données, vos compétences et votre implémentation. Voici 8 étapes pour mener un projet de Machine Learning efficace, qui optimise vos ressources et vos investissements :

  1. Identifiez les cas d’usage et les besoins de l’entreprise. Adoptez une approche descendante et commencez par le problème métier que vous souhaitez résoudre (plutôt que d’investir d’emblée dans une énorme infrastructure et des ressources coûteuses, qui se révèleraient à terme inadaptées à vos besoins). Utilisez votre roadmap stratégique comme un fil conducteur ; concentrez-vous sur la dimension métier plutôt que sur l’aspect technique.
  2. Identifiez les jeux de données nécessaires. De quelles données avez-vous besoin pour résoudre ce problème ? Un Data Strategist peut se révéler particulièrement utile à ce stade, de même qu’un fournisseur de données de qualité.
  3. Déterminez le produit à développer. En associant votre connaissance des données disponibles et des besoins de l’entreprise, vous pouvez commencer à délimiter votre projet et à définir clairement votre produit informatique.
  4. Identifiez et dimensionnez l’architecture nécessaire pour alimenter votre plateforme avec des données. Il existe de nombreuses solutions pour cela : un Data Engineer pourra recommander les meilleurs protocoles d’échange de données en fonction de l’infrastructure et des technologies disponibles.
  5. Prenez soin de vos données. Nettoyez les données (cela représente en général 90 % du travail), supprimez les données aberrantes, remplacez les valeurs manquantes, travaillez le formatage, etc.     À ce stade, il est également intéressant d’examiner les questions de conformité et de confidentialité (faut-il anonymiser une partie du jeu de données ?). C’est aussi le moment de réduire le nombre de fonctionnalités isolées grâce au Feature Engineering (combiner les fonctionnalités et supprimer les doublons) ; cette étape ultime est essentielle pour réduire la complexité des modèles, mais elle requiert une connaissance poussée du domaine pour être menée à bien.
  6. Élaborez un modèle adapté à votre projet. Au cœur de votre produit se trouve bien évidemment le modèle de Machine Learning. De nombreux algorithmes peuvent être utilisés pour répondre au besoin, avec différents niveaux de précision. Comme je l’ai déjà mentionné, il est important de garder à l’esprit que même un modèle de régression simple peut fonctionner et qu’ils sont généralement plus faciles à implémenter, à étendre et à maintenir. Entre un modèle très complexe et extrêmement précis et un autre bien plus simple (quoique moins précis, naturellement), choisissez plutôt le dernier s’il répond suffisamment bien à vos besoins métier.
  7. Développez votre produit. Les interactions entre votre chef de produit, vos ingénieurs logiciels, vos ingénieurs données et vos Data Scientists sont essentiels à ce stade. Optez pour le Lean Development et un produit minimum viable (MVP) limité pour garder des cycles courts (voir l’étape suivante).
  8. Testez et rectifiez. Il y a toujours plusieurs moyens de régler un problème, alors ne partez pas du principe que votre produit représente la seule solution possible ! Lors de son lancement, formulez des hypothèses sur l’impact qu’il aura et évaluez ses résultats en recueillant d’autres données. Si vous avez adopté une approche Lean, vous pourrez vite tester et modifier votre produit si nécessaire.

Actuellement, grâce à l’accessibilité des technologies et à l’abondance des données, le Machine Learning est à la portée de toutes les entreprises, toutes tailles et tous secteurs d’activité confondus. Mais le secret de la réussite d’un projet de Machine Learning consiste à adopter une approche judicieuse dès le départ. Une perspective axée sur la dimension métier (plutôt que sur l’aspect technique) permet d’identifier et d’articuler les éléments du projet (compétences, données et réalisation) d’une façon adaptée. Ce faisant, vous tirerez le meilleur parti de vos investissements en Machine Learning et vous augmenterez vos chances d’atteindre précisément vos objectifs.


Auteur : Sébastien Foucaud

Après avoir travaillé dans le monde entier comme astrophysicien et professeur d’université, Sébastien Foucaud s’est frayé un chemin dans le monde des technologies du Data Analytics, du Machine Learning et du Big Data. Il est actuellement responsable de la Data Science chez Scout 24, un portail immobilier et automobile, où il gère les projets de Data Science qui dictent le développement des produits.

Data Quality guide in post FR
Auteur

La Rédaction - DA Blog L’équipe éditoriale AT Internet et tous les contributeurs du blog travaillent conjointement à la rédaction d’articles originaux sur le Digital Analytics. Pour nous proposer des sujets, des contenus ou réagir à nos articles, contactez la rédaction."

Comments are closed.