machine_learning

Heute beantwortet Dr. Sébastien Foucaud, Head of Data Science bei Scout 24 einige Fragen. Er hat uns bereits verraten, wie er von Galaxien zum Machine Learning kam. Jetzt geht er noch ausführlicher auf das Machine Learning ein.

Künstliche Intelligenz (KI) und Machine Learning sind nicht länger Science Fiction. Von der Spracherkennung und Sprachkontrolle auf unseren Mobiltelefonen bis hin zu personalisierten Kaufempfehlungen auf Shopping-Sites … Von der Gesichtserkennung in von uns geteilten Fotos bis zu den Kundenservice-Chatbots, die unsere Fragen beantworten: Beispiele für angewandte künstliche Intelligenz und Machine Learning begleiten uns inzwischen jeden Tag.

Die Anwendungsmöglichkeiten von KI und Maschine Learning für Konsumenten nehmen zu, aber die meisten Unternehmen fragen sich immer noch, ob (und wie) sie mit auf den Zug aufspringen und KI sinnvoll nutzen sollen. Übliche Fragen sind:

Kann jede Branche Machine Learning nutzen?

Können auch kleine Unternehmen Machine Learning nutzen?

Welche Ressourcen brauche ich dafür und wie fange ich an?

Viele Jahre lang waren Machine Learning und KI die Domänen der größten Unternehmen und Marken mit den meisten Ressourcen. Aber heute ist Machine Learning für alle Arten von Unternehmen zugänglich geworden. Verschiedene Faktoren haben dazu beigetragen Machine Learning zu demokratisieren:

  • Sofort startbereite Technologie: Anwenderfreundliche Machine Learning- und AI -Lösungen erleichtern die Implementierung und Anwendung dieser Technologie. Data Streaming-Technologie und cloud-basierte Lösungen sind leistungsfähiger und dabei günstiger und leichter bedienbar geworden.
  • Überfluss an Daten: Es ist einfacher geworden, Daten zu sammeln. Auch kleinere Unternehmen haben in der Regel genügend verwertbare Daten für ein Machine Learning-Projekt.

Mit einer niedrigeren Hemmschwelle wenden sich nicht nur große Unternehmen Machine Learning und Data Science zu. Unternehmen aller Art und Größen können die Implementierung dieser Technologien ernsthaft in Betracht ziehen.

In diesem Artikel stelle ich vor, was für Machine Learning Projekte unverzichtbar ist, und was man beim Start eines Projektes beachten oder vermeiden sollte.

 

Kleine Datenmenge? Kein Problem!

Offensichtlich sind die Daten das Wichtigste an Ihrem Maschine Learning-Projekt. Wenn Sie große Datenmengen haben – und wenn die Daten gelabelt sind (also auf die eine oder andere Weise „klassifiziert“ oder „markiert“ wurden, damit sie als „Trainingsdaten“ dienen können) – sind Sie auf dem besten Weg Künstliche Intelligenz in Ihr Unternehmen zu integrieren (und Sie können sich sogar Gedanken über Deep Learning oder Neuronale Netzwerke machen, wenn Sie eine Anwendungsmöglichkeit dafür sehen).

Aber auch wenn Ihr Data Set sehr klein ist, müssen Sie nicht verzweifeln – das ist nicht schlimm. In weiten Bereichen ist Machine Learning auch mit kleineren Datenmengen möglich. Gute Modelle können mit einem einfachen Rückgriff auf einem kleinen Datensatz entworfen werden. Ein stabiles Modell lässt sich einfach implementieren. Sobald das passiert ist, können Sie anfangen dem Computer etwas beizubringen.

Wenn Sie mit einem großen Datensatz arbeiten, spielt Ihre Technologie eine ziemlich große Rolle. Aber wenn Sie mit einem kleineren Datensatz arbeiten, ist Ihr persönliches Talent viel wichtiger. Besonders das spezielle Wissen aus dem Gebiet, um das es geht, kann eine Maschine nicht liefern. Wenn Sie das menschliche Spezialwissen mit einfachen Modellen verbinden, können Sie es damit weit bringen!

Arbeiten Sie bei Ihrem Projekt mit den richtigen Leuten zusammen!

Auch wenn der Fokus beim Machine Learning auf der Maschine liegt, sind die Menschen der wichtigste Bestandteil. Es kommt darauf an die richtigen Talente und die richtige Herangehensweise zu haben.

Für Machine Learning ist kein großes Team notwendig. Ein großartiges Produkt ist schon mit 6 bis 9 Mitarbeitern möglich: Ein Product Owner oder Teamleiter, jemand der sich um UX / UI kümmert, ein oder zwei Data Scientists, ein Data Engineer und ein paar Software-Ingenieure (2 bis 4), je nachdem wie viel Zeit Sie haben und wie komplex das Produkt ist.

Allerdings müssen Sie dafür zuerst Ihre Hausaufgaben gemacht haben! Sie müssen wissen, welche speziellen Unternehmensprobleme Sie lösen wollen und ob Sie die richtigen Daten dafür haben (gehen Sie dabei nach den 8 Schritten vor, die weiter unten folgen). Hier muss unbedingt ein Data Scientist mitarbeiten, der die Geschäftsanforderungen versteht und einige Erfahrungen mit der Produktentwicklung hat.

Da sich jeder „Data Scientist“ nennen kann, sollte ein Unternehmen wissen, welche Art von Data Scientist benötigt wird und mit wem sie zusammenarbeiten sollten. Es gibt mehrere Arten von Spezialisten für Data Science (mehr Informationen erhalten Sie in diesem Artikel). Darunter sind drei Typen, die für ein Machine Learning-Projekt besonders nützlich sind:

  • Ein Data Analyst oder jemand, der für Insights zuständig ist: Diese Art von Data Scientist arbeitet mit großen Datenmengen und leitet aus ihnen Insights ab. In der Frühphase Ihres Projekts kann Ihnen Ihr Data Analyst dabei helfen Trends in Ihren Daten zu identifizieren und zu verstehen. Außerdem erkennt er Probleme, die auftauchen und korrigiert werden müssen.
  • Ein Daten-Stratege: Diese Art von Data Scientist hat die nötige geschäftliche Kompetenz, die notwendig ist um Probleme zu verstehen, sicherzustellen, dass Ihr Unternehmen die richtigen Daten hat, um sie zu lösen und Business Use Cases zu entwickeln.
  • Ein Machine Learning-Engineer: Diese Art von Datenwissenschaftler hat viel Erfahrung mit der Software-Entwicklung und kann unverzichtbar dabei sein das Produkt zu erstellen, mit dem man eine Aufgabe löst.

Unabhängig von der Spezialisierung liegt die Kernkompetenz eines Datenwissenschaftlers bei der genutzten Statistik und der Fähigkeit mit statistischen Modellen Einblicke aus großen Datensätzen abzuleiten. Er braucht dafür jahrelange Erfahrung mit Daten. Ein guter Datenwissenschaftler hat deshalb ein eingehendes technisches Verständnis und genügend Fachwissen um mit den Unternehmensanforderungen fertig zu werden. Von einer übergeordneten Perspektive betrachtet sollte der Datenwissenschaftler außerdem in der Lage sein, Machine Learning-Projekte unter Mithilfe von Software- und Dateningenieuren in die richtige Richtung zu lenken. Den geeigneten Data Scientist für Ihr Projekt zu finden, ist schwierig und kann einiges an Zeit erfordern. Um Ihr Projekt nicht davon abhängig zu machen, sollten Sie übergangsweise einen zertifizierten Experten (von Portalen wie certace.com) anzuheuern.

8 Schritte zu einem erfolgreichen Machine Learning-Projekt

Sie haben die richtigen Daten und das nötige Personal für Ihr Machine Learning-Projekt. Aber das garantiert noch nicht den Erfolg. Der entscheidende Faktor ist die Durchführung Ihres Projekts: wie Sie Ihre Datensätze, Ihr Fachwissen und die Implementierung miteinander in Einklang bringen. Hier stellen wir Ihnen 8 Schritte vor, wie Sie ein effektives Machine Learning-Projekt durchführen können, das das Beste aus Ihren Ressourcen und Investitionen herausholt:

  1. Identifizieren Sie Ihre Business Use Cases und die Geschäftsanforderungen. Gehen Sie mit einem Top-down-Ansatz vor und beginnen Sie mit den Unternehmensherausforderungen, die Sie bewältigen wollen (anstatt zuerst massiv in Infrastruktur und teure Ressourcen zu investieren, die letztlich nicht zu Ihrem Bedarf passen). Nutzen Sie Ihre Business-Roadmap als Leitfaden. Orientieren Sie sich an den Anforderungen des Unternehmens, nicht an denen der Technologie.
  2. Identifizieren Sie die erforderlichen Datensätze. Welche Daten benötigen Sie, um dieses Problem zu lösen? Ein Data Strategist kann in diesem Stadium zusammen mit einem qualitativ hochwertigen Datenanbieter besonders hilfreich sein.
  3. Bestimmen Sie, welche Lösung erstellt werden soll. Nachdem Sie das Wissen um die verfügbaren Daten und die Geschäftsanforderungen kombiniert haben, können Sie anfangen Ihr Projekt klar zu umreißen und zu definieren, wie die Lösung aussehen soll.
  4. Bestimmen und skalieren Sie die richtige Architektur, um Daten in Ihre Plattform zu streamen. Hier sind viele verschiedene Lösungen möglich. Ein Data Engineer kann eine Empfehlung abgeben, wie die Daten je nach verfügbarer Infrastruktur und Technologie am besten gestreamt werden können.
  5. Kümmern Sie sich um Ihre Daten. Bereinigen Sie die Daten (das macht normalerweise 90 % der Arbeit aus), löschen Sie Ausreißer, fügen Sie fehlende Werte ein, erarbeiten Sie eine Formatierung, usw. In diesem Stadium lohnt es sich auch einen Blick auf die Compliance und den Schutz der Privatsphäre zu werfen (sollte ein Teil des Data-Set anonymisiert werden?). Das ist auch die richtige Zeit um die Zahl der Funktionen mittels Feature Engineering zu reduzieren (Funktionen kombinieren und Duplikate entfernen) – dieser letzte Abschnitt ist wichtig um die Modelle zu vereinfachen, man braucht aber viel Fachkenntnis um damit erfolgreich zu sein.
  6. Erstellen Sie das richtige Modell für Ihre Maschine. Im Kern Ihrer Lösung steht das Machine Learning-Modell. Viele Algorithmen können verwendet werden um den jeweiligen Business Case mit ganz unterschiedlicher Genauigkeit zu lösen. Ein wichtiges Element, das man im Auge behalten sollte ist, wie ich bereits gesagt habe, dass auch ein einfaches Regressionsmodell gut funktionieren kann und dass sich einfache Modelle in der Regel einfacher implementieren, skalieren und warten lassen. Wenn Sie zwischen einem sehr ausgefallenen Modell mit einem sehr hohen Genauigkeit und einem viel einfacheren (und weniger genauen) Modell wählen können, sollen Sie lieber letzteres wählen, wenn es effizienter auf Ihre geschäftlichen Anforderungen eingeht.
  7. Erstellen Sie Ihr Produkt. Die Zusammenarbeit zwischen Ihrem Produktmanager, Software-Ingenieuren, Data Scientists und Data Engineers ist hier besonders wichtig. Entscheiden Sie sich für eine schlanke Entwicklung und ein kleines, so genanntes „minimum viable product“ (MVP – Produkt mit den Minimalvoraussetzungen), damit Sie schnell interagieren können (siehe nächsten Schritt).
  8. Testen und anpassen. Es gibt immer mehr als nur eine Lösung für ein Problem. Sie sollten also nicht glauben, dass Ihre Lösung die einzig mögliche ist! Wenn Sie Ihr Produkt starten, treffen Sie eine Vorhersage darüber, welche Wirkung es haben wird und messen Sie den Erfolg, indem Sie mehr Daten sammeln. Wenn Sie sich für eine schlanke Herangehensweise entschieden haben, werden Sie in der Lage sein Ihre Lösung bei Bedarf schnell zu testen und anzupassen.

Heute ist Machine Learning für alle Unternehmen egal welcher Größe und egal in welcher Branche möglich. Dank einfach zugänglicher Technologie und einem Überfluss an Daten. Aber der Schlüssel für ein erfolgreiches Machine Learning-Projekt ist es von Anfang an eine vernünftige Herangehensweise zu wählen. Ein geschäftsorientierter (und nicht technik-orientierter Ansatz ermöglicht es Ihnen, die richtigen Elemente (Talent, Daten und Ausführung) auf passende Weise zu identifizieren und aufeinander abzustimmen. Damit holen Sie das Beste aus den Investitionen in Maschine Learning heraus und vergrößern die Chancen Ihre Ziele zu erreichen.

Data Quality in Digital Analytics guide
Author

Dr. Sébastien Foucaud ist ausgebildeter Astrophysiker und hat sich schon vor dem Zeitalter von Big Data durch Datenberge von galaktischem Ausmaß gewühlt. Während seiner Karriere hat er Daten gesammelt, bereinigt und gepflegt um Einsichten daraus abzuleiten. Er hat mit Datentechnologie und Machine Learning Datenströme und Lösungen geschaffen. Zuerst für die Astronomie, dann für die freie Marktwirtschaft. Während seiner Karriere hat er verschiedene Teams in den Bereichen Data Science, Data Engineering, Data Analytics, Risikomanagement und Business Intelligence in diversen Branchen geleitet. Er ist spezialisiert auf die Synchronisierung von Geschäftsstrategie und Data Strategy um daraus greifbare KPIs zu entwickeln und den Erfolg dank Daten & Künstlicher Intelligenz zu steigern. Erfahren Sie mehr unter http://sbsf-consultancy.com/.

Comments are closed.