Data Science and Analytics interview

Digital Analytics wird verwendet, um eine breite Palette von Data Science-Projekten zu unterstützen und anders herum. Funktionen, die mit Machine Learning und KI entstehen, tauchen auch in Web-Analytics-Lösungen auf – Vorhersagen, Targeting, neue Dienste, etc. In einer kürzlich erschienenen Publikation verweist Gartner auf Augmented Analytics im Jahr 2020 als wichtigsten Trend und eine Priorität für Collateralized Dept Obligations (CDOs). Wir haben vor kurzem Jérémie Bureau, einen Datenwissenschaftler und Leiter des Wissenschaftler-Teams von AT Internet zum Thema Daten und Analysen interviewt. Lesen Sie weiter und erfahren Sie mehr …

Wie wird man ein Datenwissenschaftler?

Es gibt viele Wege in die Welt der Data Science. Ingenieurschulen und Universitäten bieten Kurse, die beim Master beginnen und bis zum Doktorgrad reichen. In der Tat ist die Nachfrage nach Data Scientists so hoch, dass spezialisierte Privatschulen gegründet werden. Ich selbst habe angewandte Mathematik an der Universität Bordeaux studiert und dann einen Doktor in Mathematik und Statistik an der Universität Toulouse gemacht. Ich schrieb meine Diplomarbeit unter dem CIFRE-Abkommen (französische Branchen-Convention über Training durch Forschung) und arbeitete während ich meine Doktorarbeit schrieb für drei Jahre als Forschungs- und Entwicklungs-Ingenieur bei einem Startup. Meine Doktorarbeit beschäftigte sich mit der Verlässlichkeit von Geolocation-Systemen im Bereich der Luftfahrt. Danach arbeitete ich in verschiedenen Berufsfeldern wie Gesundheit, Beschäftigung und Digital.

Wie wird Data Science speziell in einer Analytics-Lösung im SaaS-Modus angewendet?

Wenn wir uns mit Problemen beschäftigen, für die Daten verarbeitet werden, müssen wir zwei Voraussetzungen erfüllen um Informationen extrahieren zu können, die praktische Lösungen und einen Mehrwert bringen und zwar bevor wir uns den Vorhersagemodellen oder dem Machine Learning zuwenden. Zuerst müssen wir genügend viele Daten sammeln und zweitens sicherstellen, dass sie die Zielgruppe wiederspiegeln, die wir untersuchen wollen. AT Internets großer Vorteil ist die Vielfalt an Kunden-Websites, die beide Voraussetzungen erfüllen!

Jedoch hat jede Site seine eigenen spezifischen Eigenschaften abhängig von der jeweiligen Branche. Diese Unterschiede können sich enorm von einem Sektor zum anderen verändern – E-Commerce-Sites, Medien, Werbetreibende, Banken, institutionelle Websites, etc.

Das Data-Science-Team muss Tools bereitstellen, die auf alle unsere Kunden abzielen um ihnen zu helfen, ihre Marketing-Strategie zu optimieren. Die Werkzeuge, die auf mathematischen Algorithmen und Modellen basierend, müssen es ermöglichen das Verhalten der Internetnutzer zu beschreiben und vorherzusagen.

Ein Beispiel hierfür ist eine Segmentierungs-Methode um Benutzer zu identifizieren, die am meisten kaufen, oder alternativ Nutzer, die wahrscheinlich abspringen (sich abmelden oder nicht auf eine Site zurückkommen). Häufig muss man sich zwischen einem generischen Modell mit einer akzeptablen Performance über alle Kunden-Sites hinweg oder einem spezifischen Modell für ähnliche Sites entscheiden.

Wie und warum ist Data Science heute für Webanalysten hilfreich?

Data Science kann heute beschreibende, vorausschauende und sogar lösungsgebende Tools zur Verfügung zu stellen, die Analysten unterstützen. Es gibt zahlreiche Metriken, die man überwachen und verstehen kann um nützliche Informationen zu bekommen. Wenn man vernünftig ist, sollte man nicht versuchen diese riesige Anzahl an Metriken manuell im Auge zu behalten . Eine Anwendung von Machine Learning beim Support von Analysten ist eine automatische Erkennung von Anomalien. Ziel ist es, ungewöhnliche oder verdächtige Schwankungen der Metriken über die Zeit hinweg zu erfassen. Unsere Teams arbeiten derzeit an Analysen um die wahrscheinlichen Ursachen für diese Anomalien zu erklären – z. B. wenn ein Bot auf eine Website kommt und einen deutlichen Anstieg beim Traffic verursacht, wird eine Anomalie auf den aufgerufenen Seiten erkannt. Unser Ziel ist es, den Analysten oder die Analystin bei der investigativen Arbeit zu unterstützen, indem eine Reihe von Dimensionen (Quelle, Gerät, Browser, etc.) automatisch untersucht werden. Unser Kausalitäts-Analysen-Modul zeigt, dass diese Anomalie durch eine unnormale Zunahme an Traffic durch das Segment  Direktzugriff aus Kanada, mit der Chrome Version 55 verursacht wurde. Diese Art von Tool ermöglicht es dem Analysten eine erste Analyse durchzuführen und ein besseres Verständnis des Verhaltens zu bekommen. Damit kann man die notwendigen Maßnahmen oder Strategien vorhersagen und implementieren.

Anomaly Detection Analytics Suite 2 AT Internet
Abbildung1: Erkennung von Anomalien in der Analytics Suite 2 – AT Internet 2019

RFM Segmentierung ist ein anderer Anwendungsfall  – es handelt sich dabei um ein Clustering (Segmentierung) von Kunden je nach Kaufverhalten um die Marketingstrategie zu optimieren. Debitorenbuchungen werden analysiert anhand von drei Kriterien: Datum des letzten Kaufs (Recency), Frequenz über einen bestimmten Zeitraum hinweg, Betrag (kumulativ in diesem Zeitraum). Danach werden Bewertungsmethoden verwendet um Kundensegmente zu erstellen, wie zum Beispiel Stars , die viel kaufen, diejenigen die gerade etwas gekauft haben, oder  Sparfüchse, die sich nur blicken lassen, wenn es Schnäppchen gibt. Bei AT Internet haben wir beschlossen, eine automatische RFM-Clustering-Funktion zu integrieren – die Idee ist, eine schlüsselfertige Analyse zu verwenden, die sich automatisch den Kontext des Kunden anpasst und besonders saisonale Schwankungen berücksichtigt. Darüber hinaus haben wir Elemente zur Vorhersage hinzugefügt und in ein Set von angepassten Diagrammen integriert. Unsere Teams wenden derzeit die gleichen Segmentierungs-Methoden an, aber auf Kennzahlen im Zusammenhang mit dem Engagement, anstatt mit Käufen. Damit ist es möglich diese Funktionen auf Sites zu verwenden, auf denen keine Transaktionen stattfinden.

Clustering RFM Analytics Suite 2
Abbildung2: RFM-Clustering in der Analytics Suite 2 – AT Internet 2019

Was sind die Herausforderungen des Data Science Teams bei AT Internet?

Erstens, den Aufbau einer  Data Science Roadmap, die im Einklang mit den Bedürfnissen unserer Nutzer steht. Unsere Priorität ist es, aufmerksam und responsiv zu sein. Aus organisatorischer Sicht gesehen ist unser Team nun Teil einer Entwicklungsumgebung auf hohem Level. Dies erfordert die Implementierung eines Workflows, der einiges an Forschung und Entwicklung und die kontinuierliche Optimierung unserer Modelle mit sich bringt.

Data Science Workflow at AT Internet in 2019
Abbildung3: Data Science Workflow – AT Internet 2019

Jedes Mitglied des Teams muss nun in der Lage sein sich gleichermaßen um das Modeling und die Umsetzung zu kümmern. Die Technologien und Tools, die das Team nutzt, sind sehr vielfältig: Python, R, Shiny, Scala, Spark, Elastic Search, Kibana, Snowflake, AWS, Kubernetes, Jenkins, Git, etc. Die andere zentrale Herausforderung ist es sicherzustellen, dass die Fertigkeiten des Teams konsistent entwickelt werden, so dass jeder mitkommt. Zu diesem Zweck arbeiten wir mit Plattformen wie DataCamp und Kaggle.

Zusammengefasst …

Es ist wichtig, immer aufmerksam zu bleiben und eine Leidenschaft dafür zu haben etwas zu entdecken und dazuzulernen – „Data Science lebt von Neugier“.

Author

Editorial Manager Bernard ist verantwortlich für die Contentstrategie der Marke AT Internet. Er hat fast 10 Jahre Erfahrung bei Marketingtexten und als technischer Redakteur für die Softwareindustrie. Als Textspezialist arbeitet Bernard mit vielen verschiedenen Medien, unter anderem Blogs, White Papers, Interviews, Business Cases, Pressetexte, Infografiken, Videos, etc. Seine Spezialgebiete? Natürlich Marketing und Digitale Analyse!

Comments are closed.