HomeSuccess Stories

Aufbau eines echtzeitnahen Empfehlungssystems

Branche: Telekommunikation & Internetdienste

 

AUSGANGSSITUATION:

Der Kunde war mit einer über Jahrzehnte gewachsenen Vielfalt an Produkten und Tarifen konfrontiert. Eine systematische Erfassung der Merkmale, auch im Hinblick auf die Kosten, war nicht mehr möglich. Zudem wurden die Angebote den Kunden nicht systematisch präsentiert, sondern über verschiedene Kanäle nach unterschiedlicher Logik verwaltet.

 

LÖSUNG:

Im Rahmen der Cloud-Integration haben wir den Fall von Grund auf neu durchdacht. Aufgrund des sich verändernden Tarifportfolios, mit dem Makler auch in Zukunft konfrontiert sein werden, sind herkömmliche Algorithmen für Empfehlungssysteme nicht mehr effektiv. Stattdessen haben wir durch mathematische Modellierung einen Algorithmus entwickelt, der für jeden einzelnen Kunden die bestmöglichen Vorschläge ermittelt. Mit Hilfe einer intelligenten Parallelisierung in der Cloud ist dies auch für viele potenzielle Produkte möglich. Auch für verschiedene Vertriebskanäle können unterschiedliche Geschäftslogiken implementiert werden. Die Vorschläge werden dann über eine API in die verschiedenen Zielsysteme eingespielt.

 

BUSINESS VALUE:

Die Konversionsraten sind über alle Vertriebskanäle hinweg um einen zweistelligen Prozentsatz gestiegen.

 

FRAMEWORK & TOOLS:

  • AWS Sagemaker
  • AWS Glue
  • Model Management
https://www.datadrivers.de/wp-content/uploads/2024/11/2024-10-22-09.43.19-A-modern-minimalistic-illustration-representing-project-management-set-against-a-white-background.-The-image-features-simple-abstract-shapes-like-in-640x640.webp

Vorhersage und Zuweisungsoptimierung für stationäre Kanäle

Branche: Konsumgüter- und Einzelhandelsunternehmen

 

AUSGANGSSITUATION:

Der Kunde sah sich mit einer unbefriedigenden Fehlkalkulationsquote im stationären Bereich konfrontiert. Es gab eine signifikant hohe Retourenquote, gleichzeitig wurden die Produkte an anderen Standorten viel früher als geplant vollständig verkauft, so dass die Nachfrage nicht vollständig gedeckt werden konnte.

 

LÖSUNG:

Es wurde ein Modell entwickelt, um die Triebkräfte der Nachfrage zu modellieren. Es wurden verschiedene Merkmale entwickelt und die Nachfrage wurde mathematisch als Zielwert auf der Grundlage des Umsatzes modelliert.  Zu diesem Zweck wurde ein Merkmalspeicher mit verschiedenen Logiken eingerichtet. Bei der Generierung eines Trainingssets wurde ein Parallelisierungstool eingesetzt, um die zugrunde liegenden Big-Data-Herausforderungen effizient zu meistern. Für die Inferenz wurde eine vollautomatische, cloud-native Softwarelösung entwickelt, die sich in die Zielsysteme integriert.

 

BUSINESS VALUE:

Jährliches Umsatzwachstum im signifikanten Bereich.

 

FRAMEWORK & TOOLS:

  • Google Dataflow
  • Google Vertex AI
  • Google Cloud Run
  • OpenAI

Entwicklung und Aufbau einer vollautomatischen MLOps-Plattform

Branche: Telekommunikation & Internetdienste

 

AUSGANGSSITUATION:

Die Machine-Learning-Modelle des Kunden mussten manuell trainiert, auf Hyperparameter getuned, gehostet und bereitgestellt werden, und die Nachverfolgung der Experimente erfolgte manuell. Dies verursachte den Data-Science-Teams bei jeder Modelländerung oder jedem neuen Anwendungsfall für ML erheblichen Zeit- und Arbeitsaufwand.

 

LÖSUNG:

Das Datadrivers-Team implementierte eine ML-Plattform, die vollständig automatisiert, testbar, beobachtbar und gut dokumentiert ist. Wir haben ein Bausteinprinzip entwickelt, das durch deklarative RESTful-Services und verwaltete Komponenten unterstützt wird, die zusammen den Bedarf an DevOps- oder Engineering-Unterstützung minimieren und eine schnelle Bereitstellung neuer und bestehender Modelle gewährleisten.

 

Sowohl bestehende als auch neue ML-Anwendungsfälle arbeiten in einer hochverfügbaren und stabilen Umgebung, dank erheblicher Investitionen in Teststrategien.

 

BUSINESS VALUE:

Infolgedessen fallen keine Kosten für den „Umzug in die Produktion“ an, da alle Arbeitsabläufe der Data Scientists in der Produktionsumgebung laufen und ein spezielles IAM-Berechtigungsmodell verwenden. Neue ML-Modelle werden in einem autonomen Workflow von den Data Scientists entwickelt und dank der ML-Plattform dreimal schneller als bisher live in der Produktion eingesetzt, einschließlich automatisiertem Modelltraining, Experiment-Tracking, Modell-Hosting und Serving.

 

FRAMEWORK & TOOLS:

  • Apache Airflow
  • Apache Spark
  • Amazon Glue, Amazon Aurora & AmazonSageMaker
  • Terraform
  • GitHub
  • FastAPI
  • Splunk Observability
  • Mlflow
https://www.datadrivers.de/wp-content/uploads/2024/11/2024-10-22-09.48.18-A-minimalistic-and-modern-illustration-representing-project-management-set-against-a-white-background.-The-image-features-abstract-shapes-such-as-sim-640x640.webp

Design und Entwicklung einer Google Cloud-basierten Datenplattform

Branche: Medien

 

AUSGANGSSITUATION:

Datensilos erschweren abteilungsübergreifende Erkenntnisse, überlastete Datenbanken verlangsamen Analyse und Reporting

Gemeinsame Datenbasis geschaffen, abteilungsübergreifende Analysen und Berichte ermöglicht, Zeitersparnis bei Analysen und Reportings

 

Die Daten des Kunden waren in einer Oracle-Datenbank gespeichert, aber nicht alle Teams verfügten über zentral gespeicherte Daten, z. B. fehlende Website-Daten, und es gab Datensilos für jede Abteilung, was abteilungsübergreifende Analysen und Reportings erschwerte.

 

Die Datenbank war überlastet und zu kompliziert, so dass der Zugriff für die Datenanalyse nur langsam möglich war und Reportings in Stücken verarbeitet werden mussten, was die Häufigkeit der verfügbaren Berichte einschränkte..

 

LÖSUNG:

Entwicklung eines Data Lake in der Google Cloud, einschließlich der Einführung von Best Practices in der Software- und Datentechnik. Dazu gehörten Git-Repositories, CI/CD, objektorientierte Programmierung, Linting und Testautomatisierung. Die Entwicklung von Datenqualitätstests und die Modellierung nach Data Vault 2.0 wurden ebenfalls implementiert. Data Mesh ermöglicht es den Anwendern, bereichsübergreifende Datenanalysen durchzuführen. Darüber hinaus wurden die internen Berater erfolgreich in den oben genannten Technologien und Methoden geschult.

 

BUSINESS VALUE:

Schnellerer Datenzugriff und Datenaggregation für Analysen durch ein verbessertes Data Warehouse, einschließlich erheblicher Zeitersparnis und höherer Frequenz für regelmäßige Geschäftsberichte, die zeitnahe Unternehmensentscheidungen ermöglichen.

 

Die Benutzer sind in der Lage, ihre eigenen Berichte in Power BI zu erstellen, wobei alle Abteilungen einfach und schnell auf denselben Data Lake zugreifen können, was die Komplexität und die Zeit bis zum Erhalt von Erkenntnissen verringert. Die meisten Datentransformationen werden bereits im Data Lake mit BigQuery und dbt durchgeführt, so dass die Abteilungen Daten- und Businesslogik unternehmensweit anpassen können.

 

FRAMEWORK & TOOLS:

  • Gitlab
  • dbt
  • Google BigQuery
  • Google Cloud Platform

Operative Arbeit/Unterstützung im Bereich Data Warehousing

Branche: Medien

 

AUSGANGSSITUATION:

Benötigte operative Unterstützung bei der Erweiterung des Data Warehouse (DWH) des Kunden und der Bereitstellung von Daten für Stakeholder

Reduzierung von Fehlern und Verkürzung der Zeit bis zur Analyse/Berichterstellung, zusätzliche Unternehmenserkenntnisse aus dem erweiterten DWH.

 

Das bestehende Amazon Redshift Data Warehouse musste um zusätzliche Datenquellen erweitert werden, aber der Kunde hatte nicht genügend technische Kapazitäten.

 

LÖSUNG:

Datadrivers arbeitete operativ an der Erweiterung und Verbesserung des Data Warehouse, einschließlich der Extraktion, Umwandlung und Bereinigung von Daten aus neuen Quellen in das DWH, hauptsächlich aus den Vertriebssystemen des Kunden, sowie der Erweiterung oder Erstellung zusätzlicher Datenexporte gemäß den Anforderungen des Kunden. Wir optimierten Tabellen für SQL-Abfragen und überarbeiteten das Data Warehouse gemäß den Best Practices der Softwareentwicklung.

 

BUSINESS VALUE:

Reduktion von Bugs und stabileres Data Warehouse, Reduktion der Zeit für Analyse und Reporting sowie zusätzliche Erkenntnisse aus den neu verfügbaren Quelldaten.

 

FRAMEWORK & TOOLS:

  • Airflow
  • SQL Alchemy, Alembic
  • Gitflow
  • Amazon S3, Redshift

    © 2024 DATADRIVERS GMBH. Alle Rechte vorbehalten.

    © 2021 DATADRIVERS GMBH. Alle Rechte vorbehalten.