Generative AI ist dazu fähig Texte, Bilder & Videos zu erzeugen. Diese Diziplin existiert zwar bereits seit einigen Jahren, sie hat jedoch besonders ab November 2022 mit dem Release von ChatGPT deutlich an Fahrt aufgenommen. Seitdem entwickeln sich die auf dem Markt verfügbaren Modelle und Architekturen stetig weiter. Dabei haben sich nicht nur kommerzielle Modelle (Closed Source) als leistungsstark und zuverlässig erwiesen. Auch frei zur Verfügung stehende Modellarchitekturen (Open Source) zeigen bemerkenswerte Resultate. Genau wie in der klassischen AI dient die Technologie allerdings nicht dem Selbstzweck, sondern kann gewinnbringend und als Wettbewerbsvorteil eingesetzt werden.
Heute gibt es diverse Modellarchitekturen am Markt. Dazu gehören proprietäre Modelle (Closed-Source) kommerzieller Anbieter wie frei Verfügbare (Open-Source). Diese erfüllen in der Regel allerdings noch nicht die Use-Case spezifischen Anforderungen. Mit Hilfe einer intelligenten Ansprache kann ein Sprachmodell gegebenenfalls bereits die gewünschten Ergebnisse erzielen (Few-Shot-Learning, Prompting).
Die Gewährleistung inhaltlich relevanter Ergebnisse erfolgt durch das systematische Anreichern mit relevanten Informationen aus dem Geschäftskontext (Retrieval Augmented Generation). Dieses Verfahren ermöglicht es eigene Dokumente gezielt zu durchsuchen, ohne dass diese Informationen für Außenstehende zugänglich sind. So können Unternehmen sicherstellen, dass die erzeugten Inhalte nicht nur präzise, sondern auch spezifisch und sicher innerhalb des eigenen Unternehmenskontextes bleiben.
Das Treffen einer ganz bestimmten Struktur sowie weitere detaillierte Anforderungen an das Ergebnis können über eine individuelle Weiterentwicklung/Training eines bestehenden Modells sichergestellt werden (Fine-Tuning). Um eine hohe Qualität zu erreichen und auch komplexere Business Logik abbilden zu können erweist sich das Zusammenspiel aus mehreren Modellen bzw. deren Ansprache als aussichtsreich (Function Calling, Agentic Modelling)
Ähnliche Vorgehen gibt es bei der Bildgenerierung, in der die Fähigkeit ein Bild oder eine Grafik zu generieren nicht von Neuem erlernt werden muss. Einzeln gewünschte Details an den Output eines oder mehrerer Modelle werden über die Anpassung von Teilen der Architektur erreicht.
Der Einsatz von generativer KI stellt Anforderungen an alle Disziplinen, die auch bei der Entwicklung von klassischer KI/datengetriebener Software gefragt sind.
Die Data Scientisten stehen von Beginn an in einem engen Austausch mit dem Fachbereich um das Businessziel zu verstehen und die GenAI Technologie zielgerichtet einzusetzen. Anders als in der klassischen Statistik gibt es wenig out-of-the-box-Metriken. Um die Güte der Lösung zu messen, müssen Maße gemeinsam entwickelt werden.
Der Umgang mit kommerziellen Komponenten in einem GenAI Softwaresystem oder das Hosting von eigenen Modellen stellen nuancierte Anforderungen an die involvierten Data Engineers. Das gilt insbesondere beim Sicherstellen des Datenschutzes.
Innerhalb des Anwenderkreises gibt es verschiedene Zugriffsrechte. Die Implementierung einer rollenbasierte Zugriffkontrolle fällt in den Bereich der DevOps.
Im ersten Schritt wird ein gemeinsames Verständnis von Fachbereich und Projektteam geschärft. Welche Fragestellung soll beantwortet werden bzw. welche Aufgabe soll automatisiert werden? Ist diese Entscheidung bereits fix oder soll sie ihm Rahme des Projekts getroffen werden? Wie fügt sich der Bereich in die gesamte Prozesskette ein und wie ist die heutige Handhabe? Im Ergebnis wird mindestens eine greifbare (Teil-)Aufgabe definiert, in der GenAI zum Einsatz kommen soll.
Der Proof of Concept (PoC) dient dazu, die Machbarkeit des Einsatzes eines generativen Modells zu demonstrieren. Grundvoraussetzung dafür ist die Vorauswahl eines oder mehrerer praxisnaher Beispiele für die zu lösende Aufgabe. Außerdem bedarf es bereits einer ersten Datenanbindung, sodass die Data Scientisten in der Entwicklungsumgebung einen Ansatz konzipieren & implementieren können. Ziel ist es zu zeigen, dass und wie eine GenAI-Lösung zu Mehrwerten in oben genannter Prozesskette beiträgt.
In der MVP-Phase (Minimal Viable Product) werden die technischen Voraussetzungen dafür geschaffen, das im PoC entwickelte Modell dahindgehend zu produktionalisieren, dass es intern zur Nutzung verfügbar ist und von den Benutzern systematisch getestet und angewandt werden kann.
Wichtigster Baustein in der gemeinsamen Entwicklung ist dabei das Herstellen einer Feedbackschleife. Gemeinsam mit den Fachbereichen wir das Modell dann iterativ angepasst und verbessert.
Die Implementierung einer skalierbaren Lösung bedient sich und erweitert bewährte Techniken aus dem MLOps Framework. Zur Bearbeitung weiterer Use-Cases als der MVP-Menge wird das Modell weiterentwickelt oder weitere, dedizierte Modelle werden aufgestellt. Die angereicherten Informationen & Business-Logiken müssen in einem Produktivsystem aktuell gehalten werden. Die technische wie fachliche Qualität des Modells wird in einem Monitoring stetig überwacht.
Mit unserer umfassenden Erfahrung in der Implementierung von GenAI-Lösungen begleiten wir Sie durch jeden Schritt des Prozesses und stellen sicher, dass Ihre Projekte nicht nur erfolgreich gestartet, sondern auch nachhaltig umgesetzt werden.
Die fachliche Kompetenz der Datadrivers muss nicht gesondert erwähnt werden. Was uns besonders überzeugt hat, war die schnelle Integration in unser Team-Gefüge, sodass wir schnell auf „Betriebstemperatur“ kommen konnten.
Michael Sandbote
Head of Business Intelligence · Gruner + Jahr
Die Datadrivers bringen im Umfeld der digitalen Transformation / datengetriebenen Infrastrukturen eine Expertise ein, die ihresgleichen sucht. Die starke Methodenkompetenz gepaart mit den eingebrachten Erfahrungswerten haben auch bei uns zu erfolgreichen und vor allem akzeptierten Lösungen geführt. Mit Datadrivers haben wir einen Partner, der uns immer ein Stück über Augenhöhe des Marktes hält.
Sang-Geon Cho
Director Group Data & Intelligence · Tom Tailor