Innovationstag - Neuronale Netze für personalisierte Recommendations

von Danny Busch - 26.11.2018

kurz & knapp – Snapshot vom neuland-Innovationstag*: Kollegen befragen Kollegen und geben allen Interessierten Einblick in die vielfältigen Themen und Möglichkeiten zur Beteiligung bei neuland - Dr. Jörn Grapp im Interview mit Danny Busch und Jan Brusch

Welches Problem wolltet Ihr lösen? Was war Euer Ziel?
Es gibt klassische Technologien, die personalisierte Recommendations erzeugen können. Darüber können ähnliche User-Interessen identifiziert werden und damit Artikel, die zu mir als potenziellem Käufer eines Webshops passen.
Deep Learning ist ein reichhaltiges Fundament, um zahlreiche Aufgaben des maschinellen Lernens in einer einzigen Pipeline zu bewältigen. Die Hardware-Unterstützung sowohl von CPUs als auch GPUs ist dabei großartig. Wenn man so will, ist das der aktuelle Lego®-Kasten der künstlichen Intelligenz.
Das Erzeugen von guten Produktempfehlungen einmal mit Deep Learning zu versuchen liegt da nahe, zumal von großen Marken wie Amazon und Youtube bekannt ist, dass diese schon länger mit neuronalen Netzen arbeiten. Amazon hat bspw. schon vor geraumer Zeit Amazon-DSSTNE (sprich: Amazon Destiny) auf Github veröffentlicht; wenn man so will, eine Amazon-eigene Alternative zu TensorFlow.
Auch die Erweiterbarkeit von neuronalen Modellen im Hinblick auf bspw. die Verarbeitung von Produktbildern und natürlicher Sprache ist verlockend, gerade in den Domänen, wo es auf das Aussehen und die Ansprache ankommt.
Was genau habt Ihr gemacht und was ist das Ergebnis?
Beim Innovationstag haben wir das Prinzip neuronaler Netze auf das Problem des kollaborativen Filterns angewandt. Wir wollten auf diese Weise Ähnlichkeiten identifizieren und dann gegebenenfalls auf andere oder sogar bessere Empfehlungen kommen. Wir haben erstmal ein Minimal-Beispiel mit nur wenigen Sessions gebaut.
In typischen Kundenprojekten erhalten wir jeden Monat mehrere Millionen Sitzungen über zehntausende Produkte. Man kann sich vorstellen, dass der Kunde während einer Sitzung mit unserem Shop durch sein Verhalten etwas über seine Vorlieben und Interessen ausdrückt. Dann könnte man sagen, die Produkte des Shops sind unsere Hauptwörter, und die Sitzungen sind unsere interpunktierten Sätze, die eine Spur von Interessenslage aussprechen. Unser Ziel ist es, diese Sätze für den Benutzer auf passgenaue, manchmal auch überraschende Art und Weise zu vervollständigen.
Mit TensorFlow und Keras lassen sich einfach neuronale Modelle erstellen, um aus diesen Sätzen bzw. Sitzungen latente Interessensschwerpunkte zu heben. Diese wiederum bilden die Grundlage für kollaborative Empfehlungen. Das funktioniert hier ähnlich wie bei dem in der KI-Szene berühmten „word2vec“-Modell von Google.
In einem Sandbox-Beispiel konnten wir gut nachvollziehen, auf welche Weise die latenten Schwerpunkte entstehen.
Was war Eure wichtigste Erkenntnis? Könnt Ihr etwas empfehlen?
Man kann nur empfehlen, das Ausspielen von Recommendations nicht unbesehen einem fertigen Produkt zu überlassen, sondern sich selbst Gedanken um seine Domäne und die dafür idealen Modelle zu machen - und zwar unabhängig davon, ob man nun ein fertiges Produkt verwendet oder ob man selbst ein Produkt baut.
TensorFlow hat sich zu einem Industriestandard für maschinelles Lernen gemausert und sollte unbedingt in das tägliche Datengeschäft mit einfließen.
Was war besonders schwierig?
Erstens: die Details zu untersuchen. Eigentlich handelt es sich bei den neuronalen Netzen um ein einfaches Prinzip, aber je tiefer wir einsteigen und je komplexer es wird, desto länger ist die Rechenzeit. D.h. die Feedback-Zyklen werden länger.
Zweitens: die API kennenzulernen. Allzu leicht verwendet man Dinge nicht im Sinne der Erfinder. Allerdings ist die Lernkurve nicht so steil wie befürchtet, und schon nach wenigen Stunden konnten erste Modelle trainiert werden.
Seid Ihr mit dem Ergebnis zufrieden?
Bis hierher ja. Wir müssen im Weiteren noch verproben, wie unser Experiment im großen Umfang im Detail funktionieren wird. Die Idee besteht darin, und es ist vorstellbar, letztlich das untersuchte Prinzip auch in Kundenprojekten einzusetzen.
Es ist immer gut, mögliche Alternativen im Recommender Repertoire zu haben, und Deep Learning ist so vielversprechend, dass wir in den kommenden Wochen und Monaten das Thema bei neuland intensivieren werden.
An unseren Innovationstagen entwickeln wir in 24 Stunden außerhalb der Projektarbeit Ideen und treiben diese voran.

Bild-Quelle: Link

Der Autor

Danny Busch

https://neuromant.de

Bis 2021 Senior Software Developer im Bereich Data Science und Machine Learning bei neuland. Mochte neuronale Netze schon, bevor sie cool waren. Schaut aber auch gerne über den Tellerrand.

Programmieren für nicht-Programmierer

Wie bewege ich mich bei neuland IV - Mitgestaltung