Blog
KI-Technologie: Wie Talkwalker Künstliche Intelligenz für Social Listening nutzt

KI-Technologie: Wie Talkwalker Künstliche Intelligenz für Social Listening nutzt

Wenn es ein Mega-Schlagwort in der Media-Monitoring-Branche gibt, ist es wohl "Künstliche Intelligenz" (KI). Aber während "Neuronale Netzwerke" schon zum Standardvokabular gehören, klang KI bisher für viele nach einem nerdigen Fremdwort.

Facebook, IBM and Google sind nicht die einzigen Player bei Künstlicher Intelligenz. Viele unserer Kunden sind überrascht, wie stark Deep Learning und Neuronale Netzwerke schon Kernstück der Talkwalker-Lösungen sind.

Ich habe mich mal mit Dr. Benedikt Wilbertz zusammengesetzt, unserem Head of Machine Learning and Data Science, um mehr über KI zu lernen und warum es wichtig ist.

Benedikt, lass uns mal für einen Moment annehmen, ich hätte nicht Computer studiert. Was ist der Unterschied zwischen KI, Machine Learning und Deep Learning?

Künstliche Intelligenz oder KI heißt, eine Maschine imitiert "kognitive" Funktionen, die Menschen eigentlich mit den Denkweisen anderer Menschen assoziieren. Also sowas wie selbstständiges Lernen oder die grundsätzliche Fähigkeit Probleme zu lösen. Die Anfänge dieser Definition waren in den 60er Jahren, als die ersten regelbasierten Modelle Resultate vorweisen konnten, die sie als künstliche Intelligenz qualifizierten.

Künstliche Intelligenz

Die Grafik zeigt die Entwicklung von Künstlicher Intelligenz in den letzten knapp 70 Jahren. Bild: Michael Copeland/Nvidia

Der Begriff "Machine Learning" wurde eingeführt als schließlich viel höhere Rechenleistungen für statistisches Lernen von KI-Problemen zur Verfügung standen. Ein Beispiel. Sagen wir mal, du willst, dass ein Computer eine handgeschriebene Ziffer, die 3, erkennen soll. Statt der Maschine zu zeigen wie eine 3 aussieht, nutzt sie Algorithmen, um großen Mengen an Handschriftbeispielen zu analysieren und davon zu lernen.

2012 war dann das Jahr der totalen Renaissance von künstlichen, neuronalen Netzwerken. 'Deep Learning' hieß ab sofort Netzwerk-Architekturen so zu trainieren, dass sie quasi unsere Gehirnleistung nachempfinden können.

Und wie erkennt eine Maschine dann ein Katzenbild?

Wenn man das Beispiel eines Katzenbildes nimmt, würde ein neuronales Netzwerk im ersten Schritt dieses Bild in viele kleine Teile aufteilen und sich schrittweise dem Ziel ("Es ist eine Katze!") nähern.

Neuronale Netzwerke

Neuronale Netzwerke teilen Informationen in kleine Teile auf und gehen Schritt für Schritt vor, um das sichere Ergebnis zu präsentieren. Bild: Neuralnetworksanddeeplearning.

Die neuronalen Netzwerke aus 2012, die von einem Expertenteam um Geoff Hinton von der Universität Toronto kreiert wurden, gelten weltweit als Durchbruch.

Und heute geben Google und Siri KI-basierte Empfehlungen...Wenn es das schon in den 60ern gab, warum erst kürzlich der Durchbruch?

Technisch ist das eine Mischung verschiedener Faktoren. Die Datenverarbeitung beispielsweise ist heute natürlich schneller als je zuvor. Und Grafikprozessoren, die man für das 'Antrainieren' der Maschinen braucht, haben heute viel mehr Power. Außerdem hat die Digitalisierung dafür gesorgt, dass man heute große Datenmengen leichter erstellen und speichern kann. Deep Learning kann ohne große Datenmengen nicht viel ausrichten.

Neuronale Netzwerke müssen mit Hunderttausenden, oft Millionen von Bildern trainiert werden, um Resultate von hoher Qualität zu liefern. Jeden Tag fügen wir mehr als 300 Millionen Artikel zur Talkwalker-Datenbank hinzu und unsere Bilderkennungstechnologie analysiert 100 Millionen Bilder pro Tag.

Und wie macht KI dann also Social Media Monitoring besser?

Social Media Monitoring beinhaltet ja einige Herausforderungen, die normalerweise durch Menschenhand gelöst wurden. Die meisten Media-Monitoring-Unternehmen beschäftigen Programmierer, die sich manuell durch Datenmengen wühlen, um beispielsweise das Sentiment einer Erwähnung zu bestimmen. Aber die Datenmengen im Web wachsen so exponentiell, dass man einfache, kognitive Aufgaben nicht mehr manuell an Millionen von Dokumenten und Fotos pro Tag ausführen kann.

Wie hat sich Talkwalker diesem Thema anfangs genähert?

Also, eine große Herausforderung war für uns zu Beginn die enorme Anzahl weltweit geteilter Bilder. Anfang 2016 haben wir die Talkwalker Bilderkennung eingeführt, unsere erste, tiefgehende Deep-Learning-Anwendung, um bis zu 30.000 verschiedene Marken und Logos in den Sozialen Medien aufzuspüren. Seither haben wir unsere KI-basierten Mechanismen dafür stark verbessert, das Tool erkennt mittlerweile auch Hintergründe, Objekte oder Geschlecht und Alter von abgebildeten Personen.

In Sachen Natural Language Processing, kurz NLP, arbeiten wir schon lange an verschiedenen Sachen und hatten in den letzten Monaten einen Durchbruch, den man bald auf der gesamten Plattform sehen kann. Wir hatten immer im Kopf, das Marken in der Lage sein sollten, eine Sentiment-Analyse mit größerer Genauigkeit durchzuführen. Auf diesem Gebiet wird uns unsere Erfahrung mit "Deep Learning" bald auf ein ganz neues Level bringen, und zwar noch in diesem Jahr.

Für die interne Planung: Wäre es nicht schlauer gewesen mit einem großen, externen Provider zusammenzuarbeiten? Warum entwickelt Talkwalker eine KI in-house?

Willst du mir meinen Job streitig machen? (lacht) - Nein, eine der großartigen Dinge dieser Technologie ist, dass man sie skalieren kann ohne große Mehrkosten. Wie erwähnt, ist es ein Vorteil große Datenmengen, in-house zu sammeln und zu verarbeiten. Davon ab, selber entwickeln hat den Vorteil, dass wir die Genauigkeit unseres Models direkt selber im Produktionsprozess überwachen können. Wir können die KI unmittelbar neu trainieren, wenn wir wirklich qualitative Abweichungen feststellen. Der ist einzig sichere Weg konstant hohe Qualität in den Resultaten zu haben. Etwas, das ein externer Provider auf diesem Niveau nicht liefern kann.

Klingt jetzt alles ziemlich einfach. Welche Bereiche sind denn wirklich schwer umzusetzen?

Ich würde sagen, es gibt heute grundsätzlich drei Herausfoderungen: Erstens, Anwendungen basieren hauptsächlich auf überwachten Lernprozessen. Das bedeutet, wir brauchen einen Trainingsprozess mit Millionen von sogenannnten "Labelled Instances", ein Regelsystem. Diese Datensätze sind schwer zu erstellen, besonders bei hohen Qualitätsansprüchen.

Zweitens, jedes Problem benötigt einen hochspezialisierten Algorithmus, der genau auf diese Art Problem abgestimmt ist. Dazu kommt, dass du vorher niemals weißt, welcher der beste Algorithmus ist, da muss man viel testen. Eine relative breitgefasste Aufgabe also.

Drittens, jeder Schritt benötigt wirklich hohe Rechenleistungen. Neuronale Netzwerke können nicht auf normalen Computern trainiert werden, man braucht spezielle GPU-Grafikprozessoren. Das führt aber in der Ausführung zu einer Reihe von HPC-Herausforderungen (HPC = High Performance Computing).

Wie geht es in der Zukunft weiter? Was kommt noch?

KI boomt gerade aus gutem Grund. Technologien, die über Machine Learning funktionieren sind ja teilweise schon Alltag, und das wird noch mehr der Fall sein. Firmen wie Google, Salesforce und Microsoft nutzen KI, um ihre Produkte zu pushen. Im April wurde Talkwalker Teil des NVIDIA's Inception Programms, welches mit herausragenden Startups im Bereich KI und Data Science zusammenarbeitet. Da sind wir schon echt stolz drauf und profitieren hier stark von der NVIDIA-Exertise auf dem Feld, um neue Funktionen und Features einzuführen.

Im Bereich Social Listening ist die Sentiment-Analyse endlich ein Gebiet, wo die Technologie mit dem Schritt halten kann, was einige Tool-Anbieter versprochen haben in den letzten Jahren. Es gibt noch andere Tool-Bereiche in denen KI bei uns in der Zukunft ebenfalls einen echten Unterschied machen wird, aber dazu können wir vorerst nichts weiter kommunizieren.

Vielen Dank, Benedikt! Wir fragen dich bald wieder aus!

Wenn Sie mehr über Talkwalker's preisgekrönte Bilderkennungstechnologie herausfinden wollen, kontaktieren Sie einen unserer Experten noch heute.

Kostenlose Demo anfordern