Compliance in der Finanzbranche

Compliance in der Finanzbranche – Mit Open Source Tools Anrufdaten speichern und durchsuchbar machen

Avatar-Foto

Bianca Geyer

...geboren 1994 in Augsburg, studierte Mathematik an der Universität Augsburg mit den Schwerpunkten Statistik und Optimierung. Seit 2020 arbeitet sie als Consultant Search and Analytics bei der SHI. Lieblingsdateiformat: JSON

Inhalte können nur dann ihre Wirkung entfalten, wenn sie zum richtigen Moment wahrgenommen werden. Welcher Inhalt relevant ist, ist natürlich immer etwas Individuelles und hängt ganz wesentlich mit zwei Aspekten zusammen: mit der aktuellen Situation sowie mit dem Bedarf desjenigen, der die Information sucht. Content-Personalisierung zielt genau darauf ab, die für den individuellen Besucher besonders relevanten Inhalte möglichst komfortabel zu präsentieren.

Wenn Kunden digital mit Inhalten interagieren, kann genau untersucht werden, unter welchen Umständen Inhalte besonders „wirken“. Hierfür spielen Methoden der Künstlichen Intelligenz (KI) eine wesentliche Rolle. Die damit gewonnenen Erkenntnisse ermöglichen dann sogar, für den einzelnen Nutzer die Interaktion optimal zu gestalten.

In diesem Beitrag betrachten wir, welche Voraussetzungen für Personalisierung nötig sind und was KI dabei leisten kann.

Was leisten NiFi und Solr?

NiFi ist ein beliebtes Tool zur Automatisierung des Datenflusses zwischen Softwaresystemen und nutzt das Konzept „Extrahieren, Transformieren, Laden“. Solr ist eine Plattform zum Bauen von Suchlösungen und steckt zum Beispiel hinter der Suche von Adobe, Instagram, Netflix und Salesforce. Die beiden Tools sind in Kombination wie geschaffen für diesen Use Case.

Wie könnte die Umsetzung aussehen?

Zunächst muss man zwischen den eigentlichen Gesprächsmitschnitten und den Anrufmetadaten unterscheiden. Bei den Mitschnitten handelt es sich um Audiodateien, die Metadaten geben beispielsweise Auskunft über das Anrufdatum und die Namen der Gesprächsteilnehmer.

Mit Solr und NiFi können wir insbesondere die Anrufmetadaten gut verarbeiten, speichern und durchsuchbar machen. So kann man sie zunächst mit NiFi von der Quelle, etwa einer Datenbank, abholen. Anschließend können die Daten in NiFi weiterverarbeitet werden, gegebenenfalls angereichert und transformiert. Zuletzt werden die resultierenden Daten beispielsweise im JSON-Format von NiFi an Solr geschickt und dort indexiert.

Die Metadaten sind dann also in Solr gespeichert und können darüber bequem abgerufen und durchsucht werden. Hierbei bietet Solr eine Vielzahl an Möglichkeit, u.a. die Nutzung von Filtern oder Facetten.

Was die Gesprächsinhalte selbst betrifft, sind mehrere Szenarien denkbar. Die Audiodateien selbst können zwar nicht in Solr gespeichert werden, da Solr auf Textdaten ausgelegt ist, sondern müssen in einem anderen System archiviert werden. Die diesbezüglichen Archivierungsmetadaten eines Anrufs, etwa der Archivierungsort oder die ID des Calls im Archiv, könnten jedoch wiederum in Solr gespeichert werden. Diese können dann einer anderen Applikation oder auch Mitarbeitern als „Link“ zwischen den Metadaten und der eigentlichen Audiodatei dienen. 

Liegen die Gesprächsinhalte auch in Textform vor, kann man diese natürlich durchaus gemeinsam mit den anderen Metadaten über NiFi abholen, transformieren und in Solr indexieren. Über Solr kann man in diesem Fall also auch die Gesprächsinhalte selbst abrufen und ganz bequem durchsuchen.

Möchten Sie mehr erfahren?