Natural Language Processing
Alexa, welche Aktien sollte ich kaufen?
Wie Natural Language Processing (NLP) im Kontext Capital Markets eingesetzt werden kann und welche Use Cases möglich sind
Immer häufiger wird die Verarbeitung von menschlicher Sprache auch eine Aufgabe von Maschinen. Ob Alexa und Siri im Wohnzimmer, der Chatbot der eigenen Versicherung und bis hin zum Sportteil der eigenen Zeitung – Maschinen lernen nach und nach, mit uns zu sprechen. All das ist möglich, da unsere technologischen Möglichkeiten für künstliche Intelligenz (KI) aufgrund des Zugangs zu immer größeren Datenmengen und Rechenkapazitäten immer besser werden. In den letzten Jahren ist daher die Disziplin des NLP immer wichtiger geworden.
NLP beschreibt die Verarbeitung jeglicher Art von natürlicher Sprache unter Zuhilfenahme von Computern. Einen groben Überblick bietet die Strukturierung in die Bereiche Klassifikation & Vorhersage, Textproduktion und Conversational UI & KI. Obwohl ein End-2-End Anwendungsfall häufig mehrere dieser Komponenten nutzt, bietet die Unterteilung der Bausteine in diese Kategorien den Vorteil, dass es Anhaltspunkte für Referenzimplementierungen, Architekturen und Algorithmen gibt.
Erstgespräch anfragen
Tristan
Pötzsch
Patrick
Gschwendtner
Beispiel Use Cases
- Ziel ist, Kursentwicklung auf Basis des öffentlichen Stimmungsbildes vorherzusagen
- Quellen können soziale Netzwerke wie Twitter und Co. sein, aber auch Informationen aus Investor Relations wie Hauptversammlungsprotokolle
- Herausforderung ist, die zusätzliche erklärte Varianz aus jeder Quelle zu bestimmen und ins Verhältnis zu setzen
- Ziel ist, die Ausfallwahrscheinlichkeit eines Kredites vorherzusagen
- Quellen können zum Beispiel Veröffentlichungen des Unternehmens oder auch Business Cases beim Kreditantrag sein
- Herausforderung ist, die Ergebnisse mit anderen Vorhersagealgorithmen zu verbinden, um kein zu einseitiges Bild zu erhalten
- Ziel ist, Emittenten automatisch nach ESG-Kriterien zu klassifizieren und zu beschreiben
- Quellen können unter anderem Medienberichten und NGO-Publikationen oder auch das Echo der Mitarbeiter auf sozialen Medien sein
- Herausforderung ist die Heterogenität der Quellen, um ein umfassendes Profil zu erstellen
Wie funktionieren NLP-Modelle technisch?
Für uns Menschen ist das Verstehen von Sätzen und deren Zusammenhängen kein Problem – schließlich haben wir das von klein auf gelernt. Doch wie bringt man Maschinen eine Sprache bei? Die Anforderung dabei ist es, dem Computer die Wörter und Sätze so darzureichen, dass er diese verarbeiten kann. Dafür gibt es kein standardisiertes Vorgehen sondern eher eine Art Baukasten, aus dem man Steine zu einem Modell zusammensetzt.
- Einfache Modelle sind zum Beispiel das bag-of-words Modell, bei dem die Häufigkeit jedes auftretendes Wortes als Merkmal zum Trainieren eines Klassifikators verwendet wird. Da nicht alle Wörter relevant sind und z.B. „Glück“ und „glücklich“ gleich behandelt werden sollen, werden Techniken wie die Lemmatisierung und stopping words verwendet. Der Nachteil dieser Modelle ist, dass nur die Anzahl der auftretenden Wörter betrachtet wird und nicht deren Zusammenhänge. Für weniger anspruchsvolle Analysen vor allem mit geringer Komplexität in den auszuwertenden Texten sind die aber häufig zielführend.
- Komplexere Modelle, die Zusammenhänge berücksichtigen, sind zum Beispiel part-of-speech tagging basierend auf dem Hidden Markov Modell, oder Transformer Modelle wie Google‘s BERT. BERT ist ein unüberwachtes Modell, dass durch Millionen von Sätzen die Zusammenhänge einer Sprache lernt. Mittlerweile stellen Firmen wie Google und OpenAI vortrainierte Modelle zur Verfügung, die die Grundstruktur einer Sprache verstehen und „sprechen“, aber noch nicht an Industrien angepasst sind. Diese Modelle lassen sich mit z.B. Finanztexten und -sentiments noch optimieren und so für den benötigten Use Case anpassen.
Disclaimer: Bei der Erstellung des Inhalts ist die größtmögliche Sorgfalt verwendet worden, dennoch bleiben Änderungen, Irrtümer und Auslassungen vorbehalten. Die getroffenen Aussagen basieren auf Beurteilungen, historischen Daten und rechtlichen Einschätzungen zum Zeitpunkt der Erstellung des Inhalts. Alle Angaben erfolgen ohne Gewähr für die inhaltliche Richtigkeit und Vollständigkeit. Die Überlassung des Inhalts erfolgt nur für den internen Gebrauch des Empfängers. Die Aufbereitung stellt keine Rechts- oder Anlageberatung dar. Diese muss individuell unter Berücksichtigung der Umstände des Einzelfalls erfolgen.
Für eine bessere Lesbarkeit wird auf dieser Website das generische Maskulinum verwendet, wobei alle Geschlechter gleichermaßen gemeint sind.