Zurück

Sentiment-Analyse mit BERT

Der Vortrag betrachtet als Use-Case die Sentiment-Analyse. Dort wurden in den letzten Jahren mithilfe von Sprachmodellen wie BERT erhebliche Fortschritte erzielt. Diese werden wir für unser erstes Machine-Learning-Modell einsetzen, um Daten mit einem unüberwachten Sentiment Modell zu analysieren. Dabei werden wir bereits erste Insights aus den Daten generieren.

Anschließend zeigen wir, wie sich das Sprachmodell domänenspezifisch anpassen lässt und so auch mit speziellem Vokabular umgehen kann.

Schließlich bewegen wir uns in den Bereich des Information Retrieval und geben einen Einblick in das Neural Search Framework Haystack.

Speaker

Jonas Rende ist Senior Data Scientist bei der DATEV eG und arbeitet in der Abteilung für kundenzentriertes Design. Er nutzt Machine-Learning-Methoden, um Kundenbedürfnisse aus umfangreichen Text- und Nutzerverhaltensdaten zu extrahieren. Gemeinsam mit Stephan Berger arbeitet er daran, Erkenntnisse aus Kundenfeedback automatisch zu generieren. Darüber hinaus legt er den Grundstein für eine Customer-Experience-Plattform.

Thomas Stadelmann ist NLP Engineer bei deepset. Thomas hat neben einem M.Sc. und einem Best Short Paper Award langjährige Erfahrung als Software Engineer und Data Scientist in den Bereichen Information Retrieval, Query Log Analysis, Search Evaluation und A/B-Testing. Heute brennt er vor allem für die Grenzen des technisch Machbaren in den Bereichen NLP, Neural Search und Question Answering. Dies lebt er vorwiegend durch Erweitern und Testen von neuen Ansätzen in deepset’s Open-Source-Framework Haystack aus.

Stephan Berger ist Software Engineer und Data Scientist bei DATEV eG. Sein Diplom in Informatik erwarb er an der FAU Erlangen-Nürnberg mit Schwerpunkt Medizinische Bildverarbeitung und klassisches Machine Learning. Am Fraunhofer IIS war er als Student Teil des Teams um das Produkt „HemaCAM“ und leistet hier auch in Form von Studien- und Diplomarbeit seinen Beitrag, am ZAE Bayern untersuchte er Ansätze zur automatischen Defektklassifikation in Solarmodulen. Bei DATEV beschäftigt er sich mit Cloud Native Software Engineering und DevOps, und wird in Zukunft seinen Fokus auf NLP setzen, einerseits als Data Scientist, aber auch mit starkem Fokus auf die Produktivsetzung und Monitoring (MlOps) von NLP-Anwendungen.