Reinforcement Learning: Hands-on
In diesem Workshop erfahren Sie, wie Maschinen komplexe Abläufe und vorausschauendes Handeln lernen können. Mit diesem Ansatz fliegen autonome Helikopter akrobatische Manöver und der Weltmeister in Go wurde geschlagen. Ein Trainingsdatensatz mit den richtigen Antworten wird nicht benötigt, auch kein hartkodiertes Spezialwissen. Der Ansatz nennt sich Reinforcement Learning (RL) und ist fast schon magisch.
Wir werden sehen wie sich eine praktische Fragestellung aus der realen Welt als Reinforcement-Learning-Problem formulieren lässt, welche Aufgaben für RL geeignet sind und für welche besser klassisches Machine Learning zum Zuge kommt. Mit einem begleitenden Python Notebook implementieren wir schrittweise alle Lösungselemente, sehen die Funktionsweise einer modernen RL Library, beleuchten die Rolle von neuronalen Netzen und loten Optimierungsmöglichkeiten aus.
Die Python Notebooks sind auf Colab gehostet. Sie benötigen also lediglich einen Laptop mit einem aktuellen Chrome-Browser. Gerne diskutieren wir auch gemeinsam von Teilnehmerinnen und Teilnehmern mitgebrachte Anwendungsideen.
Ablauf:
* Einführung in die Konzepte von Reinforcement Learning.
* Fallbeispiel: Anwenden der eingeführten Konzepte
* Vertrautheit und Arbeiten mit Colab
* Anwenden des Fallbeispiel auf OpenAI Gym
* Trainieren des Fallbeispiels und Interpretation der Ergebnisse
* Definition des zweiten Fallbeispiels
* Konkretes Umsetzen
* Formulierung als Reinforcement-Learning-Problem
* Implementieren, Trainieren und Bewerten
* Einführung in die algorithmische Grundlagen
* Fallbeispiel aus der Industrie
* Abgrenzung von Reinforcement Learning: wo einsetzen und wo nicht?
Vorkenntnisse
Basiskenntnisse in Programmierung und ein grundsätzliches Verständnis von neuronalen Netzen. Die Implementation erfolgt in Python, OpenAI Gym und TensorFlow. Spezifische Vorkenntnisse dazu sind aber keine Voraussetzung, um dem Workshop folgen zu können.
Lernziele
• Wie funktioniert Reinforcement Learning?
• Was sind die Voraussetzungen, um es anzuwenden?
• Wie wird es konkret angewandt?
• Aufbau eines aktuellen RL-Frameworks
• Hands-on Implementierung