Richard S. Sutton and Andrew G. Barto
Reinforcement Learning: Eine Einführung - Zusammenfassung
Reinforcement Learning: An Introduction von Sutton und Barto (2018) ist das Standardwerk für Verstärkungslernen (RL). Das Buch erklärt, wie Agenten durch Trial-and-Error lernen, optimale Entscheidungen in einer Umgebung zu treffen, um langfristige Belohnungen zu maximieren.
Kernkonzepte
- Agent-Umgebung-Interaktion: Der Agent beobachtet Zustände, wählt Aktionen und erhält Belohnungen von der Umgebung
- Markov-Entscheidungsprozesse (MDPs): Mathematisches Framework mit Zuständen, Aktionen, Übergangswahrscheinlichkeiten und Belohnungsfunktionen
- Wertfunktionen: Schätzen erwartete zukünftige Belohnungen für Zustände (V-Funktion) oder Zustand-Aktion-Paare (Q-Funktion)
Lösungsansätze
- Dynamische Programmierung: Berechnet optimale Strategien bei bekanntem Modell
- Monte-Carlo-Methoden: Lernen aus vollständigen Episoden ohne Modellwissen
- Temporal-Difference-Lernen: Online-Updates nach jedem Schritt (SARSA, Q-Learning)
- Eligibility Traces: Verbinden TD- und MC-Methoden für effiziente Kreditvergabe
- Policy-Gradient-Methoden: Direkte Optimierung der Strategie statt Wertfunktionen
Moderne Entwicklungen
- Funktionsapproximation: Ermöglicht Skalierung auf große Zustandsräume
- Deep Reinforcement Learning: Kombination von RL mit neuronalen Netzen für komplexe Aufgaben
Das Buch bietet eine solide theoretische Grundlage und praktische Algorithmen, die das Fundament für moderne RL-Anwendungen bilden.
The app will open automatically. If it doesn't, tap “Open in 900s App”.