Reinforcement Learning

Reinforcement Learning

Richard S. Sutton and Andrew G. Barto

Reinforcement Learning: Eine Einführung - Zusammenfassung

Reinforcement Learning: An Introduction von Sutton und Barto (2018) ist das Standardwerk für Verstärkungslernen (RL). Das Buch erklärt, wie Agenten durch Trial-and-Error lernen, optimale Entscheidungen in einer Umgebung zu treffen, um langfristige Belohnungen zu maximieren.

Kernkonzepte

  • Agent-Umgebung-Interaktion: Der Agent beobachtet Zustände, wählt Aktionen und erhält Belohnungen von der Umgebung
  • Markov-Entscheidungsprozesse (MDPs): Mathematisches Framework mit Zuständen, Aktionen, Übergangswahrscheinlichkeiten und Belohnungsfunktionen
  • Wertfunktionen: Schätzen erwartete zukünftige Belohnungen für Zustände (V-Funktion) oder Zustand-Aktion-Paare (Q-Funktion)

Lösungsansätze

  • Dynamische Programmierung: Berechnet optimale Strategien bei bekanntem Modell
  • Monte-Carlo-Methoden: Lernen aus vollständigen Episoden ohne Modellwissen
  • Temporal-Difference-Lernen: Online-Updates nach jedem Schritt (SARSA, Q-Learning)
  • Eligibility Traces: Verbinden TD- und MC-Methoden für effiziente Kreditvergabe
  • Policy-Gradient-Methoden: Direkte Optimierung der Strategie statt Wertfunktionen

Moderne Entwicklungen

  • Funktionsapproximation: Ermöglicht Skalierung auf große Zustandsräume
  • Deep Reinforcement Learning: Kombination von RL mit neuronalen Netzen für komplexe Aufgaben

Das Buch bietet eine solide theoretische Grundlage und praktische Algorithmen, die das Fundament für moderne RL-Anwendungen bilden.

Back to Home

The app will open automatically. If it doesn't, tap “Open in 900s App”.

Reinforcement Learning — Richard S. Sutton and Andrew G. Barto · 900s