Freitag, 25. Juni 2010

8. Reinforcement Learning

Markov Decision Processes, Bellman-Gleichungen, Temporal Differences Learning. Folien.
Monte-Carlo Sampling, Diskretisierung, Approximate Policy Iteration. Folien.

Keine Kommentare:

Kommentar veröffentlichen