Markov Decision Processes, Bellman-Gleichungen, Temporal Differences Learning. Folien.
Monte-Carlo Sampling, Diskretisierung, Approximate Policy Iteration. Folien.
Freitag, 25. Juni 2010
Mittwoch, 16. Juni 2010
Mittwoch, 9. Juni 2010
Abonnieren
Posts (Atom)