Freitag, 25. Juni 2010

8. Reinforcement Learning

Markov Decision Processes, Bellman-Gleichungen, Temporal Differences Learning. Folien.
Monte-Carlo Sampling, Diskretisierung, Approximate Policy Iteration. Folien.

Mittwoch, 9. Juni 2010

6. Bayes-Point-Machine

Bayes'sches Lernen, Billard-Algorithmus. Folien.

5. Hauptkomponentenanalyse

PCA, Kernel-PCA. Folien