Strojové učení (8)
Školní příklad posilujícího učení. (*)

Posilující učení - Reinforcement learning (RL).
RL je učení co dělat, jak mapovat situace k akcím aby se maximalizovala hodnota odměny. Přičemž není řečeno, které akce mají podniknout, ale místo toho musí zjistit, které akce přinášejí největší odměnu a to tím, že je vyzkouší.
Je celá řada metod a algoritmů pro řešení úloh v oblasti strojového učení využívající posilující učení. Lze je rozdělit do oblastí: metody tabulkového řešení (konečné Markovovy rozhodovací procesy, dynamické programování, metody Monte Carlo, metody s časovým rozdílem jako algoritmus Q- learning, ...), metody aproximačního řešení a metody hlubokého posilujícího učení.