Relatório Aprendizado por Reforço
Aggregazione dei criteri
Aperto: sabato, 20 giugno 2020, 00:00
Data limite: lunedì, 13 luglio 2020, 23:59
Implementar pelo menos três algoritmos:
- value-based
- policy search
- sample efficient
Utilizar o AI Gym (gym.openai.com) e testar os algoritmos no Cart-Pole
Dicas:
- considere avaliar primeiro as implementações dos algoritmos em um ambiente discreto
- os algoritmos não precisam se restringir aos vistos em sala de aula
- pode aproveitar implementações prontas (paperswithcode.com)