Relatório Aprendizado por Reforço
Conditions d’achèvement
Ouvert le : samedi 20 juin 2020, 00:00
À remettre : lundi 13 juillet 2020, 23:59
Implementar pelo menos três algoritmos:
- value-based
- policy search
- sample efficient
Utilizar o AI Gym (gym.openai.com) e testar os algoritmos no Cart-Pole
Dicas:
- considere avaliar primeiro as implementações dos algoritmos em um ambiente discreto
- os algoritmos não precisam se restringir aos vistos em sala de aula
- pode aproveitar implementações prontas (paperswithcode.com)