Relatório Aprendizado por Reforço
Condições de conclusão
Aberto: sábado, 20 jun. 2020, 00:00
Vencimento: segunda-feira, 13 jul. 2020, 23:59
Implementar pelo menos três algoritmos:
- value-based
- policy search
- sample efficient
Utilizar o AI Gym (gym.openai.com) e testar os algoritmos no Cart-Pole
Dicas:
- considere avaliar primeiro as implementações dos algoritmos em um ambiente discreto
- os algoritmos não precisam se restringir aos vistos em sala de aula
- pode aproveitar implementações prontas (paperswithcode.com)