Estudo sobre multi-armed bandits

  • Diogo Cardoso Fernandes
  • Mario Henrique Adaniya

Resumo

Este trabalho analisa as classificações do algoritmo multi-Armed bandits (MAB) e os seus campos de aplicação, por ser um algoritmo genérico o MAB tem diversas aplicações atuais. Um algoritmo MAB refere-se à uma subclasse do aprendizado por reforço onde o algoritmo, tem um agente que segue um processo sequencial de decisão em que procura otimizar suas ações enquanto melhora seu conhecimento sobre as opções disponíveis no ambiente. Sendo estas aplicações de problema bandidos encontradas em várias áreas de pesquisa envolvendo desde sistemas de recomendações, teste clínicos, problemas de roteamento em redes cognitivas, pesquisa operacional, economia e estatística. O objetivo deste trabalho é realizar um estudo dos problemas bandidos e suas diferentes configurações, e encontrar na literatura quais passos serão abordados em trabalhos futuros.

Biografia do Autor

Diogo Cardoso Fernandes

Graduando do Curso de Ciência da Computação do Centro Universitário Filadélfia - UniFil. fdiogoc@edu.unifil.br

Mario Henrique Adaniya

Orientador: Professor Mario Henrique Adaniya do Curso de Ciência da Computação do Centro Universitário Filadélfia - UniFil. mario.adaniya@unifil.br

Publicado
2023-02-16
Como Citar
Fernandes, D., & Adaniya, M. (2023). Estudo sobre multi-armed bandits. Revista Terra & Cultura: Cadernos De Ensino E Pesquisa, 39(especial), 18-27. Recuperado de http://publicacoes.unifil.br/index.php/Revistateste/article/view/2799/2560