Percorrer por data de Publicação, começado por "2020-02-20"
A mostrar 1 - 1 de 1
Resultados por página
Opções de ordenação
- Aprendizagem por reforço com memória episódicaPublication . Gomes, André Filipe Casaleiro; Morgado, Luís Filipe GraçaA Inteligência Artificial é uma área de estudo que, com o propósito maior de criar sistemas que apresentem comportamento inteligente, tem vindo a desenvolver várias abordagens que tentam atender a esse mesmo propósito, normalmente focando-se nalguma actividade específica associada a inteligência, como a deliberação ou a aprendizagem. Especialmente na aprendizagem, existem vários paradigmas utilizados em sistemas inteligentes, sendo uma delas a aprendizagem por reforço, na capacidade de um sistema melhorar o seu desempenho numa tarefa, sem qualquer conhecimento prévio das possíveis configurações do problema ou das melhores acções a escolher, observando as consequências das suas acções sob a forma de reforços positivos ou negativos. Estes reforços são processados de modo a que as próximas acções possam ser mais direccionadas ao objectivo da tarefa em questão. Têm vindo a ser desenvolvidos ao longo do tempo vários algoritmos para este tipo de aprendizagem, e estes têm sido cada vez mais optimizados à medida que são expostos a problemas progressivamente mais complexos, seja pela adição de subsistemas que contribuam para uma melhoria do desempenho de alguma característica específica do sistema, ou pela total substituição da mesma. A característica em questão nesta dissertação é a estrutura de memória utilizada em sistemas de aprendizagem por reforço, que nos algoritmos clássicos pode vir a apresentar limitações em termos de dimensão e de complexidade. Pretende-se com esta dissertação apresentar alguns dos métodos clássicos de aprendizagem por reforço, e observar se a integração de estruturas de memória episódica pode ou não trazer melhorias para sistemas desta natureza, através do desenvolvimento de uma biblioteca de aprendizagem por reforço que permita visualizar o funcionamento de algoritmos já conhecidos, assim como algoritmos que integrem estruturas de memória episódica.
