Aprendizagem por reforço com memória episódica

Gomes, André Filipe Casaleiro

Publicação

Aprendizagem por reforço com memória episódica

2020-02-20Dissertação de mestrado

dc.contributor.advisor	Morgado, Luís Filipe Graça
dc.contributor.author	Gomes, André Filipe Casaleiro
dc.date.accessioned	2020-11-02T20:15:32Z
dc.date.available	2020-11-02T20:15:32Z
dc.date.issued	2020-02-20
dc.description	Dissertação de Mestrado em Engenharia de Redes de Comunicação e Multimédia	pt_PT
dc.description.abstract	A Inteligência Artificial é uma área de estudo que, com o propósito maior de criar sistemas que apresentem comportamento inteligente, tem vindo a desenvolver várias abordagens que tentam atender a esse mesmo propósito, normalmente focando-se nalguma actividade específica associada a inteligência, como a deliberação ou a aprendizagem. Especialmente na aprendizagem, existem vários paradigmas utilizados em sistemas inteligentes, sendo uma delas a aprendizagem por reforço, na capacidade de um sistema melhorar o seu desempenho numa tarefa, sem qualquer conhecimento prévio das possíveis configurações do problema ou das melhores acções a escolher, observando as consequências das suas acções sob a forma de reforços positivos ou negativos. Estes reforços são processados de modo a que as próximas acções possam ser mais direccionadas ao objectivo da tarefa em questão. Têm vindo a ser desenvolvidos ao longo do tempo vários algoritmos para este tipo de aprendizagem, e estes têm sido cada vez mais optimizados à medida que são expostos a problemas progressivamente mais complexos, seja pela adição de subsistemas que contribuam para uma melhoria do desempenho de alguma característica específica do sistema, ou pela total substituição da mesma. A característica em questão nesta dissertação é a estrutura de memória utilizada em sistemas de aprendizagem por reforço, que nos algoritmos clássicos pode vir a apresentar limitações em termos de dimensão e de complexidade. Pretende-se com esta dissertação apresentar alguns dos métodos clássicos de aprendizagem por reforço, e observar se a integração de estruturas de memória episódica pode ou não trazer melhorias para sistemas desta natureza, através do desenvolvimento de uma biblioteca de aprendizagem por reforço que permita visualizar o funcionamento de algoritmos já conhecidos, assim como algoritmos que integrem estruturas de memória episódica.	pt_PT
dc.description.abstract	Artificial Intelligence is a field of study that, with the greater purpose of building systems that show an intelligent behaviour, has been developing a series of approaches that try to attend to that purpose, usually focusing on some specific activity associated with intelligence, like deliberation or learning. Specifically on the subject of learning, there are several paradigms used in intelligent systems, one of them being reinforcement learning, which consists of a system's capability of improving it's performance on a task, without any prior knowledge of the possible configurations of the problem or of the best actions to choose, observing the consequences of its actions in the form of positive and negative reinforcements. These reinforcements are processed in a way that the following actions can be more directed towards the goal of the task in question. Several algorithms for this type of learning have been developed over time, and these have been increasingly optimized as they are exposed to progressively more complex problems, either by the addition of subsystems that contribute to improving the performance of some speci_c feature of the system, or by its full replacement. The feature in question in this dissertation is the memory structure used in reinforcement learning systems, which in classical algorithms may present limitations in terms of size and complexity. The goal of this dissertation is to present some of the classical reinforcement learning methods, and to observe whether or not the integration of episodic memory structures can bring improvements to such systems, through the development of a reinforcement learning library that allows the visualization of known algorithms, and also algorithms that integrate episodic memory structures.	pt_PT
dc.description.version	N/A	pt_PT
dc.identifier.citation	GOMES, André Filipe Casaleiro - Aprendizagem por reforço com memória episódica. Lisboa: Instituto Superior de Engenharia de Lisboa, 2020. Dissertação de mestrado.	pt_PT
dc.identifier.tid	202533794
dc.identifier.uri	http://hdl.handle.net/10400.21/12321
dc.language.iso	por	pt_PT
dc.peerreviewed	yes	pt_PT
dc.publisher	Instituto Superior de Engenharia de Lisboa	pt_PT
dc.subject	Agentes inteligentes	pt_PT
dc.subject	Intteligent agents	pt_PT
dc.subject	Aprendizagem por reforço	pt_PT
dc.subject	Reinforcement learning	pt_PT
dc.subject	Memória episódica	pt_PT
dc.subject	Episodic memory	pt_PT
dc.subject	Política comportamental	pt_PT
dc.subject	Behaviour policy	pt_PT
dc.title	Aprendizagem por reforço com memória episódica	pt_PT
dc.type	master thesis
dspace.entity.type	Publication
rcaap.rights	openAccess	pt_PT
rcaap.type	masterThesis	pt_PT

Ficheiros

Principais

A mostrar 1 - 1 de 1

Nome:: Dissertação.pdf
Tamanho:: 3.9 MB
Formato:: Adobe Portable Document Format

Ver/Abrir

Coleções

ISEL - Eng. Elect. Tel. Comp. - Dissertações de Mestrado