Repository logo
 
Publication

Aprendizagem por reforço com recursos limitados

dc.contributor.advisorMorgado, Luís Filipe Graça
dc.contributor.authorRamada, José Miguel Carvalho
dc.date.accessioned2017-02-14T15:28:53Z
dc.date.available2017-02-14T15:28:53Z
dc.date.issued2017-01-30
dc.descriptionTrabalho Final de Mestrado para obtenção do grau de Mestre em Engenharia de Redes de Comunicação e Multimédiapt_PT
dc.description.abstractA aprendizagem por reforço define um paradigma de aprendizagem comportamental onde o processo de aquisição de conhecimento por parte de um sistema é realizado de forma autónoma. A partir da interacção com o ambiente, são usadas estratégias de selecção de acção para maximizar uma recompensa cumulativa ao longo do tempo. Nesse sentido, este paradigma detém um grande potencial e relevância em múltiplas áreas de aplicação, como agentes inteligentes, aplicações sociais, financeiras, jogos, multimédia, robótica, veículos autónomos, entre outras. Contudo, a possibilidade de aplicação geral deste método de aprendizagem é limitada pela elevada complexidade computacional, que se traduz na utilização extensiva de recursos. Esta complexidade inerente ao processo de aprendizagem, dificulta uma aprendizagem eficiente, sobretudo em tempo real, pelo que este trabalho pretende contribuir com um levantamento de propostas e abordagens que se aproximem de uma solução viável para este problema em diferentes cenários de operação. É objectivo desta dissertação o estudo de métodos de aprendizagem por reforço passíveis de operação em contextos de restrição de recursos computacionais, bem como, a definição das condições em que essa operação é viável. Neste sentido, propõe-se a selecção de alguns dos métodos mais promissores no contexto de operação com recursos limitados e efectuar uma implementação de cada um destes, primeiramente sobre uma plataforma de simulação e, posteriormente, numa plataforma física. A concretização da plataforma física será realizada sob a forma de um agente robótico simples para teste e obtenção de resultados práticos. Em contexto de operação sobre condições específicas, aspectos de eficiência e eficácia serão analisados e comparados entre os diferentes métodos.pt_PT
dc.description.abstractAbstract: Reinforcement learning defines a paradigm of behavioural learning where the process of knowledge acquisition, by a system, is carried out independently. From the interaction with the environment, action selection strategies are used to maximize a cumulative reward over time. In this sense, this paradigm has great potential and relevance in multiple application areas such as intelligent agents, social applications, games and multimedia applications, robotics, autonomous vehicles or financial investments, among others. However, the possibility of general application of this learning method expresses its main feature: high computational complexity; which results in extensive use of computational resources. This inherent complexity in the learning process hinders an effective learning, particularly in real time. This work aims to contribute to a survey of proposals and approaches to reach a viable solution in different scenarios of operation. This thesis aims at the study of reinforcement learning methods capable of operation in computational resource constrained contexts, as well as defining the conditions under which the operation is feasible. Thus, this dissertation proposes a selection of some of the most promising methods with a implementation of each; first on a simulation platform and later in physical platform. The embodiment of the physical platform will be made through a simple robot. In the context of specific operating conditions, efficiency and efficacy issues will be analysed and compared between the different methods.en
dc.description.versionN/Apt_PT
dc.identifier.citationRAMADA, José Miguel Carvalho - Aprendizagem por reforço com recursos limitados. Lisboa: Instituto Superior de Engenharia de Lisboa, 2017. Dissertação de mestrado.pt_PT
dc.identifier.tid201614790
dc.identifier.urihttp://hdl.handle.net/10400.21/6799
dc.language.isoporpt_PT
dc.peerreviewedyespt_PT
dc.publisherInstituto Superior de Engenharia de Lisboapt_PT
dc.subjectAgentes inteligentespt_PT
dc.subjectIntelligent agentesen
dc.subjectInteligência artificialpt_PT
dc.subjectArtificial intelligenceen
dc.subjectAprendizagem por reforçopt_PT
dc.subjectReinforcement learningen
dc.subjectAprendizagem com recursos limitadospt_PT
dc.subjectLearning with limited resourcesen
dc.subjectProcessos de decisão de Markovpt_PT
dc.subjectMarkov decision processesen
dc.subjectModelos de agentes híbridospt_PT
dc.subjectHybrid agent modelsen
dc.subjectPolítica comportamentalpt_PT
dc.subjectBehavioural policyen
dc.titleAprendizagem por reforço com recursos limitadospt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
Dissertação.pdf
Size:
5.15 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: