Utilize este identificador para referenciar este registo: http://hdl.handle.net/10400.21/1161
Título: Análise funcional comparativa de algoritmos de aprendizagem por reforço
Autor: Pessoa, João Manuel Dionísio
Orientador: Morgado, Luís
Palavras-chave: Agentes inteligentes
Processos de decisão de Markov
Aprendizagem por reforço
Política avaliativa
Política comportamental
Intelligent agentes
Markov decision processes
Reinforcement learning
Evaluation policy
Behaviour policy
Data de Defesa: Set-2011
Citação: Pessoa, João Manuel Dionísio - Análise funcional comparativa de algoritmos de aprendizagem por reforço. Lisboa: Instituto Superior de Engenharia de Lisboa, 2011. Dissertação de mestrado.
Resumo: De entre todos os paradigmas de aprendizagem actualmente identificados, a Aprendizagem por Reforço revela-se de especial interesse e aplicabilidade nos inúmeros processos que nos rodeiam: desde a solitária sonda que explora o planeta mais remoto, passando pelo programa especialista que aprende a apoiar a decisão médica pela experiencia adquirida, até ao cão de brincar que faz as delícias da criança interagindo com ela e adaptando-se aos seus gostos, e todo um novo mundo que nos rodeia e apela crescentemente a que façamos mais e melhor nesta área. Desde o aparecimento do conceito de aprendizagem por reforço, diferentes métodos tem sido propostos para a sua concretização, cada um deles abordando aspectos específicos. Duas vertentes distintas, mas complementares entre si, apresentam-se como características chave do processo de aprendizagem por reforço: a obtenção de experiência através da exploração do espaço de estados e o aproveitamento do conhecimento obtido através dessa mesma experiência. Esta dissertação propõe-se seleccionar alguns dos métodos propostos mais promissores de ambas as vertentes de exploração e aproveitamento, efectuar uma implementação de cada um destes sobre uma plataforma modular que permita a simulação do uso de agentes inteligentes e, através da sua aplicação na resolução de diferentes configurações de ambientes padrão, gerar estatísticas funcionais que permitam inferir conclusões que retractem entre outros aspectos a sua eficiência e eficácia comparativas em condições específicas.
Of all the currently identified learningparadigms, Reinforcement Learningappears to be of special interest and applicability in the numerous processes that surround us: from the lonely probeexploring the most remote planet, through the specialist programthat learns to support medical decision-making through gained experience, to the toy dogthat delights the child interacting with it and adapting to its liking, it's a whole new world surrounding us beckoning us to do more and better in this area. Since the reinforcement learning concept appeared, different methods have been proposed for its achievement, each of them approaching specific aspects. Two distinct, but complementary, strands appear as key features in the reinforcement learning process: getting experience through the explorationof state space and the exploitationof the knowledge gained through this same experience. This thesis proposes to select some of the current most representative methods, in both explorationand exploitationstrands, implement each of these on a modular platform that allows the simulation of intelligent agents and, through its application in solving different configurations of standard environments, generate functional statistics that allow conclusions to be inferred that reflect, amongst others, their comparative efficiencyand effectivenessin specific conditions.
Peer review: yes
URI: http://hdl.handle.net/10400.21/1161
Aparece nas colecções:ISEL - Eng. Elect. Tel. Comp. - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Dissertação.pdf1,42 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.