Logo do repositório
 
Publicação

Modelo de data mining para deteção de embolias pulmonares

dc.contributor.advisorPato, Matilde Pós-de-Mina
dc.contributor.advisorDatia, Nuno Miguel Soares
dc.contributor.authorRamalho, Virgínia Valente
dc.date.accessioned2014-03-05T18:00:59Z
dc.date.available2014-03-05T18:00:59Z
dc.date.issued2013-09
dc.descriptionTrabalho de Projeto para obtenção do grau de Mestre em Engenharia Informática e de Computadores
dc.description.abstractEste trabalho surge na sequência de um desafio proposto no KDD Cup 2006, detetar a presença de embolia pulmonar a partir de imagens médicas. A embolia pulmonar é o bloqueio da artéria pulmonar ou de um de seus ramos. A rapidez no diagnóstico e tratamento de doentes com embolia pulmonar aguda permite reduzir a sua mortalidade. O desafio clínico, num cenário de emergência, é diagnosticar corretamente o indivíduo que apresenta a patologia, para se dar início ao tratamento. É neste ponto que técnicas de Data Mining podem ser usadas para produzir modelos que auxiliam o médico, radiologista, a tomar decisões. Este trabalho tem como objetivo apresentar modelos de classificação que tenham baixos rácios de falsos positivos na identificação de embolias pulmonares num indivíduo, mas apresentando valores altos de sensibilidade. Foi criado um conjunto de dados, dividido em conjuntos de treino e de teste, que resultam da aplicação de técnicas de Feature Selection e de equilíbrio entre os números de casos de cada classe. Cada par foi utilizado em diferentes algoritmos de classificação. A cada combinação, conjunto de dados e algoritmo, foram aplicadas técnicas de pós-processamento, nomeadamente a alteração do ponto operacional, permitindo alterar as classificações produzidas. A avaliação dos resultados foi obtida através de métricas próprias do domínio do problema, métricas comuns em avaliação de algoritmos de classificação e uma métrica combinada produzida no âmbito deste trabalho. Verifica-se que o algoritmo nu-svm com o tipo kernel radial pode produzir excelentes resultados perante este conjunto de dados.por
dc.description.abstractAbstract: This work follows the challenge proposed in KDD Cup 2006, for detecting the presence of pulmonary embolism from medical images. A Pulmonary embolism is a blockage of the pulmonary artery or one of its branches. Its rapid diagnosis and treatment can reduce the mortality associated with this disease. The clinical challenge in an emergency setting, is to quickly diagnose the embolism, so the treatment can start. This is where data mining techniques can be used to produce models that help radiologists with their decisions. The goal of this paper is to present classification models that have low false positive ratios, but are high sensitive to detect pulmonary embolism in the patients. During the development process, several data sets were created, divided in pairs of training and testing data, resulting from the application of Feature Selection techniques and balance between the numbers of cases of each class. Each pair was used with different classification algorithms, normally used in this domain. For each combination of algorithm and dataset, some post-processing techniques are used, including changing the operational point of the classifiers. The evaluation use domain metrics, common metrics for classifiers evaluation and a combined metric produced for this work. The algorithm nu-kernel SVM with radial type, if correctly parameterized , can produce excellent results against this data set. Models that have produced the best results for this data set were implemented with this algorithm.en
dc.identifier.citationRAMALHO, Virgínia Valente - Modelo de data mining para deteção de embolias pulmonares. Lisboa: Instituto Superior de Engenharia de Lisboa, 2013. Dissertação de mestrado.por
dc.identifier.tid201227410
dc.identifier.urihttp://hdl.handle.net/10400.21/3318
dc.language.isoporpor
dc.peerreviewedyespor
dc.publisherInstituto Superior de Engenharia de Lisboa
dc.subjectEmbolia pulmonarpor
dc.subjectPulmonary embolismen
dc.subjectTomografia computorizadapor
dc.subjectComputed tomographyen
dc.subjectKDD Cup 2006en
dc.subjectData miningen
dc.subjectFeature selectionen
dc.subjectSupport vector machinesen
dc.subjectClassificaçãopor
dc.subjectClassificationen
dc.titleModelo de data mining para deteção de embolias pulmonarespor
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspor
rcaap.typemasterThesispor

Ficheiros

Principais
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
Dissertação.pdf
Tamanho:
1.71 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: