Utilize este identificador para referenciar este registo: http://hdl.handle.net/10400.21/3318
Título: Modelo de data mining para deteção de embolias pulmonares
Autor: Ramalho, Virgínia Valente
Orientador: Pato, Matilde Pós-de-Mina
Datia, Nuno Miguel Soares
Palavras-chave: Embolia pulmonar
Pulmonary embolism
Tomografia computorizada
Computed tomography
KDD Cup 2006
Data mining
Feature selection
Support vector machines
Classificação
Classification
Data de Defesa: Set-2013
Editora: Instituto Superior de Engenharia de Lisboa
Citação: RAMALHO, Virgínia Valente - Modelo de data mining para deteção de embolias pulmonares. Lisboa: Instituto Superior de Engenharia de Lisboa, 2013. Dissertação de mestrado.
Resumo: Este trabalho surge na sequência de um desafio proposto no KDD Cup 2006, detetar a presença de embolia pulmonar a partir de imagens médicas. A embolia pulmonar é o bloqueio da artéria pulmonar ou de um de seus ramos. A rapidez no diagnóstico e tratamento de doentes com embolia pulmonar aguda permite reduzir a sua mortalidade. O desafio clínico, num cenário de emergência, é diagnosticar corretamente o indivíduo que apresenta a patologia, para se dar início ao tratamento. É neste ponto que técnicas de Data Mining podem ser usadas para produzir modelos que auxiliam o médico, radiologista, a tomar decisões. Este trabalho tem como objetivo apresentar modelos de classificação que tenham baixos rácios de falsos positivos na identificação de embolias pulmonares num indivíduo, mas apresentando valores altos de sensibilidade. Foi criado um conjunto de dados, dividido em conjuntos de treino e de teste, que resultam da aplicação de técnicas de Feature Selection e de equilíbrio entre os números de casos de cada classe. Cada par foi utilizado em diferentes algoritmos de classificação. A cada combinação, conjunto de dados e algoritmo, foram aplicadas técnicas de pós-processamento, nomeadamente a alteração do ponto operacional, permitindo alterar as classificações produzidas. A avaliação dos resultados foi obtida através de métricas próprias do domínio do problema, métricas comuns em avaliação de algoritmos de classificação e uma métrica combinada produzida no âmbito deste trabalho. Verifica-se que o algoritmo nu-svm com o tipo kernel radial pode produzir excelentes resultados perante este conjunto de dados.
Abstract: This work follows the challenge proposed in KDD Cup 2006, for detecting the presence of pulmonary embolism from medical images. A Pulmonary embolism is a blockage of the pulmonary artery or one of its branches. Its rapid diagnosis and treatment can reduce the mortality associated with this disease. The clinical challenge in an emergency setting, is to quickly diagnose the embolism, so the treatment can start. This is where data mining techniques can be used to produce models that help radiologists with their decisions. The goal of this paper is to present classification models that have low false positive ratios, but are high sensitive to detect pulmonary embolism in the patients. During the development process, several data sets were created, divided in pairs of training and testing data, resulting from the application of Feature Selection techniques and balance between the numbers of cases of each class. Each pair was used with different classification algorithms, normally used in this domain. For each combination of algorithm and dataset, some post-processing techniques are used, including changing the operational point of the classifiers. The evaluation use domain metrics, common metrics for classifiers evaluation and a combined metric produced for this work. The algorithm nu-kernel SVM with radial type, if correctly parameterized , can produce excellent results against this data set. Models that have produced the best results for this data set were implemented with this algorithm.
Descrição: Trabalho de Projeto para obtenção do grau de Mestre em Engenharia Informática e de Computadores
Peer review: yes
URI: http://hdl.handle.net/10400.21/3318
Aparece nas colecções:ISEL - Eng. Elect. Tel. Comp. - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
Dissertação.pdf1,75 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.