Logo do repositório
 
Publicação

Machine learning no teste do desenho do relógio – segmentação e classificação

authorProfile.emailbiblioteca@isel.pt
datacite.subject.fosCiências Médicas::Outras Ciências Médicas
dc.contributor.advisorFigueiredo, Sérgio Rafael Reis
dc.contributor.advisorJorge, Pedro Miguel Torres Mendes
dc.contributor.authorLopes, Rita Carreira
dc.date.accessioned2026-02-26T14:13:44Z
dc.date.available2026-02-26T14:13:44Z
dc.date.issued2025-11-27
dc.description.abstractO aumento da esperança média de vida tem vindo a agravar a prevalência de doenças neurodegenerativas, tornando crucial a adoção de métodos de rastreio objetivos e escaláveis. Esta dissertação propõe uma abordagem computacional para o Teste do Desenho do Relógio (TDR), combinando segmentação de imagem e modelos de Machine Learning (ML) para apoiar a classificação automática do desempenho cognitivo. Foi construída uma base de dados original com 117 TDR de participantes portugueses e desenvolvido um pipeline em Python/OpenCV para recorte, pré-processamento, deteção de contornos (Transformada de Hough) e segmentação dos componentes internos (números e ponteiros). O contorno principal foi identificado em todas as imagens e internamente, detetou-se pelo menos um ponteiro em 89,7% dos casos, dois ponteiros em 15,4% dos casos e um número igual ou superior a 12 dígitos em 84,6% dos casos, obtendo-se uma média de identificação de 15,3 dígitos por imagem, confirmando a viabilidade da segmentação apesar da elevada variabilidade gráfica. Foram inicialmente extraídas 27 métricas e, após análise de correlação (com um limiar de 0,80), manteve-se um conjunto de 21. Posteriormente, definiu-se um subconjunto fixo de 9 métricas que cobre de forma equilibrada os elementos de contorno, números e ponteiros. Paralelamente, treinou-se uma ResNet-18 no conjunto de dados EMNIST-Digits para a classificação de elementos candidatos a dígitos (accuracy de 99,65%), integrando esse classificador na pipeline de processamento. Quatro modelos de ML (Regressão Logística, Random Forest, SVM e Gradient Boosting) foram avaliados recorrendo a duas estratégias de seleção de características (Recursive Feature Elimination and Cross Validation com GridSearch e conjunto fixo de features com GridSearch). Na avaliação final com 9 métricas, o Gradient Boosting apresentou o melhor desempenho, com uma accuracy de 83,33%, F1-score de 82,86% e AUC de 0,88, evidenciando boa capacidade discriminatória entre indivíduos com desempenho normal e patológico. Apesar das limitações (amostra reduzida e grafismos heterogéneos), os resultados reforçam a utilidade do método na padronização do TDR e no apoio ao rastreio precoce em contexto clínico nacional.por
dc.description.abstractAbstract As life expectancy increases, neurodegenerative diseases are becoming more prevalent, underscoring the need for objective and scalable screening tools. This dissertation proposes a computational approach to the Clock Drawing Test (CDT) that combines image segmentation with machine-learning (ML) models to support automatic performance classification. We assembled an original dataset of 117 Portuguese CDTs and built a Python/OpenCV pipeline for cropping, preprocessing, contour detection (Hough Transform), and segmentation of internal components (digits and hands). The main contour was detected in all images; internally, we identified ≥1 hand in 89.7% of cases, 2 hands in 15.4%, and ≥12 digits in 84.6%, with an average of 15.3 digits per image—evidence of feasible segmentation despite substantial graphic variability. A total of 27 features were extracted and, after correlation analysis with a 0.80 threshold, retained 21. A second step defined a fixed 9-feature subset that balances contour, digits, and hands. In parallel, a ResNet-18 trained on EMNIST-Digits to label digit candidates achieved 99.65% accuracy and was integrated into the pipeline. Four ML models—Logistic Regression, Random Forest, SVM, and Gradient Boosting—were evaluated under two feature-selection strategies (RFECV with GridSearch and a fixed-feature set with GridSearch). In the final evaluation using the 9 features, Gradient Boosting delivered the best results (accuracy 83.33%, F1-score 82.86%, AUC 0.88), showing good discrimination between Normal and Abnormal cases. Despite limitations (modest sample size and heterogeneous drawings), the findings indicate that the proposed method can help standardize CDT assessment and support early screening in national clinical settings.eng
dc.identifier.tid204221030
dc.identifier.urihttp://hdl.handle.net/10400.21/22683
dc.language.isopor
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectTeste do desenho do relógio
dc.subjectProcessamento de imagem
dc.subjectAprendizagem automática
dc.subjectSeleção de características
dc.subjectClassificação
dc.subjectClock drawing test
dc.subjectNeurodegenerative diseases
dc.subjectImage processing
dc.subjectMachine learning
dc.subjectClassification
dc.titleMachine learning no teste do desenho do relógio – segmentação e classificação
dc.typemaster thesis
dspace.entity.typePublication
thesis.degree.nameDissertação para obtenção do grau de Mestre em Engenharia Biomédica

Ficheiros

Principais
A mostrar 1 - 1 de 1
A carregar...
Miniatura
Nome:
RitaLopes_MEB.pdf
Tamanho:
1.55 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
4.03 KB
Formato:
Item-specific license agreed upon to submission
Descrição: