Machine learning no teste do desenho do relógio – segmentação e classificação

Lopes, Rita Carreira

Publicação

Machine learning no teste do desenho do relógio – segmentação e classificação

2025-11-27Dissertação de mestrado

authorProfile.email	biblioteca@isel.pt
datacite.subject.fos	Ciências Médicas::Outras Ciências Médicas
dc.contributor.advisor	Figueiredo, Sérgio Rafael Reis
dc.contributor.advisor	Jorge, Pedro Miguel Torres Mendes
dc.contributor.author	Lopes, Rita Carreira
dc.date.accessioned	2026-02-26T14:13:44Z
dc.date.available	2026-02-26T14:13:44Z
dc.date.issued	2025-11-27
dc.description.abstract	O aumento da esperança média de vida tem vindo a agravar a prevalência de doenças neurodegenerativas, tornando crucial a adoção de métodos de rastreio objetivos e escaláveis. Esta dissertação propõe uma abordagem computacional para o Teste do Desenho do Relógio (TDR), combinando segmentação de imagem e modelos de Machine Learning (ML) para apoiar a classificação automática do desempenho cognitivo. Foi construída uma base de dados original com 117 TDR de participantes portugueses e desenvolvido um pipeline em Python/OpenCV para recorte, pré-processamento, deteção de contornos (Transformada de Hough) e segmentação dos componentes internos (números e ponteiros). O contorno principal foi identificado em todas as imagens e internamente, detetou-se pelo menos um ponteiro em 89,7% dos casos, dois ponteiros em 15,4% dos casos e um número igual ou superior a 12 dígitos em 84,6% dos casos, obtendo-se uma média de identificação de 15,3 dígitos por imagem, confirmando a viabilidade da segmentação apesar da elevada variabilidade gráfica. Foram inicialmente extraídas 27 métricas e, após análise de correlação (com um limiar de 0,80), manteve-se um conjunto de 21. Posteriormente, definiu-se um subconjunto fixo de 9 métricas que cobre de forma equilibrada os elementos de contorno, números e ponteiros. Paralelamente, treinou-se uma ResNet-18 no conjunto de dados EMNIST-Digits para a classificação de elementos candidatos a dígitos (accuracy de 99,65%), integrando esse classificador na pipeline de processamento. Quatro modelos de ML (Regressão Logística, Random Forest, SVM e Gradient Boosting) foram avaliados recorrendo a duas estratégias de seleção de características (Recursive Feature Elimination and Cross Validation com GridSearch e conjunto fixo de features com GridSearch). Na avaliação final com 9 métricas, o Gradient Boosting apresentou o melhor desempenho, com uma accuracy de 83,33%, F1-score de 82,86% e AUC de 0,88, evidenciando boa capacidade discriminatória entre indivíduos com desempenho normal e patológico. Apesar das limitações (amostra reduzida e grafismos heterogéneos), os resultados reforçam a utilidade do método na padronização do TDR e no apoio ao rastreio precoce em contexto clínico nacional.	por
dc.description.abstract	Abstract As life expectancy increases, neurodegenerative diseases are becoming more prevalent, underscoring the need for objective and scalable screening tools. This dissertation proposes a computational approach to the Clock Drawing Test (CDT) that combines image segmentation with machine-learning (ML) models to support automatic performance classification. We assembled an original dataset of 117 Portuguese CDTs and built a Python/OpenCV pipeline for cropping, preprocessing, contour detection (Hough Transform), and segmentation of internal components (digits and hands). The main contour was detected in all images; internally, we identified ≥1 hand in 89.7% of cases, 2 hands in 15.4%, and ≥12 digits in 84.6%, with an average of 15.3 digits per image—evidence of feasible segmentation despite substantial graphic variability. A total of 27 features were extracted and, after correlation analysis with a 0.80 threshold, retained 21. A second step defined a fixed 9-feature subset that balances contour, digits, and hands. In parallel, a ResNet-18 trained on EMNIST-Digits to label digit candidates achieved 99.65% accuracy and was integrated into the pipeline. Four ML models—Logistic Regression, Random Forest, SVM, and Gradient Boosting—were evaluated under two feature-selection strategies (RFECV with GridSearch and a fixed-feature set with GridSearch). In the final evaluation using the 9 features, Gradient Boosting delivered the best results (accuracy 83.33%, F1-score 82.86%, AUC 0.88), showing good discrimination between Normal and Abnormal cases. Despite limitations (modest sample size and heterogeneous drawings), the findings indicate that the proposed method can help standardize CDT assessment and support early screening in national clinical settings.	eng
dc.identifier.tid	204221030
dc.identifier.uri	http://hdl.handle.net/10400.21/22683
dc.language.iso	por
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject	Teste do desenho do relógio
dc.subject	Processamento de imagem
dc.subject	Aprendizagem automática
dc.subject	Seleção de características
dc.subject	Classificação
dc.subject	Clock drawing test
dc.subject	Neurodegenerative diseases
dc.subject	Image processing
dc.subject	Machine learning
dc.subject	Classification
dc.title	Machine learning no teste do desenho do relógio – segmentação e classificação
dc.type	master thesis
dspace.entity.type	Publication
thesis.degree.name	Dissertação para obtenção do grau de Mestre em Engenharia Biomédica

Ficheiros

Principais

A mostrar 1 - 1 de 1

Nome:: RitaLopes_MEB.pdf
Tamanho:: 1.55 MB
Formato:: Adobe Portable Document Format

Ver/Abrir

Licença

A mostrar 1 - 1 de 1

Nome:: license.txt
Tamanho:: 4.03 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Ver/Abrir

Coleções

ISEL - Engenharia Biomédica - Dissertações de Mestrado