Publicação
Machine learning no teste do desenho do relógio – segmentação e classificação
| authorProfile.email | biblioteca@isel.pt | |
| datacite.subject.fos | Ciências Médicas::Outras Ciências Médicas | |
| dc.contributor.advisor | Figueiredo, Sérgio Rafael Reis | |
| dc.contributor.advisor | Jorge, Pedro Miguel Torres Mendes | |
| dc.contributor.author | Lopes, Rita Carreira | |
| dc.date.accessioned | 2026-02-26T14:13:44Z | |
| dc.date.available | 2026-02-26T14:13:44Z | |
| dc.date.issued | 2025-11-27 | |
| dc.description.abstract | O aumento da esperança média de vida tem vindo a agravar a prevalência de doenças neurodegenerativas, tornando crucial a adoção de métodos de rastreio objetivos e escaláveis. Esta dissertação propõe uma abordagem computacional para o Teste do Desenho do Relógio (TDR), combinando segmentação de imagem e modelos de Machine Learning (ML) para apoiar a classificação automática do desempenho cognitivo. Foi construída uma base de dados original com 117 TDR de participantes portugueses e desenvolvido um pipeline em Python/OpenCV para recorte, pré-processamento, deteção de contornos (Transformada de Hough) e segmentação dos componentes internos (números e ponteiros). O contorno principal foi identificado em todas as imagens e internamente, detetou-se pelo menos um ponteiro em 89,7% dos casos, dois ponteiros em 15,4% dos casos e um número igual ou superior a 12 dígitos em 84,6% dos casos, obtendo-se uma média de identificação de 15,3 dígitos por imagem, confirmando a viabilidade da segmentação apesar da elevada variabilidade gráfica. Foram inicialmente extraídas 27 métricas e, após análise de correlação (com um limiar de 0,80), manteve-se um conjunto de 21. Posteriormente, definiu-se um subconjunto fixo de 9 métricas que cobre de forma equilibrada os elementos de contorno, números e ponteiros. Paralelamente, treinou-se uma ResNet-18 no conjunto de dados EMNIST-Digits para a classificação de elementos candidatos a dígitos (accuracy de 99,65%), integrando esse classificador na pipeline de processamento. Quatro modelos de ML (Regressão Logística, Random Forest, SVM e Gradient Boosting) foram avaliados recorrendo a duas estratégias de seleção de características (Recursive Feature Elimination and Cross Validation com GridSearch e conjunto fixo de features com GridSearch). Na avaliação final com 9 métricas, o Gradient Boosting apresentou o melhor desempenho, com uma accuracy de 83,33%, F1-score de 82,86% e AUC de 0,88, evidenciando boa capacidade discriminatória entre indivíduos com desempenho normal e patológico. Apesar das limitações (amostra reduzida e grafismos heterogéneos), os resultados reforçam a utilidade do método na padronização do TDR e no apoio ao rastreio precoce em contexto clínico nacional. | por |
| dc.description.abstract | Abstract As life expectancy increases, neurodegenerative diseases are becoming more prevalent, underscoring the need for objective and scalable screening tools. This dissertation proposes a computational approach to the Clock Drawing Test (CDT) that combines image segmentation with machine-learning (ML) models to support automatic performance classification. We assembled an original dataset of 117 Portuguese CDTs and built a Python/OpenCV pipeline for cropping, preprocessing, contour detection (Hough Transform), and segmentation of internal components (digits and hands). The main contour was detected in all images; internally, we identified ≥1 hand in 89.7% of cases, 2 hands in 15.4%, and ≥12 digits in 84.6%, with an average of 15.3 digits per image—evidence of feasible segmentation despite substantial graphic variability. A total of 27 features were extracted and, after correlation analysis with a 0.80 threshold, retained 21. A second step defined a fixed 9-feature subset that balances contour, digits, and hands. In parallel, a ResNet-18 trained on EMNIST-Digits to label digit candidates achieved 99.65% accuracy and was integrated into the pipeline. Four ML models—Logistic Regression, Random Forest, SVM, and Gradient Boosting—were evaluated under two feature-selection strategies (RFECV with GridSearch and a fixed-feature set with GridSearch). In the final evaluation using the 9 features, Gradient Boosting delivered the best results (accuracy 83.33%, F1-score 82.86%, AUC 0.88), showing good discrimination between Normal and Abnormal cases. Despite limitations (modest sample size and heterogeneous drawings), the findings indicate that the proposed method can help standardize CDT assessment and support early screening in national clinical settings. | eng |
| dc.identifier.tid | 204221030 | |
| dc.identifier.uri | http://hdl.handle.net/10400.21/22683 | |
| dc.language.iso | por | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Teste do desenho do relógio | |
| dc.subject | Processamento de imagem | |
| dc.subject | Aprendizagem automática | |
| dc.subject | Seleção de características | |
| dc.subject | Classificação | |
| dc.subject | Clock drawing test | |
| dc.subject | Neurodegenerative diseases | |
| dc.subject | Image processing | |
| dc.subject | Machine learning | |
| dc.subject | Classification | |
| dc.title | Machine learning no teste do desenho do relógio – segmentação e classificação | |
| dc.type | master thesis | |
| dspace.entity.type | Publication | |
| thesis.degree.name | Dissertação para obtenção do grau de Mestre em Engenharia Biomédica |
