Publicação
A topic modelling-based recommender system for drugs using user experience reviews [TopicDrugRec]
| authorProfile.email | biblioteca@isel.pt | |
| datacite.subject.fos | Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática | |
| dc.contributor.advisor | Pato, Matilde Pós-de-Mina | |
| dc.contributor.advisor | Datia, Nuno Miguel Soares | |
| dc.contributor.author | Carvalho, Rafael Reis de | |
| dc.date.accessioned | 2026-02-04T11:47:46Z | |
| dc.date.available | 2026-02-04T11:47:46Z | |
| dc.date.issued | 2025-11-20 | |
| dc.description.abstract | Abstract The increasing volume of patient-reported data, alongside the rise of personalised medicine has made it challenging for healthcare professionals to incorporate patient experiences into their clinical decision-making due to information overload and demanding working shifts. Much of this data is available in the form of numerical drug ratings, which often fail to capture the complexity of user experiences by lacking contextual information and response bias. To address this, this dissertation proposes TopicDrugRec, a drug recommender system based on topic modelling and trained on the UCI ML Drug Review dataset, designed to support clinicians in providing safer and more personalised drug prescriptions. It follows a six step methodology: first, exploratory data analysis, data cleaning, followed by sentiment analysis to mitigate rating bias, topic modelling to extract latent themes from patient reports in the form of free text, integration of medical knowledge (drugdrug interactions, side effects and contraindications) to enhance patient safety, and the implementation of a web application and performance evaluation. The recommendation algorithm was designed to incorporate topic similarity, user sentiment, and perceived usefulness, allowing for tunable hyperparameters to generate the recommendations. Three topic modelling approaches were evaluated: Latent Dirichlet Allocation, Non-negative Matrix Factorization, and BERTopic. The evaluation showed semantic similarity, derived from topic modelling, to be the most influential factor in recommendation quality. Additionally, grouping medical conditions into ICD-11 categories mitigated dataset imbalanced and improved coverage, with the NMF-based model achieving the best performance on this setup, with a Precision@10 of 0.513 and Mean Reciprocal Rank @10 of 0.676. Despite being a proof-of-concept, these findings demonstrate TopicDrugRec’s potential in reducing information overload, enhancing medic-patient interaction and integrating patient feedback into data-driven decision-making. Additionally, it lays foundation for future work, including real world validation, curating more complex datasets with patient information, and providing explainable recommendations. | eng |
| dc.description.abstract | O aumento do volume de dados reportado por pacientes face a experiências passadas, aliado ao avanço da medicina personalizada, tem tornado desafiante para os profissionais de saúde incorporar a experiência dos doentes na tomada de decisão clínica devido ao excesso de informação e turnos prolongados. Muita desta informação provém das classificações numéricas, que não captam a complexidade da experiência do paciente dado que carecem de contexto pessoal, estando sujeito ao enviesamento. Com o objetivo de colmatar estas limitações, esta dissertação propõe o TopicDrugRec, um sistema de recomendação de medicamentos baseado em topic modelling, treinado no conjunto de dados UCI ML Drug Review. A sua implementação seguiu uma metodologia em seis etapas: análise exploratória e lim peza dos dados, análise de sentimento para mitigar o enviesamento, topic modelling para extração de temas latentes das reviews, integração de conhecimento biomédico para reforçar a segurança do paciente, e por fim, a implementação numa aplicação web e avaliação de performance. O algoritmo de recomendação incorpora como hiperparâmetros a semelhança de tópicos, o sentimento do utilizador e concordância com a avaliação, que podem ser ajustados para gerar as recomendações. Foram avaliadas três abordagens de topic modelling: Latent Dirichlet Allocation, Non-Negative Matrix Factorization e BERTopic. Os resultados demonstram que a semelhança de tópicos, derivada do topic modelling, é o fator mais influente na qualidade das recomendações. Em simultâneo, a agregação das condições médicas em categorias ICD-11 demonstrou mitigar o desbalanceamento do conjunto de dados, e melhorou a cobertura, sendo que o modelo NMF apresentou o melhor desempenho neste cenário, com uma Precisão@10 de 0.513, e Mean Reciprocal Rank@10 de 0.676. Apesar de se tratar de uma prova de conceito, os resultados demonstram o potencial do TopicDrugRec em mitigar os efeitos do excesso de informação, integrar o feedback dos pacientes, e de potenciar maior interação entre o médico e o paciente. Para além disso, estabelece também base para trabalho futuro, incluindo a validação do algoritmo em cenários clinicos reais, a criação de conjuntos de dados mais completos com informação do paciente e de disponibilizar uma explicação informada das recomendações. | por |
| dc.identifier.tid | 204178053 | |
| dc.identifier.uri | http://hdl.handle.net/10400.21/22635 | |
| dc.language.iso | eng | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Recommender system | |
| dc.subject | Drug recommender system | |
| dc.subject | Topic modelling | |
| dc.subject | Sentiment analysis | |
| dc.subject | Patient reported outcomes | |
| dc.subject | Sistema de recomendação | |
| dc.subject | Sistema de Recomendação de medicamentos | |
| dc.subject | Análise de sentimento | |
| dc.subject | Relato de pacientes | |
| dc.title | A topic modelling-based recommender system for drugs using user experience reviews [TopicDrugRec] | eng |
| dc.type | master thesis | |
| dspace.entity.type | Publication | |
| thesis.degree.name | Dissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores |
