Logo do repositório
 
Publicação

A topic modelling-based recommender system for drugs using user experience reviews [TopicDrugRec]

authorProfile.emailbiblioteca@isel.pt
datacite.subject.fosEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
dc.contributor.advisorPato, Matilde Pós-de-Mina
dc.contributor.advisorDatia, Nuno Miguel Soares
dc.contributor.authorCarvalho, Rafael Reis de
dc.date.accessioned2026-02-04T11:47:46Z
dc.date.available2026-02-04T11:47:46Z
dc.date.issued2025-11-20
dc.description.abstractAbstract The increasing volume of patient-reported data, alongside the rise of personalised medicine has made it challenging for healthcare professionals to incorporate patient experiences into their clinical decision-making due to information overload and demanding working shifts. Much of this data is available in the form of numerical drug ratings, which often fail to capture the complexity of user experiences by lacking contextual information and response bias. To address this, this dissertation proposes TopicDrugRec, a drug recommender system based on topic modelling and trained on the UCI ML Drug Review dataset, designed to support clinicians in providing safer and more personalised drug prescriptions. It follows a six step methodology: first, exploratory data analysis, data cleaning, followed by sentiment analysis to mitigate rating bias, topic modelling to extract latent themes from patient reports in the form of free text, integration of medical knowledge (drugdrug interactions, side effects and contraindications) to enhance patient safety, and the implementation of a web application and performance evaluation. The recommendation algorithm was designed to incorporate topic similarity, user sentiment, and perceived usefulness, allowing for tunable hyperparameters to generate the recommendations. Three topic modelling approaches were evaluated: Latent Dirichlet Allocation, Non-negative Matrix Factorization, and BERTopic. The evaluation showed semantic similarity, derived from topic modelling, to be the most influential factor in recommendation quality. Additionally, grouping medical conditions into ICD-11 categories mitigated dataset imbalanced and improved coverage, with the NMF-based model achieving the best performance on this setup, with a Precision@10 of 0.513 and Mean Reciprocal Rank @10 of 0.676. Despite being a proof-of-concept, these findings demonstrate TopicDrugRec’s potential in reducing information overload, enhancing medic-patient interaction and integrating patient feedback into data-driven decision-making. Additionally, it lays foundation for future work, including real world validation, curating more complex datasets with patient information, and providing explainable recommendations.eng
dc.description.abstractO aumento do volume de dados reportado por pacientes face a experiências passadas, aliado ao avanço da medicina personalizada, tem tornado desafiante para os profissionais de saúde incorporar a experiência dos doentes na tomada de decisão clínica devido ao excesso de informação e turnos prolongados. Muita desta informação provém das classificações numéricas, que não captam a complexidade da experiência do paciente dado que carecem de contexto pessoal, estando sujeito ao enviesamento. Com o objetivo de colmatar estas limitações, esta dissertação propõe o TopicDrugRec, um sistema de recomendação de medicamentos baseado em topic modelling, treinado no conjunto de dados UCI ML Drug Review. A sua implementação seguiu uma metodologia em seis etapas: análise exploratória e lim peza dos dados, análise de sentimento para mitigar o enviesamento, topic modelling para extração de temas latentes das reviews, integração de conhecimento biomédico para reforçar a segurança do paciente, e por fim, a implementação numa aplicação web e avaliação de performance. O algoritmo de recomendação incorpora como hiperparâmetros a semelhança de tópicos, o sentimento do utilizador e concordância com a avaliação, que podem ser ajustados para gerar as recomendações. Foram avaliadas três abordagens de topic modelling: Latent Dirichlet Allocation, Non-Negative Matrix Factorization e BERTopic. Os resultados demonstram que a semelhança de tópicos, derivada do topic modelling, é o fator mais influente na qualidade das recomendações. Em simultâneo, a agregação das condições médicas em categorias ICD-11 demonstrou mitigar o desbalanceamento do conjunto de dados, e melhorou a cobertura, sendo que o modelo NMF apresentou o melhor desempenho neste cenário, com uma Precisão@10 de 0.513, e Mean Reciprocal Rank@10 de 0.676. Apesar de se tratar de uma prova de conceito, os resultados demonstram o potencial do TopicDrugRec em mitigar os efeitos do excesso de informação, integrar o feedback dos pacientes, e de potenciar maior interação entre o médico e o paciente. Para além disso, estabelece também base para trabalho futuro, incluindo a validação do algoritmo em cenários clinicos reais, a criação de conjuntos de dados mais completos com informação do paciente e de disponibilizar uma explicação informada das recomendações.por
dc.identifier.tid204178053
dc.identifier.urihttp://hdl.handle.net/10400.21/22635
dc.language.isoeng
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectRecommender system
dc.subjectDrug recommender system
dc.subjectTopic modelling
dc.subjectSentiment analysis
dc.subjectPatient reported outcomes
dc.subjectSistema de recomendação
dc.subjectSistema de Recomendação de medicamentos
dc.subjectAnálise de sentimento
dc.subjectRelato de pacientes
dc.titleA topic modelling-based recommender system for drugs using user experience reviews [TopicDrugRec]eng
dc.typemaster thesis
dspace.entity.typePublication
thesis.degree.nameDissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores

Ficheiros

Principais
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
RafaelCarvalho_MEIC.pdf
Tamanho:
19.88 MB
Formato:
Adobe Portable Document Format
Licença
A mostrar 1 - 1 de 1
Miniatura indisponível
Nome:
license.txt
Tamanho:
4.03 KB
Formato:
Item-specific license agreed upon to submission
Descrição: