| Name: | Description: | Size: | Format: | |
|---|---|---|---|---|
| 2.21 MB | Adobe PDF |
Advisor(s)
Abstract(s)
Abstract
The increasing adoption of cryptocurrencies, especially Bitcoin, has significantly altered the financial landscape, enabling decentralised and pseudonymous transactions. While these characteristics foster innovation, they also present serious challenges in detecting fraudulent behaviour, including money laundering and investment scams. This dissertation introduces Bitcoin Anomaly Detection (BAD), a hybrid machine learning framework designed to detect anomalous transactions on the Bitcoin blockchain. The methodology integrates supervised and unsupervised learning techniques, applied to the Elliptic dataset comprising over 200,000 transactions with temporal and graph-based features. Feature engineering, class imbalance handling (e.g., SMOTE + ENN), and dimensionality reduction (PCA, UMAP) are employed. Several models are evaluated, including XGBoost, RF, and GNN, achieving up to 97.5% accuracy, 96.2% recall, and a false positive rate below 4.5%. Graph analysis revealed that illicit transactions tend to form sparsely connected “sink” nodes—receiving many inputs (high in-degree) but sending no outputs (zero out-degree)—a pattern typical of laundering. Semi-supervised learning and association rule mining were used to label unknown data and enhance classification reliability. The final pipeline combines feature selection, class instance sampling, and a hybrid semisupervised learning approach—bridging supervised and unsupervised methods—to classify transactions with high accuracy and robustness. Key challenges addressed include the scarcity of labelled data, severe class imbalance, and the evolving nature of fraud techniques. XAI components were incorporated to ensure interpretability and compliance with regulatory frameworks such as Markets in Crypto-Assets (MiCA) and Financial Action Task Force (FATF). The findings from our experimental evaluation demonstrate the viability of adaptive, interpretable AI solutions for safeguarding decentralised financial ecosystems and supporting efforts in Anti-Money Laundering (AML) and law enforcement.
A crescente adoção de criptomoedas, especialmente o Bitcoin, alterou significativamente o panorama financeiro, permitindo transações descentralizadas e pseudónimas. Embora estas características promovam a inovação, também criam desafios substanciais na deteção de comportamentos fraudulentos, incluindo branqueamento de capitais e esquemas de investimento ilícitos. Esta dissertação apresenta o Bitcoin Anomaly Detection (BAD), uma framework híbrida de aprendizagem automática desenvolvida para detetar transações anómalas na blockchain do Bitcoin. A metodologia integra técnicas de aprendizagem supervisionada e não supervisionada, aplicadas ao conjunto de dados Elliptic, com mais de 200,000 transações com caraterísticas temporais e baseados em grafos. São utilizadas técnicas de engenharia de caraterísticas, reequilíbrio de classes (ex. SMOTE + ENN) e redução de dimensionalidade (PCA, UMAP). Foram avaliados vários modelos, incluindo XGBoost, RF e GNN, alcançando até 97,5% de precisão, 96,2% de recall e uma taxa de falsos positivos inferior a 4,5%. A análise de rede revelou que as transações ilícitas tendem a formar nós com ligações escassas, com elevado grau de entrada e nenhum de saída, indicando padrões de branqueamento. Técnicas de aprendizagem semi-supervisionada e mineração de regras de associação foram aplicadas para rotular dados desconhecidos e reforçar a fiabilidade da classificação. O pipeline final combina a seleção de caraterísticas, a amostragem de instâncias de classe e uma abordagem híbrida de aprendizagem semi-supervisionada —que combina métodos supervisionados e não supervisionados— para classificar transacções com elevada precisão e robustez. Os principais desafios abordados incluem a escassez de dados etiquetados, o forte desbalanceamento entre classes e a natureza evolutiva dos esquemas de fraude. Foram ainda incorporadas técnicas de Inteligência Artificial Explicável (XAI), garantindo a interpretabilidade e conformidade com os quadros regulamentares, tais como MiCA e o FATF. Os resultados da nossa avaliação experimental demonstram a viabilidade de soluções de IA adaptáveis e interpretáveis para salvaguardar os ecossistemasa financeiros descentralizados, apoiando iniciativas de prevenção de branqueamento de capitais e investigação criminal.
A crescente adoção de criptomoedas, especialmente o Bitcoin, alterou significativamente o panorama financeiro, permitindo transações descentralizadas e pseudónimas. Embora estas características promovam a inovação, também criam desafios substanciais na deteção de comportamentos fraudulentos, incluindo branqueamento de capitais e esquemas de investimento ilícitos. Esta dissertação apresenta o Bitcoin Anomaly Detection (BAD), uma framework híbrida de aprendizagem automática desenvolvida para detetar transações anómalas na blockchain do Bitcoin. A metodologia integra técnicas de aprendizagem supervisionada e não supervisionada, aplicadas ao conjunto de dados Elliptic, com mais de 200,000 transações com caraterísticas temporais e baseados em grafos. São utilizadas técnicas de engenharia de caraterísticas, reequilíbrio de classes (ex. SMOTE + ENN) e redução de dimensionalidade (PCA, UMAP). Foram avaliados vários modelos, incluindo XGBoost, RF e GNN, alcançando até 97,5% de precisão, 96,2% de recall e uma taxa de falsos positivos inferior a 4,5%. A análise de rede revelou que as transações ilícitas tendem a formar nós com ligações escassas, com elevado grau de entrada e nenhum de saída, indicando padrões de branqueamento. Técnicas de aprendizagem semi-supervisionada e mineração de regras de associação foram aplicadas para rotular dados desconhecidos e reforçar a fiabilidade da classificação. O pipeline final combina a seleção de caraterísticas, a amostragem de instâncias de classe e uma abordagem híbrida de aprendizagem semi-supervisionada —que combina métodos supervisionados e não supervisionados— para classificar transacções com elevada precisão e robustez. Os principais desafios abordados incluem a escassez de dados etiquetados, o forte desbalanceamento entre classes e a natureza evolutiva dos esquemas de fraude. Foram ainda incorporadas técnicas de Inteligência Artificial Explicável (XAI), garantindo a interpretabilidade e conformidade com os quadros regulamentares, tais como MiCA e o FATF. Os resultados da nossa avaliação experimental demonstram a viabilidade de soluções de IA adaptáveis e interpretáveis para salvaguardar os ecossistemasa financeiros descentralizados, apoiando iniciativas de prevenção de branqueamento de capitais e investigação criminal.
Description
Keywords
Anomaly detection Bitcoin Blockchain Fraud detection GNN Graph analysis Machine learning MiCA XAI Deteção de anomalias Deteção de fraude Análise de grafos Aprendizagem automática
