Percorrer por autor "Garzillo, Monique Joaquim Witt"
A mostrar 1 - 1 de 1
Resultados por página
Opções de ordenação
- Classificação de tumores cerebrais com algoritmos de machine learningPublication . Garzillo, Monique Joaquim Witt; Vieira, Ana Luísa; Freire, LuísA Inteligência Artificial (IA) e a Data Science são dois dos assuntos mais debatidos atualmente na Saúde. A IA tem sido considerada como uma parte essencial na resolução de problemas nesse campo e mesmo um quarto paradigma da Ciência como um todo, junto com as componentes Teórica, Experimental e Computacional. Neste trabalho são feitos testes com algoritmos de Machine Learning para a classificação multiclasse de três datasets de imagens de Ressonância Magnética de tumores cerebrais. O objetivo principal dos testes com datasets diferentes é verificar a influência que os dados têm sobre a acurácia de cada um dos algoritmos; foram testados diferentes algoritmos e analisado qual deles (e com quais ajustes de parâmetros, quando há) que apresenta melhor desempenho; foram também testados diferentes splits dos dados para averiguar o quanto a divisão deles interfere no resultado da acurácia. Foram utilizados três datasets (conjuntos de imagens) com 4 categorias de tumor cerebral: glioma, meningioma, tumor da glândula pituitária e sem tumor. O primeiro dataset é composto por 2870 imagens diferentes, o segundo por 7020 imagens, e o terceiro é um subconjunto do segundo, com 2870 imagens, com a mesma distribuição por categorias que o primeiro. Os algoritmos usados foram o Decision Tree (com os parâmetros definidos por defeito), o Random Forest (com variação do número de estimadores); o Linear Discriminant Analysis (que não tem parâmetros para ajustar); o Support Vector Machine com os 4 kernels diferentes disponíveis (Linear, Polinomial, RBF e Sigmoide) e variando o parâmetro de regularização; e o k-Nearest Neighbors, variando o número de vizinhos. Além disso, em cada caso também foram testados três splits diferentes – separação entre dados de treino e teste: 70%, 80% e 90% dos dados para treino. Como medida de desempenho foi usada a acurácia, e realizados testes de significância estatística entre resultados. O algoritmo com melhores resultados foi o Random Forest, que atingiu 96,425%, seguido pelo kernel RBF do Support Vector Machine, com 93,615%. Os resultados são comparáveis a outros trabalhos publicados que apresentam metodologias semelhantes.
