Browsing by Issue Date, starting with "2020-09-28"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
- Análise e processamento de dados de redes sociaisPublication . Cândido, Carolina Gaspar; Vaz, Cátia Raquel JesusNos últimos anos a utilização de redes sociais tem vindo a aumentar consideravelmente. A rede social Twitter destaca-se pela facilidade de comunicação livre entre os utilizadores e pela sua utilização por parte de figuras dos media e de estado de todo o mundo, o que faz com que seja utilizada como instrumento de comunicação sobre a atualidade de todo o mundo. Esta forte utilização constitui uma considerável quantidade de dados, que quando explorados representam informação sobre as opiniões dos utilizadores. Um exemplo desta exploração de dados são estudos de mercados que já são realizados atualmente com base na análise dos comentários de utilizadores em rede sociais sobre um determinado produto. Atualmente existem muitos estudos e ferramentas disponíveis para, utilizando os dados provenientes do Twitter realizar uma análise sentimental. Quer seja utilizando as hashtags e os emojis ou o próprio texto como indicador da polaridade do tweet. No entanto existe a necessidade da utilização destes dados provenientes do Twitter para a classificação de temas e não só pelo tom apreciativo ou negativo que o tweet transparece. Por classificação de temas tem-se por exemplo, aferir através da análise dos dados das redes sociais quanto ao populismo ou orientação política, podendo esta análise ser utilizada para adaptar uma campanha política. No entanto, não existe atualmente uma plataforma que realize os vários passos desta análise. Neste trabalho foi criada uma plataforma que disponibiliza uma análise de tweets. A plataforma tira partido da framework Apache Spark para as implementações dos algoritmos, assim como da sua capacidade de paralelizar tarefas. O worflow que é necessário para atingir a análise de tweets pretendida, consiste na obtenção de tweets, seguida pela filtragem do seu conteúdo não relevante e, paralelamente, é realizada a classificação e o agrupamento por comunidades tendo em conta a relação de influência entre utilizadores, estabelecida pelo mecanismo de retweet. Como algoritmos de classificação, a plataforma tem disponíveis: Naive Bayes, Random Forest e Neural Networks. Como algoritmos de agrupamento, a plataforma tem disponíveis: k-Means, Gaussian Mixture e Louvain. Como resultado do workflow, a plataforma torna disponível todos os tweets classificados, as comunidades de utilizadores existentes e apresenta análise estatística dos resultados. Foram realizadas avaliações experimentais com as quais foi possível observar que a melhor estratégia, dos algoritmos a utilizar, depende dos dados a analisar.