Repository logo
 
No Thumbnail Available
Publication

Learning portuguese fishing data patterns

Use this identifier to reference this record.
Name:Description:Size:Format: 
Dissertação.pdf11.88 MBAdobe PDF Download

Abstract(s)

Portugal is a country historically linked to the sea with fishing being a very important activities for the Portuguese economy. On the other hand, tax fraud is present on fishery as well as in other economic activity and it is a harmful phenomenon for Portugal. For that reason there is a need to create ways to inspect this activity more efficiently. With the motivation to contribute to the resolution of this problem, the objectives of this dissertation are to analyze the data in order to derive patterns, which, when compared to real data can generate alerts for the existence of unusual activities. Concretely, the first objective seeks to infer when the vessels are fishing, and when they fish in an area other than the usual one, this using only velocity and location data. The second objective consists in classify the fishing license by taking into account the VMS data, more precisely velocity and position data. There are several studies developed in this area. What separates my work from the other studies found is the use of only data created by a device on board, in which there is no human interference. In the current developed solution the data is produced by the system MONICAP, a BLUEBOX system, mandatory for vessels over 12 meters in the European Union. This system records velocity, heading and location data. Concerning the first objective, a machine learning system, using velocity data, will be used to identify whether the vessel is fishing. The methodology used is based in clustering algorithms, to identify whether the fishing zone is usual or not. In addition the Hill Climbing algorithm and the Kernel density estimator are used to classify data as fishing or not. This system is designed so that it can be integrated into MONICAP itself. For the second objective, we will use data mining methods, as Random Forests, Neural Networks an others, to analyze possible associations between the data provided by MONICAP and the type of fishing license. The models were tested and evaluated using well-established data mining techniques following the procedures in Cross Industry Standard Process for Data Mining. The second solution allowed to show that it is possible to classify the fishing license by taking into account the VMS data, more precisely velocity and position data. The use of velocity and location turns out to be enough to create systems capable of satisfying the proposed objectives, so goals are all achieved.
Portugal é um país historicamente ligado ao mar, sendo a pesca uma atividade muito importante para a economia portuguesa. Por outro lado, a fraude fiscal está presente tanto na pesca como noutra atividade económica e é um fenómeno nocivo para Portugal. Por isso, é necessário criar formas de fiscalizar esta atividade de forma mais eficiente. Com a motivação de contribuir para a resolução deste problema, os objetivos desta dissertação são analisar os dados de forma a derivar padrões que, quando comparados com dados reais, podem gerar alertas para a existência de atividades inusitadas. Concretamente, o primeiro objetivo visa inferir quando as embarcações estão a pescar e quando pescam numa zona diferente da habitual, utilizando apenas dados de velocidade e localização. O segundo objetivo consiste em classificar a licença de pesca tendo em conta os dados VMS, mais precisamente os dados de velocidade e posição. Existem vários estudos desenvolvidos nesta área. O que separa o meu trabalho de outros estudos que encontrei é o uso de apenas dados criados por um dispositivo de bordo, no qual não há interferência humana. Nesta solução os dados são produzidos pelo sistema MONICAP, um sistema bluebox, obrigatório para embarcações com mais de 12 metros na União Europeia. Este sistema regista dados de velocidade, direção e localização. Em relação ao primeiro objetivo, será utilizado um sistema de aprendizagem automática, utilizando dados de velocidade, para identificar se a embarcação está a pescar. A metodologia utilizada baseia-se em algoritmos de agrupamento, para identificar se a zona de pesca é habitual ou não. Além disso, o algoritmo Hill Climbing e o estimador de densidade do Kernel são usados para classificar os dados como pesca ou não. Este sistema foi projetado de forma que possa ser integrado no próprio MONICAP. Para o segundo objetivo, usaremos métodos de mineração de dados, como Random Forests, Neural Networks e outros, para analisar possíveis associações entre os dados fornecidos pelo MONICAP e a licença de pesca do navio. Os modelos foram testados e avaliados usando técnicas de mineração de dados bem estabelecidas, seguindo os procedimentos do Processo Padrão de Cross Industry para Data Mining. A segunda solução permitiu mostrar que é possível classificar a licença de pesca tendo em conta os dados VMS, mais precisamente dados de velocidade e posição. O uso da velocidade e localização acaba por ser suficiente para criar sistemas capazes de satisfazer os objetivos propostos, concluindo-se que os objectivos propostos foram alcançados.

Description

Projecto final para obtenção do grau de Mestre em Engenharia Informática e de Computadores

Keywords

Vessel monitoring system Sistema de monitorizaação de embarcações Data mining Mineração de dados Fishing Pescas

Citation

LAGE, Serge Gaspar Aguiar Fernandes - Learning portuguese fishing data patterns. Lisboa: Instituto Superior de Engenharia de Lisboa, 2020. Dissertação de mestrado.

Research Projects

Organizational Units

Journal Issue

Publisher

Instituto Superior de Engenharia de Lisboa

CC License