Name: | Description: | Size: | Format: | |
---|---|---|---|---|
11.88 MB | Adobe PDF |
Abstract(s)
Portugal is a country historically linked to the sea with fishing being a very important
activities for the Portuguese economy. On the other hand, tax fraud is present on fishery
as well as in other economic activity and it is a harmful phenomenon for Portugal.
For that reason there is a need to create ways to inspect this activity more efficiently.
With the motivation to contribute to the resolution of this problem, the objectives of
this dissertation are to analyze the data in order to derive patterns, which, when compared
to real data can generate alerts for the existence of unusual activities. Concretely,
the first objective seeks to infer when the vessels are fishing, and when they fish in an
area other than the usual one, this using only velocity and location data. The second
objective consists in classify the fishing license by taking into account the VMS data,
more precisely velocity and position data. There are several studies developed in this
area. What separates my work from the other studies found is the use of only data
created by a device on board, in which there is no human interference. In the current
developed solution the data is produced by the system MONICAP, a BLUEBOX system,
mandatory for vessels over 12 meters in the European Union. This system records
velocity, heading and location data. Concerning the first objective, a machine learning
system, using velocity data, will be used to identify whether the vessel is fishing. The
methodology used is based in clustering algorithms, to identify whether the fishing
zone is usual or not. In addition the Hill Climbing algorithm and the Kernel density
estimator are used to classify data as fishing or not.
This system is designed so that it can be integrated into MONICAP itself. For the
second objective, we will use data mining methods, as Random Forests, Neural Networks
an others, to analyze possible associations between the data provided by MONICAP
and the type of fishing license. The models were tested and evaluated using
well-established data mining techniques following the procedures in Cross Industry Standard Process for Data Mining. The second solution allowed to show that it is possible
to classify the fishing license by taking into account the VMS data, more precisely
velocity and position data.
The use of velocity and location turns out to be enough to create systems capable of
satisfying the proposed objectives, so goals are all achieved.
Portugal é um país historicamente ligado ao mar, sendo a pesca uma atividade muito importante para a economia portuguesa. Por outro lado, a fraude fiscal está presente tanto na pesca como noutra atividade económica e é um fenómeno nocivo para Portugal. Por isso, é necessário criar formas de fiscalizar esta atividade de forma mais eficiente. Com a motivação de contribuir para a resolução deste problema, os objetivos desta dissertação são analisar os dados de forma a derivar padrões que, quando comparados com dados reais, podem gerar alertas para a existência de atividades inusitadas. Concretamente, o primeiro objetivo visa inferir quando as embarcações estão a pescar e quando pescam numa zona diferente da habitual, utilizando apenas dados de velocidade e localização. O segundo objetivo consiste em classificar a licença de pesca tendo em conta os dados VMS, mais precisamente os dados de velocidade e posição. Existem vários estudos desenvolvidos nesta área. O que separa o meu trabalho de outros estudos que encontrei é o uso de apenas dados criados por um dispositivo de bordo, no qual não há interferência humana. Nesta solução os dados são produzidos pelo sistema MONICAP, um sistema bluebox, obrigatório para embarcações com mais de 12 metros na União Europeia. Este sistema regista dados de velocidade, direção e localização. Em relação ao primeiro objetivo, será utilizado um sistema de aprendizagem automática, utilizando dados de velocidade, para identificar se a embarcação está a pescar. A metodologia utilizada baseia-se em algoritmos de agrupamento, para identificar se a zona de pesca é habitual ou não. Além disso, o algoritmo Hill Climbing e o estimador de densidade do Kernel são usados para classificar os dados como pesca ou não. Este sistema foi projetado de forma que possa ser integrado no próprio MONICAP. Para o segundo objetivo, usaremos métodos de mineração de dados, como Random Forests, Neural Networks e outros, para analisar possíveis associações entre os dados fornecidos pelo MONICAP e a licença de pesca do navio. Os modelos foram testados e avaliados usando técnicas de mineração de dados bem estabelecidas, seguindo os procedimentos do Processo Padrão de Cross Industry para Data Mining. A segunda solução permitiu mostrar que é possível classificar a licença de pesca tendo em conta os dados VMS, mais precisamente dados de velocidade e posição. O uso da velocidade e localização acaba por ser suficiente para criar sistemas capazes de satisfazer os objetivos propostos, concluindo-se que os objectivos propostos foram alcançados.
Portugal é um país historicamente ligado ao mar, sendo a pesca uma atividade muito importante para a economia portuguesa. Por outro lado, a fraude fiscal está presente tanto na pesca como noutra atividade económica e é um fenómeno nocivo para Portugal. Por isso, é necessário criar formas de fiscalizar esta atividade de forma mais eficiente. Com a motivação de contribuir para a resolução deste problema, os objetivos desta dissertação são analisar os dados de forma a derivar padrões que, quando comparados com dados reais, podem gerar alertas para a existência de atividades inusitadas. Concretamente, o primeiro objetivo visa inferir quando as embarcações estão a pescar e quando pescam numa zona diferente da habitual, utilizando apenas dados de velocidade e localização. O segundo objetivo consiste em classificar a licença de pesca tendo em conta os dados VMS, mais precisamente os dados de velocidade e posição. Existem vários estudos desenvolvidos nesta área. O que separa o meu trabalho de outros estudos que encontrei é o uso de apenas dados criados por um dispositivo de bordo, no qual não há interferência humana. Nesta solução os dados são produzidos pelo sistema MONICAP, um sistema bluebox, obrigatório para embarcações com mais de 12 metros na União Europeia. Este sistema regista dados de velocidade, direção e localização. Em relação ao primeiro objetivo, será utilizado um sistema de aprendizagem automática, utilizando dados de velocidade, para identificar se a embarcação está a pescar. A metodologia utilizada baseia-se em algoritmos de agrupamento, para identificar se a zona de pesca é habitual ou não. Além disso, o algoritmo Hill Climbing e o estimador de densidade do Kernel são usados para classificar os dados como pesca ou não. Este sistema foi projetado de forma que possa ser integrado no próprio MONICAP. Para o segundo objetivo, usaremos métodos de mineração de dados, como Random Forests, Neural Networks e outros, para analisar possíveis associações entre os dados fornecidos pelo MONICAP e a licença de pesca do navio. Os modelos foram testados e avaliados usando técnicas de mineração de dados bem estabelecidas, seguindo os procedimentos do Processo Padrão de Cross Industry para Data Mining. A segunda solução permitiu mostrar que é possível classificar a licença de pesca tendo em conta os dados VMS, mais precisamente dados de velocidade e posição. O uso da velocidade e localização acaba por ser suficiente para criar sistemas capazes de satisfazer os objetivos propostos, concluindo-se que os objectivos propostos foram alcançados.
Description
Projecto final para obtenção do grau de Mestre em Engenharia Informática e de Computadores
Keywords
Vessel monitoring system Sistema de monitorizaação de embarcações Data mining Mineração de dados Fishing Pescas
Citation
LAGE, Serge Gaspar Aguiar Fernandes - Learning portuguese fishing data patterns. Lisboa: Instituto Superior de Engenharia de Lisboa, 2020. Dissertação de mestrado.
Publisher
Instituto Superior de Engenharia de Lisboa