Repository logo
 
Publication

Real-time bird audio detection using AI on FPGAs

authorProfile.emaildocumentacao@isel.pt
dc.contributor.advisorVéstias, Mário Pereira
dc.contributor.advisorDuarte, Rui António Policarpo
dc.contributor.authorSilva, Rodrigo Lopes da
dc.date.accessioned2025-02-21T12:03:49Z
dc.date.available2025-02-21T12:03:49Z
dc.date.issued2024-07
dc.descriptionDissertação para obtenção do Grau de Mestre em Engenharia Informática e de Computadores
dc.description.abstractAbstract Audio-based monitoring offers a discreet solution for studying biodiversity behavior in remote or sensitive environments like forests. This work addresses the need for efficient wildlife monitoring, focusing on avian species using audio detection. This work optimizes one of the models related to the Bird Audio Detection Challenge (BADC), designs a hardware accelerator for the algorithm, and implements it in a System-on-Chip Field Programmable Gate Array (Xilinx Zynq UltraScale+ ZU3CG SoC). The model weights and activations are quantized and fine-tuned to improve the hardware performance and reduce resource usage without sacrificing much accuracy. The accelerator has different levels of quantization, 4 bits for the Convolution layers and 8 bits for the Gated Recurrent Unit (GRU) layers, implemented in the FPGA and integrated with the processor of the SoC-FPGA. The results show that the system has an accuracy of 79.5%, with reduced accuracy compared to the software Python model (89.75%). Still, it is acceptable since the objective is to reduce the model, implement it in hardware, and target 1 second or less evaluation time. The evaluation performance has a latency of 679ms, fulfilling the target delay of 1s. This work uniquely demonstrates the process of selecting a model, quantizing it, replicating the Python model in C, and implementing it into an FPGA. This represents a new project approach for a bird audio detection system within the scope of the BADC.eng
dc.description.abstractA monitorização baseada em áudio oferece uma solução discreta para estudar o comportamento da biodiversidade em ambientes remotos ou sensíveis, como florestas. Este trabalho aborda a necessidade de uma monitorização eficiente da vida selvagem, focando-se em espécies de aves através da deteção por áudio. Este trabalho otimiza um dos modelos relacionados com o Desafio de Deteção de Áudio de Pássaros (BADC), projeta um acelerador em hardware para o algoritmo e implementa-o num System-on-Chip Field Programmable Gate Array (Xilinx Zynq UltraScale+ ZU3CG SoC). Os pesos e ativações do modelo são quantizados e ajustados para melhorar o desempenho do hardware e reduzir o uso de recursos sem sacrificar muito a precisão. O acelerador tem diferentes níveis de quantização, 4 bits para as camadas de Convolução e 8 bits para as camadas Gated Recurrent Unit (GRU), implementadas na FPGA e integradas com o processador do SoC-FPGA. Os resultados revelam que o sistema possui uma precisão de 79,5%, sendo esta inferior à precisão do modelo em Python (89,75%). No entanto, é aceitável, uma vez que o objetivo é reduzir o modelo, implementá-lo em hardware e alcançar um tempo de avaliação de 1 segundo ou menos. O desempenho de avaliação tem uma latência de 679ms, cumprindo o objectivo de uma atraso maximo de 1s. Este trabalho demonstra de forma única todo o processo, desde a seleção de um modelo, quantização, replicação do modelo Python em C e implementação numa arquitetura hardware/software reconfigurável. Representa uma nova abordagem de projeto de um sistema para deteção de áudio de pássaros no âmbito do BADC.por
dc.identifier.tid203822749
dc.identifier.urihttp://hdl.handle.net/10400.21/21564
dc.language.isoeng
dc.peerreviewedyes
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectBird audio detection
dc.subjectBird audio detection challenge
dc.subjectConvolutional neural network
dc.subjectRecurrent neural network
dc.subjectGated recurrent unit
dc.subjectTensorFlow
dc.subjectQK-eras
dc.subjectQuantization
dc.subjectFPGA
dc.subjectHardware accelerator
dc.subjectHigh-level synthesis
dc.subjectDetecção de áudio de pássaros
dc.subjectDesafio de detecção de áudio de pássaros
dc.subjectRede neural convolucional
dc.subjectRede neural recorrente
dc.subjectQuantização
dc.subjectAcelerador de hardware
dc.subjectSíntese de alto nível
dc.titleReal-time bird audio detection using AI on FPGAspor
dc.typemaster thesis
dspace.entity.typePublication
oaire.citation.endPage100
oaire.citation.startPage1
oaire.versionhttp://purl.org/coar/version/c_be7fb7dd8ff6fe43

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
RodrigoSilva_MEIC.pdf
Size:
5.21 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.03 KB
Format:
Item-specific license agreed upon to submission
Description: