ISEL - Mat. Aplic. Indústria - Dissertações de Mestrado
Permanent URI for this collection
Browse
Browsing ISEL - Mat. Aplic. Indústria - Dissertações de Mestrado by Author "Fonseca, Diana Sofia Picado"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
- Reconhecimento automático de tabelas em documentosPublication . Fonseca, Diana Sofia Picado; Rodrigues, José Alberto de Sousa; Silva, Luís Manuel Ferreira daA extração de dados em formato digital tem vindo a ser uma necessidade comum a muitas empresas e é necessária para o funcionamento adequado das operações em muitos setores, devido ao aumento significativo do volume de dados em formato digital, verificado nos últimos anos. Os métodos manuais de inserção de informações de dados tabulares resultam em erros frequentes e, muitas vezes, a rapidez com que a tarefa manual da extração dos dados tabulares é realizada não permite atender aos requisitos da maior parte das empresas. Com isto, a Closer teve a necessidade de recorrer a um software da Microsoft, o Azure Forms Recognizer. O software tem custos elevados, para a escala em que é necessária a utilização deste por parte dos clientes e é ainda necessária a implementação de restrições que permitem agrupar os dados da tabela que são erradamente separados e para que seja possível extrair os valores de que os clientes normalmente precisam. Esta tese tem como objetivo o desenvolvimento de uma base de implementação de um algoritmo de inteligência artificial (IA) que supere a adversidade dos custos elevados, onde será realizada a deteção, o reconhecimento da estrutura e a extração das informações para um documento estruturado. Esta metodologia explora a utilização de modelos de deteção de objetos, nomeadamente, o modelo YOLOv8, tanto na tarefa de deteção das tabelas como no reconhecimento de estruturas que auxiliam na obtenção das células das tabelas. Este modelo é reconhecido por realizar deteções com alta precisão e por ser muito rápido no processamento de grandes volumes de imagens. Para a implementação da metodologia, foram realizados os treinos de vários modelos YOLO, com um conjunto de imagens que contêm tabelas de diferentes fornecedores e foram aplicadas restrições aos resultados das redes neuronais para que fosse possível atender aos requisitos.