Repository logo
 
Publication

Reconhecimento automático de tabelas em documentos

authorProfile.emaildocumentacao@isel.pt
dc.contributor.advisorRodrigues, José Alberto de Sousa
dc.contributor.advisorSilva, Luís Manuel Ferreira da
dc.contributor.authorFonseca, Diana Sofia Picado
dc.date.accessioned2025-02-12T14:14:31Z
dc.date.available2025-02-12T14:14:31Z
dc.date.issued2024-11
dc.descriptionRelatório de Estágio para obtenção do grau de mestre em Matemática Aplicada para a Indústria na Área de Especialização de Tratamento de Dados
dc.description.abstractA extração de dados em formato digital tem vindo a ser uma necessidade comum a muitas empresas e é necessária para o funcionamento adequado das operações em muitos setores, devido ao aumento significativo do volume de dados em formato digital, verificado nos últimos anos. Os métodos manuais de inserção de informações de dados tabulares resultam em erros frequentes e, muitas vezes, a rapidez com que a tarefa manual da extração dos dados tabulares é realizada não permite atender aos requisitos da maior parte das empresas. Com isto, a Closer teve a necessidade de recorrer a um software da Microsoft, o Azure Forms Recognizer. O software tem custos elevados, para a escala em que é necessária a utilização deste por parte dos clientes e é ainda necessária a implementação de restrições que permitem agrupar os dados da tabela que são erradamente separados e para que seja possível extrair os valores de que os clientes normalmente precisam. Esta tese tem como objetivo o desenvolvimento de uma base de implementação de um algoritmo de inteligência artificial (IA) que supere a adversidade dos custos elevados, onde será realizada a deteção, o reconhecimento da estrutura e a extração das informações para um documento estruturado. Esta metodologia explora a utilização de modelos de deteção de objetos, nomeadamente, o modelo YOLOv8, tanto na tarefa de deteção das tabelas como no reconhecimento de estruturas que auxiliam na obtenção das células das tabelas. Este modelo é reconhecido por realizar deteções com alta precisão e por ser muito rápido no processamento de grandes volumes de imagens. Para a implementação da metodologia, foram realizados os treinos de vários modelos YOLO, com um conjunto de imagens que contêm tabelas de diferentes fornecedores e foram aplicadas restrições aos resultados das redes neuronais para que fosse possível atender aos requisitos.por
dc.description.abstractAbstract The extraction of data in digital format has become a common necessity for many companies and is essential for the proper functioning of operations across various sectors, due to the significant increase in the volume of digital data observed in recent years. Manual methods for inputting tabular data information result in frequent errors, and often the speed at which the manual task of extracting tabular data is performed fails to meet the requirements of most companies. Consequently, Closer had to resort to Microsoft’s software, Azure Forms Recognizer. The software incurs high costs for the scale at which it needs to be used by clients, and additional constraints must be implemented to group table data that is erroneously separated, allowing for the extraction of the values typically required by clients. This thesis aims to develop an implementation base for an artificial intelligence (AI) algorithm that overcomes the challenges of high costs, where the detection, structure recognition, and extraction of information into a structured document will be carried out. This methodology explores the use of object detection models, particularly the YOLOv8 model, both in the task of table detection and in recognizing structures that assist in obtaining the table cells. This model is known for achieving high precision in detections and for its speed in processing large volumes of images. For the implementation of the methodology, several YOLO models were trained using a set of images containing tables from different suppliers, and constraints were applied to the results of the neural networks to meet the necessary requirements.eng
dc.identifier.citationFONSECA, Diana Sofia Picado – Reconhecimento automático de tabelas em documentos. Lisboa: Instituto Superior de Engenharia de Lisboa. 2024. Dissertação de Mestrado.
dc.identifier.tid203787137
dc.identifier.urihttp://hdl.handle.net/10400.21/21439
dc.language.isopor
dc.peerreviewedsim
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectYOLOv8
dc.subjectOCR
dc.subjectInteligência artificial
dc.subjectExtração automática de dados
dc.subjectImagens de tabelas
dc.subjectArtificial inteligence
dc.subjectAutomatic data extraction
dc.subjectTable images
dc.titleReconhecimento automático de tabelas em documentospor
dc.typemaster thesis
dspace.entity.typePublication
oaire.citation.endPage138
oaire.citation.startPage1
oaire.versionhttp://purl.org/coar/version/c_ab4af688f83e57aa

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
DianaFonseca_MMAI.pdf
Size:
8.51 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
4.03 KB
Format:
Item-specific license agreed upon to submission
Description: