Procura de padrões em documentos para extracção e classificação de informação

Ferreira, João Carlos Godinho

Publicação

Procura de padrões em documentos para extracção e classificação de informação

2008-11Dissertação de mestrado

dc.contributor.author	Ferreira, João Carlos Godinho
dc.date.accessioned	2011-11-15T12:00:22Z
dc.date.available	2011-11-15T12:00:22Z
dc.date.issued	2008-11
dc.description.abstract	A limitada capacidade dos computadores em processar documentos de texto e consequente di culdade de extracção de informação desses documentos deve-se à dificuldade de processamento de informação não-estruturada. De modo a reduzir essa limitação é necessário aumentar a estrutura dos documentos com que os computadores trabalham. Este trabalho propõe um modelo de classificação de documentos através de um processo de refinamento sucessivo da informação. A cada iteração a informação presente no documento é melhor caracterizada através da aplicação de um classi cador apropriado. O processo de classificação recorre a informação estatística, usando o modelo de classificação de Bayes, sobre documentos ou fragmentos de documentos. O processo de classificação também recorre a técnicas para especificação de padrões de texto, usando expressões regulares para extrair informação que exibe um padrão conhecido. A informação obtida é armazenada em XML, que permite a interrogação de colecções de documentos de modo automático (recorrendo a bases de dados de suporte nativo XML). O XML também é usado para transformar a informação original noutros formatos, como por exemplo o HTML. Este formato pode ser usado para sintetizar a informação de modo melhorar a sua apresentação.	por
dc.identifier.uri	http://hdl.handle.net/10400.21/385
dc.language.iso	por	por
dc.peerreviewed	yes	por
dc.subject	Classificação de documentos	por
dc.subject	Taxonomias	por
dc.title	Procura de padrões em documentos para extracção e classificação de informação	por
dc.type	master thesis
dspace.entity.type	Publication
rcaap.rights	openAccess	por
rcaap.type	masterThesis	por

Ficheiros

Principais

A mostrar 1 - 1 de 1

Nome:: Dissertação.pdf
Tamanho:: 2.53 MB
Formato:: Adobe Portable Document Format

Ver/Abrir

Licença

A mostrar 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.71 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Ver/Abrir

Coleções

ISEL - Eng. Elect. Tel. Comp. - Dissertações de Mestrado