Publication
Agrupamento multi-orador
dc.contributor.author | Alves, Hugo Daniel Carolino | |
dc.date.accessioned | 2011-12-17T11:01:38Z | |
dc.date.available | 2011-12-17T11:01:38Z | |
dc.date.issued | 2010-12 | |
dc.description.abstract | Actualmente tem-se observado um aumento do volume de sinais de fala em diversas aplicações, que reforçam a necessidade de um processamento automático dos ficheiros. No campo do processamento automático destacam-se as aplicações de “diarização de orador”, que permitem catalogar os ficheiros de fala com a identidade de oradores e limites temporais de fala de cada um, através de um processo de segmentação e agrupamento. No contexto de agrupamento, este trabalho visa dar continuidade ao trabalho intitulado “Detecção do Orador”, com o desenvolvimento de um algoritmo de “agrupamento multi-orador” capaz de identificar e agrupar correctamente os oradores, sem conhecimento prévio do número ou da identidade dos oradores presentes no ficheiro de fala. O sistema utiliza os coeficientes “Mel Line Spectrum Frequencies” (MLSF) como característica acústica de fala, uma segmentação de fala baseada na energia e uma estrutura do tipo “Universal Background Model - Gaussian Mixture Model” (UBM-GMM) adaptado com o classificador “Support Vector Machine” (SVM). No trabalho foram analisadas três métricas de discriminação dos modelos SVM e a avaliação dos resultados foi feita através da taxa de erro “Speaker Error Rate” (SER), que quantifica percentualmente o número de segmentos “fala” mal classificados. O algoritmo implementado foi ajustado às características da língua portuguesa através de um corpus com 14 ficheiros de treino e 30 ficheiros de teste. Os ficheiros de treino dos modelos e classificação final, enquanto os ficheiros de foram utilizados para avaliar o desempenho do algoritmo. A interacção com o algoritmo foi dinamizada com a criação de uma interface gráfica que permite receber o ficheiro de teste, processá-lo, listar os resultados ou gerar um vídeo para o utilizador confrontar o sinal de fala com os resultados de classificação. | por |
dc.identifier.uri | http://hdl.handle.net/10400.21/909 | |
dc.language.iso | por | por |
dc.peerreviewed | yes | por |
dc.subject | Coeficientes MLSF | por |
dc.subject | Modelo de orador | por |
dc.subject | UBM | por |
dc.subject | Classificador SVM | por |
dc.subject | Agrupamento multi-orador | por |
dc.subject | Estimação do número de oradores | por |
dc.subject | Speaker Error Rate | por |
dc.title | Agrupamento multi-orador | por |
dc.type | master thesis | |
dspace.entity.type | Publication | |
rcaap.rights | restrictedAccess | por |
rcaap.type | masterThesis | por |