Browsing by Author "Rodrigues, Bruno Sérgio Antunes"
Now showing 1 - 1 of 1
Results Per Page
Sort Options
- Rastreio de vozes patológicas através de técnicas de processamento de falaPublication . Rodrigues, Bruno Sérgio Antunes; Cordeiro, Hugo Tito; Marques, Gonçalo CaetanoEm 2012, um inquérito da American Speech-Language-Hearing Association (ASHA) revelou que um em cada treze norte-americanos sofre anualmente de distúrbios vocais. Extrapolando essa proporção para a população mundial, estima-se que mais de 600 milhões de pessoas possam ser afetadas anualmente. Estes distúrbios impactam negativamente a vida social e profissional, sendo habitualmente diagnosticados através de métodos invasivos e desconfortáveis. Este trabalho propõe métodos não invasivos, baseados em processamento de sinais de fala, para discriminar entre oradores saudáveis e patológicos, e entre patologias. Utilizaram-se duas bases de dados contendo sinais de fala com a vogal /a/ sustentada, categorizados em quatro classes, sendo uma relativa a oradores saudáveis e as outras a oradores patológicos. Os sinais de fala foram segmentados em tramas e os seus espectros foram decompostos em 20 bandas de energia. As médias e variações de cada banda ao longo do sinal foram usadas para discriminar entre classes, obtendo-se taxas de acerto médias entre 57,2%, numa das discriminações multiclasse, e 100%, na discriminação entre oradores saudáveis e com condições neurodegenerativas. Observou-se que as bandas correspondentes às primeiras harmónicas têm mais informação para as discriminações, seguidas das bandas relacionadas com o primeiro formante da vogal /a/. Posteriormente, usaram-se parâmetros espectrais derivados das bandas mais relevantes, isoladamente e em conjunto com os parâmetros acústicos shimmer e HNR, para discriminar entre classes. A combinação dos parâmetros produziu melhorias estatisticamente significativas nas taxas de acerto médias em 7 das 16 discriminações consideradas. O ganho mais expressivo foi de 10,8%, numa das discriminações multiclasse, e a taxa de acerto média mais elevada foi de 96,8%, numa das discriminações entre oradores saudáveis e com patologias laríngeas fisiológicas. Globalmente, os resultados indicam que a combinação de parâmetros espectrais e acústicos é vantajosa para as discriminações analisadas.