Name: | Description: | Size: | Format: | |
---|---|---|---|---|
704.08 KB | Adobe PDF |
Advisor(s)
Abstract(s)
Neste trabalho propomos uma nova variante do algoritmo Expectation-Maximization para agrupar dados mistos que simultaneamente estima o número de grupos. Recorremos aos modelos demistura finita, pressupondo que os dados categoriais são modeladospor distribuições multinomiais e os métricos por distribuições gaussianas. Para estimar o número de componentes de mistura baseamo-nos no critério Minimum Message Lenght. O desempenho do algoritmo proposto, designado por EM-MML-mix, é comparado com o de outros critérios usados frequentemente para a seleção de modelos de mistura. Desta análise comparativa, realizada sobre dados simulados e sobre um conjunto de dados reais provenientes do European Social Survey, salienta-se o reduzido tempo de computação para a obtenção da solução mediante a metodologia proposta.
Description
Artigo baseado na comunicação proferida no XXIII Congresso da Sociedade Portuguesa de Estatística. Instituto Universitário de Lisboa (ISCTE-IUL), 18-21 outubro 2017.
Keywords
Classificação não supervisionada Análise de agrupamento Modelos de mistura finita Dados mistos MML - Minimum Message Lenght - criterion
Citation
Silvestre, C.V., Cardoso, M.G.M.S., & Figueiredo, M.A.T. (2020). O critério Minimum Message Lenght na estimação de modelos de mistura sobre dados mistos. In M.F. Salgueiro, P.Vicente, T.Calapez, C.Marques & M.E. Silva (eds.) Livro de Atas do XXIII Congresso da Sociedade Portuguesa de Estatística. (pp. 45-58). Disponível em https://www.spestatistica.pt/storage/app/uploads/public/5ec/422/c52/5ec422c52916a387206682.pdf [Consultado em novembro 04, 2020].
Publisher
Sociedade Portuguesa de Estatística