Silvestre, CláudiaCardoso, Margarida G. M. S.Figueiredo, Mário A. T.2020-11-042020-11-042020Silvestre, C.V., Cardoso, M.G.M.S., & Figueiredo, M.A.T. (2020). O critério Minimum Message Lenght na estimação de modelos de mistura sobre dados mistos. In M.F. Salgueiro, P.Vicente, T.Calapez, C.Marques & M.E. Silva (eds.) Livro de Atas do XXIII Congresso da Sociedade Portuguesa de Estatística. (pp. 45-58). Disponível em https://www.spestatistica.pt/storage/app/uploads/public/5ec/422/c52/5ec422c52916a387206682.pdf [Consultado em novembro 04, 2020].978-972-8890-46-9http://hdl.handle.net/10400.21/12337Artigo baseado na comunicação proferida no XXIII Congresso da Sociedade Portuguesa de Estatística. Instituto Universitário de Lisboa (ISCTE-IUL), 18-21 outubro 2017.Neste trabalho propomos uma nova variante do algoritmo Expectation-Maximization para agrupar dados mistos que simultaneamente estima o número de grupos. Recorremos aos modelos demistura finita, pressupondo que os dados categoriais são modeladospor distribuições multinomiais e os métricos por distribuições gaussianas. Para estimar o número de componentes de mistura baseamo-nos no critério Minimum Message Lenght. O desempenho do algoritmo proposto, designado por EM-MML-mix, é comparado com o de outros critérios usados frequentemente para a seleção de modelos de mistura. Desta análise comparativa, realizada sobre dados simulados e sobre um conjunto de dados reais provenientes do European Social Survey, salienta-se o reduzido tempo de computação para a obtenção da solução mediante a metodologia proposta.porClassificação não supervisionadaAnálise de agrupamentoModelos de mistura finitaDados mistosMML - Minimum Message Lenght - criterionO critério Minimum Message Length na estimação de modelos de mistura sobre dados mistosbook part