Repository logo
 
Publication

O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos

dc.contributor.authorSilvestre, Cláudia
dc.contributor.authorCardoso, Margarida
dc.contributor.authorFigueiredo, Máriopt_PT
dc.date.accessioned2017-12-11T23:46:43Z
dc.date.available2017-12-11T23:46:43Z
dc.date.issued2017-10
dc.description.abstractO agrupamento sobre dados mistos é um problema prático comum, nomeadamente no âmbito das ciências sociais. Este pode referir-se, por exemplo, à constituição de segmentos homogéneos de indivíduos, considerando as suas características quer quantitativas, quer qualitativas. A abordagem metodológica deste problema tem sido diversa. Podem encontrar-se, por exemplo, versões do algoritmo K-Médias capazes de lidar com dados métricos e categoriais. Neste trabalho, consideramos o agrupamento de dados mistos, usando um modelo de mistura e propondo o uso do critério Minimum Message Lenght (MML) para a sua estimação. Este critério advém da teoria da informação, considerando um modelo mais adequado aquele que permite uma descrição mais sucinta das observações [3]. Figueiredo e Jain [1] foram pioneiros na utilização deste critério para estimação de misturas de gaussianas. Uma primeira proposta para a utilização do MML em misturas de multinomiais foi apresentada por Silvestre et al [2]. A análise proposta integra dados mistos considerando uma mistura de gaussianas e multinomiais e um algoritmo que é uma variante do conhecido expectation-maximization. A metodologia é testada comparativamente com critérios comuns para a seleção de modelos de mistura, nomeadamente o integrated completed lilelihood , que é particularmente adequado neste contexto. A análise é efetuada sobre 2 conjuntos de dados sintéticos e dados reais (do European Social Survey). São analisadas vantagens comparativas na robustez relativamente a diferentes processos de inicialização, no tempo de computação e na qualidade do agrupamento obtido.pt_PT
dc.description.versionN/Apt_PT
dc.identifier.citationSILVESTRE, Cláudia; CARDOSO, Margarida; FIGUEIREDO, Mário – O critério Minimum Message Length na estimação de modelos de mistura sobre dados mistos. In: Congresso da Sociedade Portuguesa de Estatística, XXIII, Lisboa, Instituto Universitário de Lisboa (ISCTE-IUL), 2017 (18-21 outubro)pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.21/7684
dc.language.isoporpt_PT
dc.peerreviewedyespt_PT
dc.publisherSociedade Portuguesa de Estatísticapt_PT
dc.relation.publisherversionhttp://spe2017.iscte-iul.pt/assets/files/programa-xxiii-congresso-spe.pdfpt_PT
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/pt_PT
dc.subjectClassificação não supervisionadapt_PT
dc.subjectAnálise de agrupamentopt_PT
dc.subjectModelos de mistura finitapt_PT
dc.subjectDados mistospt_PT
dc.subjectMML - Minimum Message Lenght - criterionpt_PT
dc.titleO critério Minimum Message Length na estimação de modelos de mistura sobre dados mistospt_PT
dc.typeconference object
dspace.entity.typePublication
oaire.citation.conferencePlaceInstituto Universitário de Lisboa (ISCTE-IUL), Lisboapt_PT
oaire.citation.titleCongresso da Sociedade Portuguesa e Estatística, XXIIIpt_PT
person.familyNameSilvestre
person.givenNameCláudia
person.identifier.ciencia-idDA12-EF3F-C7CD
person.identifier.orcid0000-0002-8850-4304
rcaap.rightsrestrictedAccesspt_PT
rcaap.typeconferenceObjectpt_PT
relation.isAuthorOfPublication08fbc1bf-3387-4137-8c03-c4664dd43375
relation.isAuthorOfPublication.latestForDiscovery08fbc1bf-3387-4137-8c03-c4664dd43375

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
RESUMO - O critério Minimum Message Length.pdf
Size:
8.69 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: