English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Tese de Doutorado - Nº 457: Métodos Híbridos para Agrupamento de Dados Relacionais com Múltiplas Visões

O aluno Renê Pereira de Gusmão defenderá seu trabalho no dia 26 de abril de 2019, às 13h, no Anfiteatro do Centro de Informática Início: 26/04/2019 às 13:00 Término: 26/04/2019 às 15:00 Local: Anfiteatro do CIn

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 457

Aluno: Renê Pereira de Gusmão
Orientador: Prof. Francisco de Assis Tenório de Carvalho
Título: Métodos Híbridos para Agrupamento de Dados Relacionais com
Múltiplas Visões
Data: 26/04/2019
Hora/Local: 13h – Centro de Informática - Anfiteatro
Banca Examinadora:

Prof. Ricardo Bastos Cavalcante Prudêncio (UFPE / Centro de Informática)
Prof. Adriano Lorena Inácio de Oliveira ( UFPE / Centro de Informática)
Prof. Cleber Zanchettin (UFPE / Centro de Informática)
Prof. Carmelo Jose Albanez Bastos Filho (UPE / Escola Politécnica de Pernambuco)
Prof. Lucidio dos Anjos Formiga Cabral (UFPB / Departamento de Computação Científica)


RESUMO:

O agrupamento de dados com múltiplas visões é um problema emergente e que
vem sendo pesquisado nos últimos anos. Modelos para agrupamento de dados
relacionais presentes na literatura apresentam rápida convergência e,
consequentemente, o espaço de soluções não é explorado de forma adequada.
Esta tese de doutorado teve como objetivo a investigação e desenvolvimento
de métodos híbridos baseados em otimização por nuvem de partículas para
resolver o problema do agrupamento de dados relacionais com múltiplas
visões. Os métodos híbridos desenvolvidos combinam otimização por nuvem de
partículas com métodos de agrupamento baseados em matrizes de
dissimilaridades com o objetivo de se beneficiar das características de
cada abordagem e explorar de melhor forma o espaço de soluções. A abordagem
desenvolvida foi avaliada para agrupamento rígido e nebuloso de dados
relacionais. Além disso, devido a importância da escolha de uma função de
aptidão apropriada, diversos índices para validação de agrupamentos foram
investigados e adaptados para considerar dissimilaridades fornecidas por
várias matrizes bem como pesos de relevância para cada matriz. Seis estudos
foram realizados para validação dos modelos híbridos desenvolvidos. No
primeiro estudo, o modelo híbrido para agrupamento rígido de dados
relacionais com única visão foi comparado a outros métodos da literatura e
obteve resultados competitivos. No segundo estudo, os agrupamentos rígidos
gerados por onze funções de aptidão para diversas bases de dados reais
foram avaliados em termos dos índices externos medida F e índice ajustado
de Rand tanto para o modelo que considera dados com única visão quanto para
os modelos para dados com múltiplas visões. As funções de aptidão que se
destacaram dentre as demais foram: índice da silhueta, índice de Xu e
homogeneidade intra-cluster. Os resultados obtidos pelo índice da silhueta
e pela homogeneidade foram selecionados para comparação com os resultados
obtidos por outros métodos da literatura no terceiro estudo. Verificou-se
que a abordagem proposta apresentou melhores resultados para a maioria dos
casos analisados. Três estudos também foram realizados para validação dos
modelos híbridos para agrupamento nebuloso de dados com única visão e com
várias visões. As funções de aptidão para agrupamento nebuloso que se
destacaram dentre as demais foram: silhueta simplificada e coeficiente da
partição. A análise dos resultados mostrou que a abordagem proposta para
agrupamento nebuloso também obteve desempenho competitivo e melhor em
alguns casos em comparação a outros métodos da literatura. Os resultados
demonstraram que o problema do agrupamento de dados relacionais com
múltiplas visões pode ser melhorado de forma significativa através de
métodos híbridos baseados em otimização de enxame. Portanto, os resultados
reforçam a importância da aplicação de técnicas tais como algoritmos
baseados em otimização de enxame no campo da mineração de dados.

Palavras-chave: Análise de agrupamento, dados relacionais, agrupamento de
dados com múltiplas visões, otimização por nuvem de partículas.
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web