English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Tese de Doutorado Nº 385 "Um Processo Incremental e Orientado a Consulta para Resolução de Entidades em Sistemas de Integração de Dados"

A aluna Priscilla Vieira irá defender sua pesquisa no dia 27 de novembro, às 9h, no Auditório Início: 27/11/2017 às 09:00 Término: 27/11/2017 às 00:00 Local: Auditório do CIn

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº  385

Aluna: Priscilla Kelly Machado Vieira
Orientadora: Profa. Ana Carolina Salgado
Co-orientadora: Profa. Bernadette Farias Lóscio
Título: Um Processo Incremental e Orientado a Consulta para Resolução de Entidades em Sistemas de Integração de Dados
Data: 27/11/2017
Hora/Local: 9h – Centro de Informática - Auditório
Banca Examinadora:

Prof. Ricardo Bastos Cavalcante Prudencio (UFPE / Cin)
Prof. Luciano de Andrade Barbosa UFPE / Cin)
Prof. Altigran Soares da Silva  (UFAM / IComp)
Prof. Carlos Eduardo Santos Pires (UFCG / DSC)
Prof. Damires Yluska de Souza Fernandes  (IFPB / Campus João Pessoa)

RESUMO:

Resolução de Entidades (RE) é o problema de identificar grupos de tuplas (registros ou instâncias), em uma única ou múltiplas fontes de dados, que representam a mesma entidade do mundo real. Esta é uma etapa crucial do processo de integração de dados, que muitas vezes necessita integrar dados em tempo de consulta (online). Esta tarefa torna-se ainda mais onerosa quando são consideradas fontes dinâmicas e com grandes volumes de dados. Além disso, tais características, tornam o processo de RE mais desafiador, uma vez que a maioria das técnicas de RE (tradicional), processa todas as tuplas de uma única vez, ao invés de processar apenas as tuplas importantes para o usuário. Portanto, novas soluções são necessárias para contornar este problema.
Neste trabalho é proposto um processo incremental e orientado a consulta para RE. O processo é considerado incremental porque a cada iteração um conjunto de tuplas é processado e adicionado às demais. O termo orientado a consulta é proveniente do fato do processo proposto processar apenas resultados de consultas. As contribuições deste trabalho são: especificação, implementação e avaliação do processo proposto. O processo foi avaliado com diferentes algoritmos e sobre diferentes fontes de dados. Foram utilizadas medidas de qualidade e desempenho do processo. Observou-se que o processo proposto tem qualidade muito similar aos processos tradicionais de RE, contudo tem um desempenho melhor.

Palavras-chave: Resolução de Entidades, Integração de Dados, Dados Duplicados, Deduplicação

  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web