English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Dissertação de Mestrado Nº1.717: "Experiências com Variações Prequential para Avaliação da Aprendizagem em Fluxo de Dados."

O aluno Juan Isidro González Hidalgo irá defender sua pesquisa no dia 4 de agosto, às 13h, na Sala E423 Início: 04/08/2017 às 13:00 Término: 04/08/2017 às 15:00 Local: Sala E423

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.717

Aluno: Juan Isidro González Hidalgo
Orientador: Prof.  Roberto Souto Maior de Barros
Título: Experiências com Variações Prequential para Avaliação da Aprendizagem em Fluxo de Dados.
Data: 04/08/2017
Hora/Local: 13h – Centro de Informática – Sala E423
Banca Examinadora:
Prof. Ricardo Bastos Cavalcante Prudêncio  (UFPE / CIn)
Prof. Paulo Maurício Gonçalves Júnior  (IFPE / Campus Recife)
Prof. Roberto Souto Maior de Barros  (UFPE / CIn)


RESUMO:

Fluxo de dados (Data Stream) é uma sequência ordenada de instâncias que chegam a uma velocidade que não permite que sejam armazenadas permanentemente na memória. Tais dados são potencialmente ilimitados no tamanho, tornando-os impossíveis de serem processados pela maioria das abordagens tradicionais de mineração de dados. Estes acontecimentos impõem novas exigências aos algoritmos de aprendizagem devido às especificidades dos ambientes dinâmicos. A maioria deles aprende modelos de decisão que evoluem continuamente ao longo do tempo, tornando evidente que a não estacionaridade dificulta o processo de aprendizagem, onde ocorrem mudanças na distribuição de probabilidade dos
dados -- Mudança de Conceito (Concept Drift). Os métodos de avaliação adaptativa são executados em ambientes conscientes de recursos, detectam e reagem às mudanças no ambiente que gera os dados. Uma questão importante, ainda não convenientemente abordada, é o projeto de trabalho experimental para avaliar e comparar modelos de decisão que evoluem ao longo do tempo. A metodologia Prequential é uma abordagem utilizada para a avaliação de desempenho de classificadores em fluxos de dados com distribuições estacionárias e não estacionárias. Ela é baseada na premissa de que o objetivo da inferência estatística é fazer previsões de probabilidade sequencial para observações futuras, em vez de expressar informações sobre a acurácia passada alcançada. Este trabalho realiza uma avaliação empírica da metodologia abordada considerando as três estratégias utilizadas para atualizar o modelo de predição, a saber Basic Window (Janela Básica), Sliding Window (Janela Deslizante), e Fading Factors (Fator de Desvanecimento). Especificamente, procura-se identificar qual das variações é a mais adequada para a avaliação experimental dos resultados em cenários onde acontecem mudanças de conceitos, com maior interesse nas observações passadas dentro do fluxo total de dados. As métricas adotadas para a avaliação são acurácia Prequential dos enfoques e a acurácia real obtida no processo de aprendizagem de cada fluxo de dados. Os resultados dos experimentos realizados sugerem que a utilização de Prequential na variação Sliding Window seja a melhor alternativa.

Palavras-chave: Avaliação Prequential. Mudança de Conceito. Fluxo de dados.
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web