English

CIn - Centro de Informática UFPE




Eventos Relacionados

Tese de Doutorado Nº 360 "Um classificador baseado em perturbações"

O aluno Edson Leite Araújo irá defender sua pesquisa no dia 10 de abril, às 13h30, no Anfiteatro. Início: 10/04/2017 às 13:30 Término: 10/04/2017 às 00:00 Local: Anfiteatro do CIn

Pós-Graduação em Ciência da Computação – UFPE

Defesa de Tese de Doutorado Nº  360

Aluno: Edson Leite Araújo
Orientador: Prof. George Darmiton da Cunha Cavalcanti
Co-orientador: Prof. Tsang Ing Ren
Título: Um classificador baseado em perturbações
Data: 10/04/2017
Hora/Local: 13:30h – Centro de Informática - Anfiteatro
Banca Examinadora:
Prof. Renata Maria Cardoso Rodrigues de Souza(UFPE / Centro de Informática - CIn)
Prof. Anne Magaly de Paula Canuto(UFRN / Departamento de Informática e Matemática Aplicada - DIMAP)
Prof. Roberta Andrade de Araújo Fagundes(UPE / Campus Caruaru)
Prof. Germano Crispim Vasconcelos(UFPE / Centro de Informática - CIn)
Prof. Leandro Maciel Almeida(UFPE / Centro de Informática - CIn)


RESUMO:

O reconhecimento de padrões tem sido uma área de pesquisas estudada desde 1960. Um grande número de aplicações, variando desde os problemas clássicos de reconhecimento de caracteres e o diagnóstico médico até as mais recentes minerações de dados, tem atraído consideráveis esforços em pesquisa com muitos métodos e avanços alcançados. A busca por padrões lida com a descoberta automática de regularidades em dados complexos, através de algoritmos computacionais e com o uso dessas regularidades em ações tais como a classificação dos dados em diferentes categorias. Muitos algoritmos de reconhecimento de padrões são probabilísticos em sua construção e como tal, usam a inferência estatística para determinar o melhor rótulo para uma dada instância a ser classificada. A inferência estatística baseia-se em geral, na teoria de Bayes que por sua vez, utiliza-se fortemente dos vetores médios, , e matrizes de covariância, , de classes existentes nos dados de treinamento. Estes parâmetros são desconhecidos e estimativas são realizadas seguindo vários algoritmos. Entretanto as estimativas feitas exclusivamente a partir dos dados de treinamento são ainda as mais utilizadas. Por se tratarem de estimativas, os parâmetros  e  sofrem perturbações quando se insere um novo vetor na classe à qual pertencem. Avaliando as perturbações ocorridas em todas as classes simulando uma possível inserção da instância a ser classificada nas mesmas, definimos neste trabalho uma nova regra de decisão a qual atribui a instância de teste à classe em que ocorrer a menor perturbação nos parâmetros  e  ou numa combinação de ambos. Nesta área várias abordagens são possíveis, entre elas merecem destaque as árvores de decisão, as redes neurais, o aprendizado baseado em instâncias e a máquina de suporte a vetores (SVM). Entretanto, até o momento da escrita deste texto, não foi encontrado na literatura, abordagens que utilizem as perturbações de parâmetros para a classificação de padrões. Em testes realizados inicialmente em dados sintéticos e posteriormente em 21 bancos de dados reais disponíveis no UCI Repository Learning, verificou-se que o classificador baseado em perturbações, o qual foi denominado PerC (Perturbation Classifier), apresentou performance significativamente superior às versões do SVM com kernels polinomiais de graus 2 e 3, e praticamente equivalente  aos k-Nearest Neighboor com  k=3 e k=5, Naïve Bayes, SVM com kernel gaussiano, CART e as redes neurais MLP, tendo o PerC o maior ranking segundo o teste estatístico de Friedman. Os resultados demonstraram que a abordagem baseada em perturbações são, portanto, úteis para a classificação de padrões.

Palavras-chave: Reconhecimento de padrões, Perturbações, Matriz de Covariância e Vetor Médio, Classificador de Bayes.

  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web