English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Tese de Doutorado Nº 218: "Classificação com Exemplos de Uma Única Classe Baseada na Busca pelos Limites das Características do Problema"

O aluno George Gomes Cabral irá defender seu trabalho dia 5 de agosto, às 14h, no Auditório Início: 05/08/2014 às 14:00 Término: 05/08/2014 às 18:00 Local: Auditório do CIn

Pós-Graduação em Ciência da Computação - UFPE
 Defesa de Tese de Doutorado Nº 218
 
Aluno: George Gomes Cabral
 Orientador: Prof. Adriano Lorena Inácio de Oliveira
 Título: Classificação com Exemplos de Uma Única Classe Baseada na Busca pelos Limites das Características do Problema
 Data: 05/08/2014
 Hora/Local: 14h - Auditório
 Banca Examinadora:
 Prof. Francisco de Assis Tenório de Carvalho (UFPE / Centro de Informática)
 Prof. Renata Maria Cardoso Rodrigues de Souza (UFPE / Centro de Informática)
 Prof. George Darmiton da Cunha Cavalcant (UFPE / Centro de Informática)
 Prof. Carmelo Jose Albanez Bastos Filho (UPE / Escola Politecnica de Pernambuco )
 Prof. Andre Carlos Ponce de Leon Ferreira de Carvalho (USP /  Ciência da Computação)
 
 
 RESUMO:
 
A detecção de novidades é um problema com um grande número de aplicações. Em algumas aplicações, o foco está na prevenção ou detecção de estados indesejados. Em alguns casos, esses estados não são conhecidos durante o treinamento do modelo de classificador; em outros, como monitoramento de máquinas, por exemplo, uma quebra da máquina pode ser bem rara e exemplos desse caso podem ser bastante raros. Nestes casos, a abordagem mais aceita consiste em se modelar o comportamento normal do sistema de forma a, no futuro, se detectar eventos desconhecidos. Esse é o conceito básico de Classificação com Exemplos de uma Única Classe (One-Class Classification - OCC).
 Essa tese introduz duas versões de um método simples e efetivo para OCC, chamado de FBDOCC (Feature Boundaries Detector for One-Class Classification). O FBDOCC funciona analisando cada característica (dimensão) do problema e criando uma representação artificial da classe novidade (desconhecida a priori) que engloba os dados da classe normal. Esse trabalho também considera o uso do algoritmo Particle Swarm Optimization (PSO) na busca da melhor configuração dos parâmetros do método proposto. Além disso, o presente trabalho introduz também um procedimento para a melhoria do custo computacional durante o treinamento sem que haja a degradação na qualidade da classificação. Entre as motivações por trás desse trabalho, estão a criação de um método com baixo custo computacional e com a mesma ou melhor precisão na classificação do que métodos para detecção de novidades do estado da arte, como os métodos baseados em Máquinas de Vetores de Suporte (Support Vector Machines).
 Vários experimentos foram executados com bases de dados do mundo real e artificiais no intuito de comparar as duas versões do FBDOCC com alguns dos mais recentes e efetivos métodos OCC, são eles: Support Vector Data Description (SVDD), One-Class SVM (OCSVM), Least Squares One-class SVM (LSOCSVM), Kernel Principal Component Analysis (KPCA), Gaussian Process Prior OCC (GP-OCC), Condensed Nearest Neighbor Data Description (CNNDD) e One-class Random Forests (OCRF). As métricas de desempenho consideradas nos experimentos foram: (i) a area sob a curva ROC (Area Under the Curve - AUC); (ii) o coeficiente de correlação de Matthews (Matthews Correlation Coefficient - MCC); (iii) o tempo de treinamento; e (iv) a taxa de redução de protótipos. Em relação às métricas AUC e MCC, a primeira versão do método FBDOCC apresentou a melhor média global entre todos os métodos enquanto que a segunda versão do método proposto, FBDOCC2, obteve resultados comparáveis aos melhores métodos em experimentos onde o FBDOCC obteve um baixo desempenho. O FBDOCC obteve os melhores resultados considerando o tempo de treinamento em todas as bases de dados, exceto uma. Em adição, o FBDOCC foi bem mais rápido que todos os métodos baseados em Máquinas de Vetores de Suporte
 Além disso, um estudo de caso foi realizado utilizando dados adquiridos em um hospital local de renome. Estes dados são compostos de informações não-invasivas sobre as crianças que compareceram ao hospital com sintomas de sopro no coração. Informações como idade, peso, altura, etc., foram usadas para prever se a criança é ou cardiopata. Devido ao elevado grau de desequilíbrio entre as classes (ou seja, o número de pacientes saudáveis foi consideravelmente mais elevado), a abordagem adotada foi a de construir uma descrição dos casos saudáveis deixando casos desconhecidos fora desta descrição. Os resultados mostram que dois dos classificadores OCC aplicados (FBDOCC e OCSVM) obtiveram êxito nesta tarefa, resultando na melhor taxa, entre os métodos investigados, de detecção baseada exclusivamente em dados não-invasivos.
 
 
Palavras-chave: One-Class Classification, Anomaly Detection, Novelty Detection, Nearest Neighbor Rule 
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web