English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Dissertação de Mestrado Profissional Nº 117: "Seleção de Características usando Algoritmos Genéticos para Classificação de Imagens de Textos em Manuscritos e Impressos"

O aluno Gleydson Vilanova Viana Coelho irá defender seu trabalho dia 26, às 10h, no Auditório do CIn Início: 26/03/2013 às 10:00 Término: 26/03/2013 às 12:00 Local: Auditório do CIn

Pós-Graduação em Ciência da Computação - UFPE
Defesa de Dissertação de Mestrado Profissional Nº 117

Aluno: Gleydson Vilanova Viana Coelho
Orientador: Prof. George Darmiton da Cunha Cavalcanti
Título: Seleção de Características usando Algoritmos Genéticos para Classificação de Imagens de Textos em Manuscritos e Impressos
Data: 26/03/2013
Hora/Local: 10:00h / Auditório (1º andar)
Banca Examinadora:
Prof. : Tsang Ing Ren (CIn / UFPE)
Prof. : Wellington Pinheiro dos Santos ( CTG / UFPE)
Prof. : George Darmiton da Cunha Cavalcanti (CIn / UFPE) 

Resumo:
A presença de textos manuscritos e impressos em um mesmo documento representa um grande desafio para os atuais mecanismos de Reconhecimento Ótico de Caracteres. Uma vez que essas classes de texto possuem suas próprias rotinas de reconhecimento, o uso de técnicas que permitam diferenciação entre elas tornou-se algo indispensável cujo bom funcionamento depende da escolha de características que melhor representem os elementos de texto sobre os quais os classificadores devem atuar. Considerando que na literatura existe uma grande variedade de características utilizadas para este fim, este trabalho objetiva o desenvolvimento de um método que permita, através de um processo de otimização com Algoritmos Genéticos e a partir de um conjunto inicial de 52 características, a seleção de subconjuntos de melhores características que, além de menores que o conjunto original, possibilitem melhoria dos resultados de classificação. Os experimentos foram realizados com classificadores kNN e Redes Neurais MLP a partir de imagens de palavras segmentadas. O método proposto foi avaliado fazendo uso de uma base de dados pública para textos manuscritos e outra criada especificamente para este trabalho para textos impressos. Os resultados dos experimentos mostram que os objetivos propostos foram alcançados e que obtivemos um menor Erro Médio de Classificação com Redes Neurais MLP em contraponto a uma melhor performance obtida com o kNN. A influência dos diferentes tipos de fontes e estilos utilizados nos textos impressos também foi analisada e mostrou que as fontes que imitam textos manuscritos como a "Lucida Handwriting" apresentam maiores ocorrências de erros de classificação. Da mesma forma, a maioria dos erros foi percebida nos textos impressos com estilo itálico.
Palavras-chaves
Diferenciação entre Manuscritos e Impressos, Otimização, Redução de Dimensionalidade, Seleção de Características, Algoritmos Genéticos, kNN, Redes Neurais
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web