Notícia
Candidato a doutorado do CIn tem seu artigo aprovado para Simpósio na Suíça
O trabalho é na área de Inteligência Artificial e será defendido em 2010
13 de Novembro de 2009 às 11:21
O mestre formado pelo Centro de Informática (CIn) da UFPE Rinaldo Lima, teve seu artigo da área de Inteligência Artificial aprovado para o 25th Symposium On Applied Computing (SAC 2010). Orientados pelo professor Fred Freitas e co-orientado pelo professor Bernard Espinasse a defesa acontecerá entre os dias 22 e 26 de março de 2010, em Sierra na Suíça.
Este trabalho foi desenvolvido num estágio de pesquisa realizado na modalidade mestrado-sanduíche pelo aluno Rinaldo Lima no período de setembro de 2008 à janeiro de 2009 como parte do projeto Click&Go financiado pelo Instituto Carnot de pesquisa. Ele teve a orientação do Phd. Bernard Espinasse que na ocasião era o responsável pela equipe INCOD (INformation et COnnaissance Distribuées) do centro de pesquisa LSIS (Laboratoire des Sciences de l'Information et des Systèmes) , Marselha, França.
O resultado desta parceira rendeu o sistema WEPAIES que atualmente já se encontra integrado na arquitetura do sistema de coleta de informações baseado em agentes inteligentes (AGATHE) cujo núcleo principal foi fruto da thèse de doutorado (2002) do professor do CIn Phd. Fred Freitas
O artigo cujo título é “An Adaptive Information Extraction System based on Wrapper Induction with POS Tagging” propõe um sistema de Extração de Informação (EI) adaptativo a partir de páginas web baseado no Boosted Wrapper Induction (BWI) algorithm, um algoritmo supervisionado de indução de extratores de informação e Part-of-Speech (POS) Tagging (análise morfosintática de textos).
Este sistema, WEPAIES (Web Pages Adaptive Information Extraction System), foi comparado com os melhores sistemas de extração de informação do estado da arte. Os resultados obtidos posiciona-o entre os melhores sistemas de EI da atualidade.
A Extração de Informação realiza duas tarefas importantes: identificar fragmentos de informações específicas presentes em textos (estruturados ou não-estruturados) e armazená-los para uso futuro.