English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Dissertação de Mestrado Nº 1.272: "Um Método Não Supervisionado para o Povoamento de Ontologias na Web"

O aluno Hilário Tomaz Alves de Oliveira irá defender seu trabalho dia 3 de abril, às 10h na sala D222 Início: 03/04/2013 às 10:00 Término: 03/04/2013 às 12:00 Local: Sala D222

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.272
 
Aluno: Hilário Tomaz Alves de Oliveira
Orientador: Frederico Luiz Gonçalves de Freitas
Título: Um Método Não Supervisionado para o Povoamento de Ontologias na Web
Data: 03/04/2013
Hora/Local: 10:00h – Sala D222
Banca Examinadora:
Prof. Rafael Dueire Lins (UFPE / CIn)
Profa. Laís do Nascimento Salvador ( UFBA / Depto.  de Ciência da Computação)
Prof. Frederico Luiz Gonçalves de Freitas (UFPE / CIn)
 
 
RESUMO:
 
A Web Semântica, proposta por Berners-Lee, tem o objetivo de tornar explícito o significado dos dados disponíveis na Web. Com isso, é possível que esses dados sejam processados tanto por pessoas quanto por sistemas computacionais que passam a ter acesso à semântica dos dados presentes na Web. Entretanto, para que a Web Semântica se torne uma realidade, é necessário que grande parte das informações contidas na Web estejam anotadas semanticamente, algo que não ocorre atualmente. Como forma de solucionar esse problema, é constante o interesse em pesquisas envolvendo o desenvolvimento de sistemas capazes de extrair conteúdo semântico automaticamente a partir de fontes de dados não estruturados, tais como as páginas web. Nesse contexto, o objetivo desta dissertação é definir um método não- supervisionado e independente de domínio capaz de extrair instâncias de classes ontológicas a partir de fontes de dados não estruturados escritos em linguagem natural disponíveis na Web. A metodologia proposta é guiada por uma ontologia de entrada que define quais conceitos devem ser povoados, e por um conjunto de padrões linguísticos usados para extrair e classificar os candidatos a instâncias. Com o objetivo de obter uma alta precisão na extração de instâncias, neste trabalho é proposto uma medida de Confiança Combinada (MCC), cujo objetivo é integrar diferentes métricas e heurísticas para classificar os candidatos a instâncias extraídos. Essa medida de confiança combinada foi definida a partir dos resultados de uma exaustiva análise comparativa entre vários parâmetros analisados. O método proposto é capaz ainda de extrair novos padrões linguísticos expandindo o conjunto inicial de padrões adotados. Os resultados obtidos com os experimentos realizados em diferentes domínios indicam que a metodologia proposta é capaz de aprender uma grande quantidade de instâncias de classes, além de integrar novos padrões linguísticos a cada iteração executada.
 
Palavras-chave: Web Semântica, Povoamento de Ontologias, Ontologias, Extração de Informação baseada em Ontologias 
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web