English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Dissertação de Mestrado Profissional Nº 123: "Extração de Informação Semi-estruturada em Diários Eletrônicos da Justiça"

O aluno Laerte Rodrigues Júnior irá defender seu trabalho dia 19 de abril, às 15h, na sala D224 Início: 19/04/2013 às 15:00 Término: 19/04/2013 às 17:00 Local: Sala D224

Pós-Graduação em Ciência da Computação    CIn / UFPE
Defesa de Dissertação de Mestrado Profissional Nº 123
 
Aluno: Laerte Rodrigues Júnior
 
Orientador: Prof. Ricardo Bastos Cavalcante Prudêncio
 
Título: Extração de Informação Semi-estruturada em Diários Eletrônicos da Justiça
 
Data: 19/04/2013
Hora/Local: 15:00h  /  Sala D224
 
Banca Examinadora:
Prof.: Patrícia Cabral de Azevedo Restelli Tedesco (CIn/UFPE)
Prof.: Renato Fernandes Corrêa (CAC/UFPE)
Prof.: Ricardo Bastos Cavalcante Prudêncio (CIn/UFPE)
 
Resumo:
Os textos semi-estruturados possuem alguma modelagem, mas podem apresentar características de campos ausentes, ou ordem de campos trocada, ausência de delimitadores entre campos ou ainda palavras abreviadas e frases que não são formadas de acordo com a linguagem natural, como exemplo o diário da justiça eletrônico. A abordagem que utilizamos para realizar trabalho foi a extração de informação automática de características dos diários da justiça eletrônico, é através de expressões regulares, onde classificamos cada linha do documento de acordo com a informação a ser extraída. Essa abordagem é presa às regras (expressões regulares) construídas. Então, sua manutenção é complicada porque é preciso construir novas expressões regulares para uma nova estrutura que não esteja prevista. A construção das regras que tenham como objetivo casamento de padrões no diário eletrônico deve possibilitar a interação entre a quantidade de regras existentes e a eficiência das mesmas. Para que tal situação venha favorecer o desenvolvimento conceitual de novas implementações de regras, é necessário o entendimento de como as regras estão divididas em proporção a quantidade de atributos citados no diário eletrônico. Com a efetiva solução do problema de extração das informações, através do sistema de manutenção das regras e após ter sido criado um fluxo, foi possível observar o melhoramento na qualidade das informações extraídas.
 
Palavras-chave: Extração de Informação, Expressão Regulares, Regras, Diários da Justiça 
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web