English

CIn - Centro de Informática UFPE




Eventos Relacionados

Tese de Doutorado Nº 361 "Modelo Adaptativo para Reconhecimento da Fala com Reconstrução de Características Ausentes"

O aluno Hesdras Oliveira Viana irá defender sua pesquisa no dia 8 de maio, às 14h, no Auditório Início: 08/05/2017 às 14:00 Término: 08/05/2017 às 00:00 Local: Auditório do CIn

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 361

Aluno: Hesdras Oliveira Viana
Orientador: Prof. Aluízio Fausto Ribeiro Araújo
Título: Modelo Adaptativo para Reconhecimento da Fala com Reconstrução de Características Ausentes
Data: 08/05/2017
Hora/Local: 14h – Centro de Informática - Auditório
Banca Examinadora:

Prof. Tsang Ing Ren (UFPE / Centro de Informática)
Prof. Hansenclever de França Bassani(UFPE / Centro de Informática)
Prof. Jugurta Rosa Montalvao Filho (UFS / Departamento de Engenharia Elétrica)
Prof. Francisco Madeiro Bernardino Junio (UPE / Escola Politécnica de Pernambuco)
Prof. Alexandre Magno Andrade Maciel  (UPE / Escola Politécnica de Pernambuco)

RESUMO:

Diferentes tipos e intensidades de ruídos, entre o treinamento e as condições onde o sistema automático de reconhecimento da fala é utilizado, têm sido uma tarefa desafiadora há anos. Neste sentido, estuda-se a “reconstrução de características ausentes”. Que é um método de compensação, cujo objetivo, é melhorar a robusteza dos algoritmos de reconhecimento da fala,
em relação aos ruídos. Um modelo convencional para reconstrução de características ausentes, utilizam características acústicas e métodos estatísticos para melhorar o reconhecimento da fala. No entanto, para este modelo, a taxa de acerto diminui quando o ruído presente no sinal é diferente do que foi utilizado no treinamento.
Neste trabalho, propomos um modelo adaptativo para reconhecimento da fala com reconstrução de características ausentes, utilizando aprendizagem não-supervisionada, capaz de atuar em sistemas online (tempo real) e offline que podem se modificar automaticamente sempre que for necessário. Para isso, uma nova abordagem utilizando Mapa Auto-Organizável, com o propósito de identificar e extrair as caraterísticas
articulatórias, e uma rede neural com topologia variante no tempo (LARFSOM), foram utilizadas.
Para avaliar o modelo proposto, utilizamos as bases TIMIT e Aurora 2. Como resultados, obtivemos uma taxa de erro médio de reconhecimento da fala de 6,96% para a base TIMIT e 4,46% para a base Aurora 2. Os experimentos realizados mostram que, mesmo sem utilizar um conhecimento prévio do sinal, o modelo apresentou estabilidade (em relação a taxa de erro médio) quando existe presença ou ausência de ruído no sinal. Bem como, na existência de locutores com diferentes gêneros e sotaques pronunciando frases com diferentes tamanhos.

Palavras-chave: Reconhecimento da Fala, Reconstrução de Características Ausentes, Características Acústicas e Articulatórias, Aprendizagem não-supervisionada, SOM, LARFSOM.
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web