English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Tese de Doutorado Nº 335: "Inferência de Polimorfismos de Nucleotídeo Único Utilizando Algoritmos Baseados em Relevance Learning Vector Quantization"

A aluna Flávia Roberta Barbosa de Araújo vai apresentar seu trabalho no dia 21 de fevereiro, às 13h, na sala D224 Início: 21/02/2017 às 13:00 Término: 21/02/2017 às 00:00 Local: Sala D224

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Tese de Doutorado Nº 335

Aluno: Flávia Roberta Barbosa de Araújo
Orientador:  Profa. Katia Silva Guimarães
Título: Inferência de Polimorfismos de Nucleotídeo Único Utilizando Algoritmos Baseados em Relevance Learning Vector Quantization
Data: 21/02/2017
Hora/Local: 13h – Centro de Informática - Sala D224
Banca Examinadora:
Prof. Renato Vimieiro (UFPE / CIn)
Prof. Paulo Salgado Gomes de Mattos Neto (UFPE / CIn)
Prof. Renata Maria Cardoso Rodrigues de Souza(UFPE / CIn)
Prof. Maria Emília Telles Walter (UnB / Departamento de Ciência da Computação)
Prof. Jones Oliveira Albuquerque (UFRPE Departamento de Estatística e Informática)

RESUMO:

Embora duas pessoas compartilhem semelhanças em mais do que 99% do seu DNA, existem ainda milhões de diferenças extremamente relevantes entre o genoma de dois indivíduos que podem estar associados a risco a doenças, diferentes padrões de resposta ao ambiente e medicamentos.
Dentre as diferenças encontradas no genoma destacam-se os polimorfismos de nucleotídeo único (SNP, do inglês Single Nucleotide Polimorphism). Os SNPs são conhecidos por influenciar no aumento no risco de doenças. A atuação dessas variações pode ser de forma
individual ou combinada com outros SNPs. Individualmente a influência sobre o risco de ocorrência de uma doença pode ser mais rara. Porém, quando combinados com outros fatores de risco ou outros SNPs, representam um maior risco de incidência de uma determinada doença.
Para a biologia, esse tipo de interação entre os SNPs influenciando um fenótipo é conhecida como epistasia.
A inferência das interações epistáticas é um problema que vem sendo amplamente estudado, e para isso são utilizados dados genotípicos oriundos de estudos de análise do genoma (GWAS) de pacientes casos e controles. Diversas abordagens computacionais buscam diferentes estratégias para inferir as interações mais relevantes nesses
conjuntos de dados.
No entanto, os principais desafios encontrados nesse estudo, esta primeiramente relacionado a grande quantidade de dados (cerca de 500 a 900 mil SNPs) em dados de amplo genoma. Um segundo desafio é o número de interações a serem investigadas sendo considerados interações de alta ordem, o que leva a um problema combinatorial e um terceiro e não menos importante se dá ao fato de que estas interações podem ter um baixo poder estatístico, tornando-as difíceis de serem identificadas. A combinação entre estes três entraves tornam este um problema muito difícil de ser tratado.
Com o objetivo de transpor estes desafios, diferentes estratégias de busca como métodos exaustivos a estocásticos utilizam diferentes métricas para avaliar a importância das interações. Além de fazer uso de técnicas de filtragem para reduzir informações irrelevantes dos dados.
Nesta Tese são estudados diferentes metodologias capazes de lidar com o problema da inferência da interações entre os SNPs. São estudadas técnicas de seleção de características e abordagens computacionais mais relevantes para a detecção das interações entre os SNPs e algoritmos baseados em learning vector quantization (LVQ), verificando suas deficiências frente aos diferentes desafios apresentados.
Os experimentos realizados mostraram que os algoritmo baseados em LVQ resultados promissores com requisitos computacionais relativamente baixos, no entanto, por não terem sido desenvolvidos com o propósito de realizar inferência das interações entre SNPs, apresentam certas deficiências para este tipo de aplicação, as quais são o principal objeto de estudo no momento. Diante disso, propomos uma nova metodologia denominada iGRLVQ-SNPi baseada em algoritmo de LVQ para lidar de forma eficiente com o problema da inferência das interações entre os SNPs.

Palavras-chave: GWAS, SNPs, Interação, Feature Selection, Learning Vector Quantization
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web