English

CIn - Centro de Informática UFPE




Eventos Relacionados

Defesa de Dissertação de Mestrado Nº 1.266: "Uso de Random Forests e Redes Biológicas na Associação de Polimorfismos a Doença de Alzheimer"

O aluno Gilderlanio Santana de Araújo irá defender seu trabalho 7 de março, às 10h, no Anfiteatro do CIn Início: 07/03/2013 às 10:00 Término: 07/03/2013 às 12:00 Local: Anfiteatro do CIn

Pós-Graduação em Ciência da Computação – UFPE
Defesa de Dissertação de Mestrado Nº 1.266
 
Aluno: Gilderlanio Santana de Araújo
Orientador: Prof. Ivan Gesteira Costa Filho
Título: Uso de Random Forests e Redes Biológicas na Associação de Polimorfismos a Doença de Alzheimer
Data: 07/03/2013
Hora/Local: 10:00h – Anfiteatro
Banca Examinadora:
Prof. Ricardo Bastos Cavalcante Prudêncio (UFPE / CIn)
Prof. João Ricardo Mendes de Oliveira (UFPE / Departamento de Neuropsiquiatria)
Prof. Paulo Gustavo Soares Fonseca (UFPE / CIn)
 
RESUMO:
 
O desenvolvimento de técnicas de genotipagem de baixo custo (SNP arrays) e a anotações de milhares de polimorfismos de nucleotídeo simples (SNPs) em bancos de dados públicos tem originado um crescente número de estudos de associação em escala genômica (do inglês, Genome-Wide Associations Studies - GWAS). Nesses estudos, um enorme número de SNPs (centenas de milhares) são avaliados com métodos estatísticos univariados de forma a encontrar SNPs associados a um determinado fenótipo. Testes univariados são incapazes de capturar relações de alta ordem entre os SNPs, algo comum em doenças genéticas complexas e são afetados pela alta correlação entre SNPs na mesma região genômica. Métodos de aprendizado de máquina, como o Random Forest (RF) tem sido aplicados em dados de GWAS para realizar a previsão do risco da doença e capturar os SNPs associados a mesmas. Apesar de RF ser um método com reconhecida performance em dados de alta dimensionalidade e na captura de relações não-lineares, o uso de todos os SNPs presentes em um estudo GWAS e computacionalmente inviável. Neste estudo propomos o uso de redes biológicas para a seleção inicial de SNPs candidatos a serem usados pela RF. A partir de um conjunto inicial de genes já relacionados a doença na literatura, usamos ferramentas de redes de interação gene-gene, para encontrar novos genes que possam estar associados a doença. Logo, é possível extrair um número reduzido de SNPs tornando a aplicação do método RF viável. Os experimentos realizados nesse estudo foca-se em investigar quais polimorfismos podem influenciar na suscetibilidade da doença de Alzheimer (DA) e do comprometimento cognitivo leve (MCI). O resultado final das análises é a delineação de uma metodologia para o uso de RF, para a análise de dados de GWAS, tal como a caracterização de potenciais fatores de riscos da doença Alzheimer.
 
Palavras-chave: GWAS, Random Forest, SNPs, Doença de Alzheimer, Fatores Genéticos de Risco
  • © Centro de Informática UFPE - Todos os direitos reservados
    Tel +55 81 2126.8430 - Cidade Universitária - 50740-560 - Recife/PE
Plano4 Consultoria Web