Ferramenta e análise de big data aplicadas à leishmaniose tegumentar é tema de tese

Getting your Trinity Audio player ready...

Autoria: Felipe Guimarães Torres
Orientação: Antônio Ricardo Khouri Cunha
Título da tese: “Ferramenta e análise de big data aplicadas à leishmaniose tegumentar: aspectos clínicos e genômicos.
Programa:Biotecnologia em Saúde e Medicina Investigativa
Defesa: 27/05/2020
Horário: 14:00 
Webconferência: https://zoom.us/j/3742422123 ID da reunião: 374 242 2123

RESUMO

Nos últimos tempos, o avanço tecnológico tem facilitado por meios metodológicos e de custos reduzidos a geração de dados biológicos sobre os parasitos responsáveis pelas Leishmanioses em especial a Leishmania braziliensis. O genoma desse parasito foi sequenciado e re-anotado e os estudos clínicos tem avançado com técnicas mais assertivas de tratamento e diagnostico. Estudos genéticos, correlacionaram mutações em sítios genômicos específicos desse parasito com uma manifestação clinica atípica permitindo o maior entendimento do impacto de alterações do genoma do parasito na patologia do hospedeiro. Todavia, existe uma carência de novas ferramentas computacionais que permitam o armazenamento e integração desses múltiplos tipos de dados estruturados e não-estruturados, gerados pelas pesquisas e novas tecnologias utilizadas. As novas técnicas e recursos computacionais permitem que essa integração de dados componha analises mais complexas utilizando um maior volume dos mesmos. Assim propõe-se desenvolver bancos de dados com as caraterísticas clínico-epidemiológicas dos pacientes e as varia coes do parasito.

Objetivo: Realizar uma análise exploratória do genoma da Leishmania braziliensis e desenvolver ferramentas para sua interação com dados clínicos.

Material e Método: Inicialmente, foi realizado um estudo na área endêmica de Jiquiriça/BA para levantamento de requisitos e especificações para um sistema que se adequasse ao gerenciamento de dados clínicos em estudos de Coorte desse patógeno. O sistema foi desenvolvido em Java com seu banco de dados utilizando o Postgres. Depois dessa fase, analisou-se todos os genomas disponíveis no estudo ERP003732 do SRA (Sequence Read Archive), totalizando 98 amostras sequenciadas de L. braziliensis. Um pipeline computacional foi utilizado para analise de mutações sendo composto por: Trimmomatic, GATK, SAMTools e BEDTools. Em seguida, avaliou-se a variação genica utilizando a medida de entropia sendo construída uma arvore filogenética utilizando o Mega X.

Resultados e Conclusões: Utilizando a experiencia de pesquisadores especialistas em estudos clínicos de Leishmaniose Tegumentar (LT), foi desenvolvido um gerenciador de dados clínicos e imagens de estudos sobre essa patologia, o RegaDB Leishmaniasis. Este se integra com as principais ferramentas de analises de dados clínicos por meio da exportação de dados em arquivos CSV (Comma separated values). O acesso aos dados se da através do controle de acesso realizado por contas de usuários e níveis. Todo o código-fonte dessa ferramenta e open-source e esta disponível no Github (https://github.com/fgtorres/regadb-leishmaniasis). Nesse trabalho, foi realizado o estudo da variedade de nucleotídeos ao longo do genoma da L. braziliensis. Identificou-se cerca de 25.368 sítios com mutações no dataset de genomas. Estes foram anotados, sendo que 32% (8.311 de 25.368) das mutações ocorreram em regiões intra-genicas.
Alguns desses genes possuíam mais de 10 sítios com ocorrência de mutações ao longo da sua sequencia como por exemplo Kinetoplast-associated protein-like, que demonstrou um grande potencial para identificação de subgênero. Com a possibilidade de armazenamento de dados e imagens, o RegaDB Leishmaniasis permite a criação de banco de dados de multiplos tipos que pode ser utilizado em analises complexas por técnicas de Big Data dando suporte a novos estudos.

Palavras-chave: Bancos de dados, Anotação Genômica, Big Data, Variabilidade genômica, Leishmania braziliensis, Leishmaniose e Integração de dados.

twitterFacebookmail