Programação
-
Projeto de 'Dissecação' Molecular
Instruções Gerais:
- Para este projeto, faremos uma 'dissecação' molecular. Em outras palavras, dada uma sequência biológica desconhecida, vamos extrair o máximo de informações que pudermos da sequência, empregando quase todas as ferramentas que usamos no curso.
- Para este projeto, os roteiros das práticas ficarão disponíveis para consulta, caso vocês desejem.
- O projeto deve ser feito em duplas e entregue na forma de um relatório sucinto (<= 5 páginas), com as informações sobre a sequência biológica que vocês receberão.
- Defina a sua dupla e me enviem um e-mail dizendo quem é a dupla que fará o projeto. Eu responderei à mensagem criando um grupo no moodle para que vocês consigam enviar o projeto pelo moodle e, no mesmo email, enviarei a sequência que vocês usarão no projeto.
- O relatório deverá ser entregue até o dia 07/07/2023, dia da prova P2.
Instruções Específicas:
Dada a sequência biológica que vocês irão receber:
1) Faça uma busca no banco de dados NCBI por sequências referência selecionadas;
2) Produza um bom alinhamento múltiplo com estas sequências;
3) A partir do seu alinhamento múltiplo, faça uma análise filogenética das sequências que você encontrou no seu alinhamento múltiplo. Utilize o método da junção de vizinhos (neighbor joining), com validação por Bootstrap. A sequência que você recebeu é mais próxima, evolutivamente, de que organismos? Você consegue observar uma boa separação entre sequências de eucariotos/procariotos, se for o caso? Sua análise possui um bom suporte de bootstrap?
4) A sequência que você recebeu possui predição de hélices transmembrana? E sítios de glicosilação? Que outras informações podemos obter a partir da sequência somente?
5) Faça a predição da estrutura da proteína cuja sequência você recebeu. A predição é confiável? Por quê?
6) Faça uma busca da sua sequência no banco de dados KEGG (https://www.genome.jp/tools/fasta/). É possível associar:
a. Uma função à sequência que você recebeu?
b. Ela participa de alguma rede metabólica? Se sim, qual?
c. Caso sua sequência seja de uma enzima, que reação ela catalisa? Quais os substratos/produtos? Qual o código enzimático desta enzima (E.C)?
d. Quais genes aparecem nas adjacências do gene codificante para esta enzima no genoma deste organismo?
e. Se você consultar o BLAST empregando como sequência de busca a sequência de nucleotídeos do gene que codifica para esta proteína, você consegue identificar por quantos exons ela é constituída?