Exercício 14 - Expressões regulares em analise de DNA.
A seguinte expressão regular representa a adenilato ciclase associado a uma proteina:
"[LIVM]{2}.RL[DE].{4}RLE"
Essa sequencia é interpretada como: um dos aminoácidos L, I, V ou M nas primeiras duas posições, qualquer aminoácido na posição 3, sequência de aminoácidos RL depois, seguida por aminoácido D ou E, 4 aminoácidos arbitrários, terminando com sequencia de aminoácidos RLE.
Procuramos essa expressão na sequencia DNA armazenada em formato FASTA no arquivo 'prot.fas' anexado.
Escreva um programa, que leia o arquivo 'prot.fas' e junta as linhas em uma variável de texto, ignorando a primeira linha de descrição que começa com símbolo '>'. Em seguida, o programa deve achar a expressão regular que representa a adenilato ciclase e imprimir a sequencia DNA completa com letras minusculas antes e depois da sequencia achada, como mostrado no exemplo abaixo:
lrsyrrdewaLLTRLDAQWERLElwmdrfatki
- 9 May 2019, 1:06 PM