Esses exercícios têm o objetivo de fixar conceitos básicos sobre o equilíbrio de Hardy-Weinberg, contagem de alelos e genótipos e o uso de modelos em genética e evolução.

1. Seleção Natural sobre proporções Hardy-Weinberg

Numa população nasceram 100 indivíduos, e os números encontrados para cada um dos genótipos foram os seguintes: \(N_{AA}=36\), \(N_{Aa}=48\),\(N_{aa}=16\). Você pode confirmar, mas já adianto que essa é uma população que tem frequências genotípicas em conformidade com o modelo de Hardy-Weinberg.

Imagine agora que os genótipos ``aa’’ sejam suscetíveis a uma infecção viral, de modo que todos os indivíduos com esse genótipo morram antes de se tornarem adultos. Agora temos a população num novo estado, em que sa frequências genotípicas são>

\(N_{AA}=36\), \(N_{Aa}=48\),\(N_{aa}=0\)

Essa população se encaixa no modelo de Hardy-Weinberg?

2. Efeito de endogamia sobre Hardy-Weinberg

Um criador de plantas possuía em sua estufa uma população com frequências genotípicas conforme apresentadas na questão anterior: \(F_{AA}=0,36\), \(F_{Aa}=0,48\),\(F_{aa}=0,16\)

Ele submeteu todos os indivíduos dessa população a uma rodada de autofecundação, originando uma nova geração. Repare que a auto-fecundação implica que o próprio organismo contribui os dois gametas para sua prole. Assim, um indivíduo AA só produzirá descendentes AA, um indivíduo aa só produzirá indivíduos aa. Já indivíduos Aa, quando autofecundados, produzirão três tipos de prole: AA, Aa, e aa, nas proporções de 1:2:1. Relembre isso, se nefcessário, por aqui

Dessa forma ele obteve uma população com as seguintes frequências genotípicas: 0,48; 0,24; 0,28 (para AA, Aa e aa, respectivamente).

  1. Compare as frequências alélicas e genotípicas antes e depois da autofecundação. Elas diferem?

  2. A geração produzida pela autofecundação está em equilíbrio de Hardy-Weinberg?

  3. Claramente existe uma diferença nas frequências genotípicas antes e após os cruzamentos por autofecundação. Uma forma de quantificar o efeito da autofecundação (que é uma forma de endogamia, o cruzamento entre indivíduos aparentados) é estimar o coeficiente de endogamia, simbolizado pela letra \(f\). Ele é obtido pela seguinte fórmula.

\(f= \frac{H_{esp} - H_{obs} } {H_{esp}}\).

O valor de \(H_{esp}\) refere-se a quantos heterozigotos esperamos encontrar de acordo com o modelo de HW, enquanto o \(H_{obs}\) é o valor de quantos heterozigotos são, de fato, observados.

O que esse índice nos diz? Em que situação “f” seria zero? –>

3. Testando Hardy-Weinberg numa amostra populacional humana com dados reais

Para termos uma experiência de análise de dados real, preparei um conjunto de dados para investigamos. Esses dados foram obtidos a partir do projeto 1000 genomas, para amostras de 108 indivíduos Yoruba. Baixei todos os SNPs bialélicos do cromossomo 21 e isolei dois conjuntos: os 5000 SNPs na ponto do braço curto e os 5000 SNPs da ponto do braço longo. Fiz essa seleção pois o conjunto total de SNPs seria grande demais para trabalharmos confortavelmente.

Para cada SNP, identifico os três genótipos possíveis, nomeados como ref.ref ref.alt alt.alt. Os “ref” significam que trata-se de um alelo idêntico àquele presente naquela posição no “genoma referência humano”. Os “alt” são aqueles que diferem do referência, e são chamados de alelos alternativos.

Sua tarefa consiste de duas etapas.Primeiro, devem fazer um gráfico em que relaciona as frequências alélicas com as frequências genotípicas esperadas pelo modelo de Hardy-Weinberg.Você terá três funções diferentes, uma para cada genótipo.

A seguir, peço que indiquem para cada SNP disponível onde eles estão no gráfico. Uma função que sobreponha os dados para cada genótipo é o ideal para essa visualização. Isso envolve apenas plotar, para cada SNP, a frequência genotípica em relação à frequência alélica (fazendo isso separadamente para cada genótipo).

O objeitvo do exercício é relacionar as frequências genotípicas observadas com aquelas esperadas pelo modelo de Hardy-Weinberg. Analise os padrões gerais e formule ideias sobre o que pode estar acontecendo.

4. Estudo de caso: usando HW para estudar evolução em populações humanas

Hoje em dia é bem estabelecido que populações humanas têm frequências genotípicas muito próximas ao esperado sob Hardy-Weinberg. Isso não significa que as populações atendem exatamente a todos os pressupostos do modelo, mas apenas que se há desvios em relação aos pressupostos, eles não são suficientemente intensos para causar grandes desvios. Para uma população não estar em Hardy-Weinberg, um dos pressupostos precisa estar sendo violado de modo drástico.

Por essa razão, quando há um desvio em relação ao esperado sob equilíbrio de Hardy-Weinberg, é importante nos atermos e considerarmos o que pode estar ocorrendo para explicá-lo. O exemplo a seguir, que descreve dados reais, usa as predições do modelo de Hardy-Weinberg para fazer inferências sobre o processo evolutivo.

A história dos Fore

Em populações humanas, há varibilidade não-sinônima (isto é, que resulta numa mudança no amino-ácido) no SNP rs1799990, que corresponde ao códon 129 do gene da human prion protein gene (PRNP). Esse polimorfismo resulta em dois possíveis amino-ácidos nessa posição: metionina ou valina. Ele é particularmente interessante pois indivíduos heterozigotos têm um fenótipo especial: são resistentes a uma doença neurodegenartiva adquirida chamada kuru.

Kuru é causada e transmitida por um prion codificado pela PRNP, e tornou-se conhecida para a medicina na década de 1950, quando havia presença colonial na Papua-Nova Guiné. Entre os povos dessa região estão os Fore, nos quais havia uma alta incidência de kuru, com mortalidade chegando a 2% por ano. Descobriu-se que o kuru é transmitido ao se ingerir os cérebros de indivíduos infectados, algo que ocorria nos Fore pois eles comiam parentes mortos em rituais funerários. Os homens tinham direito de escolher as partes do corpo que queriam comer antes dos demais, e deixavam as partes menos atraentes –como o cérebro, que é enriquecido em prions– para as mulheres. Nos dias de hoje essa prática funerária deixou de ser praticada pelos Fore.

Um grupo de indivíduos Fore, na Papua-Nova Guiné

Quando se descobriu que a PRNP com a mutação no SNP rs1799990 conferia resistência ao kuru, estudos populacionais foram realizados. Os resultados para as frequências genotípicas entre mulheres nascidas antes de 1950, entre homens nascidos antes de 1950, ou entre os Fore nascidos recentemente estão na Tabela abaixo.

A sua tarefa é usar o modelo de HW e fazer um teste estatístico (usando teste do Chi-quadrado, descrito no final deste documento) para identificar se em algum grupo populacional há desvio signficativo. Com base nos resultados obtidos, proponha uma hipótese evolutiva capaz de explicar as frequências genotípicas entre os Fore.

Grupo Fore Homozigotos para metionina Heterozigotos Homozigotos para valina
Mulheres nascidas antes de 1950 16 86 23
Homens nascidos antes de 1950 34 111 60
Indivíduos Fore jovens 52 136 94

#Teste de Qui-quadrado (\(\chi^{2}\)) para hipótese de equilíbrio de Hardy-Weinberg

O teste qui-quadrado é frequentemente utilizado para verificar se valores obtidos para dados reais correspondem aos esperados por uma previsão teórica. No nosso caso, testaremos se o número de indivíduos em cada classe genotípica corresponde ao esperado sob a hipótese da população estar em equilíbrio de Hardy-Weinberg.

O teste de qui-quadrado quantifica o quão “próximos” ou “distantes” os dados reais estão dos esperados pela teoria. Essa quantificação é feita através da estatística de qui-quadrado, definida abaixo:

\(\chi^2=\sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i}\)

Onde n é o número de classes.

Quanto maior o valor de \(\chi^2\), mais distantes estão os dados reais dos observados. Para exprimir essa distância num contexto estatístico,o teste de qui-quadrado se baseia na comparação entre o valor de uma estatística obtida para os dados (neste caso, \(\chi^2\)) e valores críticos apropriados de acordo com o nível de significância (\(\alpha\)) e o número de graus de liberdade (g.l.) do teste.

No caso do teste da hipótese de equilíbrio de Hardy-Weinberg, a previsão teórica testada (Hipótese nula, ou \(H_{0}\)) para os três genótipos (classes) é de que as frequências genotípicas \(F_{AA}\), \(F_{Aa}\) e \(F_{aa}\) (valores observados) estejam nas proporções esperadas \(p^2\), \(2pq\) e \(q^2\) (ocorrendo, portanto, com frequências esperadas \(p^2*N\), \(2pq*N\) e \(q^2*N\)).

AA Aa aa Total
Observado \(N_{AA}\) \(N_{Aa}\) \(N_{aa}\) \(N_{t}=N_{AA}+N_{Aa}+N_{aa}\)
Esperado \(f_{A}^2N_{t}\) \(2f_{A}f_{a} N_{t}\) \(f_{a}^2 N_{t}\) \(N\)
Contribuição para \(chi^2\) \(\frac{(N_{AA} - f_{A}^2 N_{t})^2}{f_{A}^2 N_{t}}\) \(\frac{(N_{Aa} - 2f_{A}f_{a} N_{t})^2}{2f_{A}f_{a} N_{t}}\) \(\frac{(N_{aa} - f_{a}^2 N_{t})^2}{f_{a}^2 N_{t}}\) \(\chi^2\)

Após calcular o valor de \(\chi^2\), este é comparado com o valor crítico para o número de graus de liberdade (g.l.) apropriado e nível de significância (\(\alpha\)) desejado. Caso o valor encontrado para \(\chi^2\) seja maior que o valor crítico, rejeita-se a hipótese.

Para o caso do teste de que a população encontra-se em equilíbrio de Hardy-Weinberg para um locus bialélico, em que o número de graus de liberdade é igual a 1, os valores críticos de \(\chi^2\) para diferentes níveis de significância são:

\(\alpha\) 10% 5% 1%
\(\chi^2\) crítico 2,71 3,84 6,63

Se o valor de \(\chi^2\) encontrado for maior que o valor crítico para o \(\alpha\) selecionado, rejeita-se a hipótese de que a população está em equilíbrio de Hardy-Weinberg. Usualmente, adotamos um nível de significância de 5%.