Esses exercícios têm o objetivo de fixar conceitos básicos sobre o equilíbrio de Hardy-Weinberg, contagem de alelos e genótipos e o uso de modelos em genética e evolução.

1. Equilíbrio de Hardy-Weinberg

Foram colhidas amostras para seis populações, e as frequências genotípicas encontradas para um lócus bialélico estão indicadas na tabela. Para cada população:

  1. Estime as frequências alélicas.

  2. Avalie se a população está em equilíbrio de Hardy-Weinberg. Isso requer comparar as frequências genotípicas observadas com aquelas esperadas de acordo com o modelo de Hardy-Weinberg. Sua resposta pode ser simples e qualitativa, bastando dizer se as frequências observadas e esperadas são iguais ou diferentes.

genótipo pop1 pop2 pop3 pop4 pop5 pop6
AA 0,36 0,81 0,4 0 0,5 0,25
Aa 0,48 0,18 0,4 1,0 0 0,50
aa 0,16 0,01 0,2 0 0,5 0,25

2. Seleção Natural sobre proporções Hardy-Weinberg

Considere os genótipos da população 1, e assuma que as frequências refletem o que é observado ao nascimento. Imagine que os genótipos ``aa’’ sejam suscetíveis a uma infecção viral, de modo que todos os indivíduos com esse genótipo morram antes de se tornarem adultos, e portanto não contribuam para a amostra. Recalcule frequências genotípicas e alélicas para essa cenário e avalie se a amostra está em equilíbrio de Hardy-Weinberg (não é necessário fazer um teste estatístico).

3. Efeito de endogamia sobre Hardy-Weinberg

Apesar de ser um regima de cruzamentos que não se aplica a humanos, vamos usar a auto-fecundação para compreender um extremo dos efeitos de cruzamentos entre indivíduos aparentados. Imagine que um criador de plantas possuía em sua estufa uma população com frequências genotípicas conforme apresentadas para a população 1 acima. Ele submeteu todos os indivíduos dessa população a uma rodada de autofecundação, originando uma nova geração.

Dessa forma ele obteve uma população com as seguintes frequências genotípicas: 0,48; 0,24; 0,28 (para AA, Aa e aa, respectivamente).

Repare que essas frequências genotípicas são aquelas esperadas em função do regime de autofecundação ao qual as plantas foram submetidas, como vocês devem ter visto em cursos básicos de genética.

  1. Compare as frequências alélicas e genotípicas antes e depois da autofecundação. Elas diferem?
  1. A geração produzida pela autofecundação está em equilíbrio de Hardy-Weinberg?

  2. Para comparar a distância das frequências genotípicas observadas após a endogamia em relação às esperadas sob a hipóttese de Hardy-Weinberg (isto é, caso não houvesse endogamia), use a seguinte fórmula, que nos dá o valor de f, o coeficiente de endogamia. Em que situação “f” seria zero? O que esse valor de \(f\) nos diz? O valor de \(f\) poderia ser negativo?

\(f=\frac{H_{esp}-H_{obs}}{H_{esp}}\)

4. Estrutura populacional e HW

Um dos pressupostos do equilíbrio de HW é que as populações são panmíticas (todos indivíduos podem cruzar com os demais ao acaso). Uma forma de violar esse pressuposto é imaginar que aquilo que enxergamos como sendo uma população única é na verdade constituída por duas subpopulações. Isso pode acontecer no caso de populações humanas em que houver migração recente, e há grupos de diferentes ancestralidades formando aquilo que tratamos como uma única população miscigenada. Considere então uma população que é constitutída por dois grupos:

Grupo 1: \(f_{AA}=0,81;f_{Aa}=0,18;f_{aa}=0,01\)

Grupo 2: \(f_{AA}=0,01;f_{Aa}=0,18;f_{aa}=0,81\)

Calcule a diversidade genética, para cada grupo, usando a métrica \(H\) (a taxa de heterozigose esperada). Vamos chamar esses valores de \(H_1\) e \(H_2\). Vamos também definir um valor médio para o grupo total (formando pela união dos grupos 1 e 2), chamado de \(\bar{H_{S}}\).

Os grupos 1 e 2 estão individualmente em equilíbrio de HW?

Agora vamos estudar a a população inteira, amalgamando os grupos 1 e 2. Para esse grupo grande, calcule a frequência alélica e as taxas de heterozigose esperadas (vamos chamar de \(H_{t}\), por referir-se ao esperado para a população total). Esse grupo inteiro está em equilíbrio de HW?

5. Contexto genotípico de alelos raros

Considere um alelo que ocorre em baixa frequência numa população, com \(f_A=0,01\). É possível esse alelo ocorrer tanto em homozigose quando em heterozigose. O quão mais provável é que ele seja encontrado em estado de heterozigose do que em homozigose? E se a frequência fosse \(f_A=0,001\)? O que isso te diz sobre a achance de uma mutação recessiva que é muito rara ser removido da população por seleção natural?

Podemos, por analogia ao coeficiente de endocruzamento, definir um valor \(F\) que define o quão longe o \(H\) do grupo total está dos valores esperados sob HW. A métrica tem a forma \(F=\frac{H_T-\bar{H_S}}{H_T}\). Calcule esse valor e interprete o que ele revela. Esse valor de \(F\) é também chamado de \(F_{ST}\), pois ele mede um efeito de endogamia causado por diferenças entre as subpopulações (\(S\)) e a população total (\(T\)). O que seria necessário para que o valor de \(F_{ST}\) fosse zero, num estudo de duas populações?

6. Uma análise de dados genômicos.

Para termos uma experiência de análise de dados real, preparei um conjunto de dados para investigamos. Esses dados foram obtidos a partir do projeto 1000 genomas, para amostras de 108 indivíduos Yoruba. Baixei todos os SNPs bialélicos do cromossomo 21 e isolei dois conjuntos: os 5000 SNPs na pontas do braço curto e os 5000 SNPs da ponto do braço longo. Fiz essa seleção pois o conjunto total de SNPs seria grande demais para trabalharmos confortavelmente. Os links estão disponíveis no moodle.

Para cada SNP, identifico os três genótipos possíveis, nomeados como ref.ref ref.alt alt.alt. Os “ref” significam que trata-se de um alelo idêntico àquele presente naquela posição no “genoma referência humano”. Os “alt” são aqueles que diferem do referência, e são chamados de alelos alternativos.

Sua tarefa consiste de duas etapas.Primeiro, devem fazer um gráfico em que relaciona as frequências alélicas com as frequências genotípicas esperadas pelo modelo de Hardy-Weinberg.Você terá três funções diferentes relacionanda a frequência alélica com a genotípica, uma para cada genótipo.

A seguir, peço que indiquem para cada SNP disponível onde eles estão no gráfico. Isso envolve apenas plotar, para cada SNP, a frequência genotípica em relação à frequência alélica (fazendo isso separadamente para cada genótipo).

O objeitvo do exercício é relacionar as frequências genotípicas observadas com aquelas esperadas pelo modelo de Hardy-Weinberg, de uma maneira visual.

Tendo feito essa imagem, discuta com o seu grupo:

7. Estudo de caso: usando HW para estudar evolução em populações humanas

Hoje em dia é bem estabelecido que populações humanas têm frequências genotípicas muito próximas ao esperado sob Hardy-Weinberg. Isso não significa que as populações atendem exatamente a todos os pressupostos do modelo, mas apenas que se há desvios em relação aos pressupostos, eles não são suficientemente intensos para causar grandes desvios. Para uma população não estar em Hardy-Weinberg, um dos pressupostos precisa estar sendo violado de modo drástico.

Por essa razão, quando há um desvio em relação ao esperado sob equilíbrio de Hardy-Weinberg, é importante nos atermos e considerarmos o que pode estar ocorrendo para explicá-lo. O exemplo a seguir, que descreve dados reais, usa as predições do modelo de Hardy-Weinberg para fazer inferências sobre o processo evolutivo.

A história dos Fore

Em populações humanas, há varibilidade não-sinônima (isto é, que resulta numa mudança no amino-ácido) no SNP rs1799990, que corresponde ao códon 129 do gene da human prion protein gene (PRNP). Esse polimorfismo resulta em dois possíveis amino-ácidos nessa posição: metionina ou valina. Ele é particularmente interessante pois indivíduos heterozigotos têm um fenótipo especial: são resistentes a uma doença neurodegenartiva adquirida chamada kuru.

Kuru é causada e transmitida por um prion codificado pela PRNP, e tornou-se conhecida para a medicina na década de 1950, quando havia presença colonial na Papua-Nova Guiné. Entre os povos dessa região estão os Fore, nos quais havia uma alta incidência de kuru, com mortalidade chegando a 2% por ano. Descobriu-se que o kuru é transmitido ao se ingerir os cérebros de indivíduos infectados, algo que ocorria nos Fore pois eles comiam parentes mortos em rituais funerários. Os homens tinham direito de escolher as partes do corpo que queriam comer antes dos demais, e deixavam as partes menos atraentes –como o cérebro, que é enriquecido em prions– para as mulheres. Nos dias de hoje essa prática funerária deixou de ser praticada pelos Fore.

Um grupo de indivíduos Fore, na Papua-Nova Guiné

Quando se descobriu que a PRNP com a mutação no SNP rs1799990 conferia resistência ao kuru, estudos populacionais foram realizados. Os resultados para as frequências genotípicas entre mulheres nascidas antes de 1950, entre homens nascidos antes de 1950, ou entre os Fore nascidos recentemente estão na Tabela abaixo.

A sua tarefa é usar o modelo de HW e fazer um teste estatístico (usando teste do Chi-quadrado, descrito no final deste documento) para identificar se em algum grupo populacional há desvio signficativo. Com base nos resultados obtidos, proponha uma hipótese evolutiva capaz de explicar as frequências genotípicas entre os Fore.

Grupo Fore Homozigotos para metionina Heterozigotos Homozigotos para valina
Mulheres nascidas antes de 1950 16 86 23
Homens nascidos antes de 1950 34 111 60
Indivíduos Fore jovens 52 136 94

#Teste de Qui-quadrado (\(\chi^{2}\)) para hipótese de equilíbrio de Hardy-Weinberg

O teste qui-quadrado é frequentemente utilizado para verificar se valores obtidos para dados reais correspondem aos esperados por uma previsão teórica. No nosso caso, testaremos se o número de indivíduos em cada classe genotípica corresponde ao esperado sob a hipótese da população estar em equilíbrio de Hardy-Weinberg.

O teste de qui-quadrado quantifica o quão “próximos” ou “distantes” os dados reais estão dos esperados pela teoria. Essa quantificação é feita através da estatística de qui-quadrado, definida abaixo:

\(\chi^2=\sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i}\)

Onde n é o número de classes.

Quanto maior o valor de \(\chi^2\), mais distantes estão os dados reais dos observados. Para exprimir essa distância num contexto estatístico,o teste de qui-quadrado se baseia na comparação entre o valor de uma estatística obtida para os dados (neste caso, \(\chi^2\)) e valores críticos apropriados de acordo com o nível de significância (\(\alpha\)) e o número de graus de liberdade (g.l.) do teste.

No caso do teste da hipótese de equilíbrio de Hardy-Weinberg, a previsão teórica testada (Hipótese nula, ou \(H_{0}\)) para os três genótipos (classes) é de que as frequências genotípicas \(F_{AA}\), \(F_{Aa}\) e \(F_{aa}\) (valores observados) estejam nas proporções esperadas \(p^2\), \(2pq\) e \(q^2\) (ocorrendo, portanto, com frequências esperadas \(p^2*N\), \(2pq*N\) e \(q^2*N\)).

AA Aa aa Total
Observado \(N_{AA}\) \(N_{Aa}\) \(N_{aa}\) \(N_{t}=N_{AA}+N_{Aa}+N_{aa}\)
Esperado \(f_{A}^2N_{t}\) \(2f_{A}f_{a} N_{t}\) \(f_{a}^2 N_{t}\) \(N\)
Contribuição para \(chi^2\) \(\frac{(N_{AA} - f_{A}^2 N_{t})^2}{f_{A}^2 N_{t}}\) \(\frac{(N_{Aa} - 2f_{A}f_{a} N_{t})^2}{2f_{A}f_{a} N_{t}}\) \(\frac{(N_{aa} - f_{a}^2 N_{t})^2}{f_{a}^2 N_{t}}\) \(\chi^2\)

Após calcular o valor de \(\chi^2\), este é comparado com o valor crítico para o número de graus de liberdade (g.l.) apropriado e nível de significância (\(\alpha\)) desejado. Caso o valor encontrado para \(\chi^2\) seja maior que o valor crítico, rejeita-se a hipótese.

Para o caso do teste de que a população encontra-se em equilíbrio de Hardy-Weinberg para um locus bialélico, em que o número de graus de liberdade é igual a 1, os valores críticos de \(\chi^2\) para diferentes níveis de significância são:

\(\alpha\) 10% 5% 1%
\(\chi^2\) crítico 2,71 3,84 6,63

Se o valor de \(\chi^2\) encontrado for maior que o valor crítico para o \(\alpha\) selecionado, rejeita-se a hipótese de que a população está em equilíbrio de Hardy-Weinberg. Usualmente, adotamos um nível de significância de 5%.