Como o genoma humano foi sequenciado


O projeto Genoma Humano (PGH) foi iniciado oficialmente em outubro de 1990, com previsão de finalização em 2005 e com um orçamento estimado em 3 bilhões de dólares. O objetivo principal era o de determinar a sequência dos 3 bilhões de pares de bases que compõem os 24 cromossomos do genoma humano (22 autossomos e os cromossomos sexuais X e Y) , e identificar todos os genes que ele contém. O PGH, com fundos públicos começou sob a direção de James Watson, codescobridor da estrutura da dupla hélice do DNA, e resultou das iniciativas do DOE (Departamento de Energia) e NIH (Instituto Nacional da Saúde) dos EUA, que estabeleceram vários centros genômicos em universidades americanas com posterior alcance internacional. Grupos de pesquisadores de diversos países como a Inglaterra, França, Alemanha, Japão e Brasil se juntaram e um fundo público internacional foi investido no projeto Genoma Humano. Surgiu então um organismo de coordenação internacional chamado HUGO (Human Genome Organization), para sintonizar o trabalho e organizar o conhecimento adquirido em um banco de dados centralizado, o Genome Database. A missão do HUGO era facilitar e coordenar a iniciativa global de mapear, sequenciar e analisar funcionalmente o genoma humano, e promover a aplicação desses conhecimentos ao melhoramento da saúde humana.

O Brasil também deu sua cota de contribuição ao projeto, com iniciativas de pesquisadores brasileiros da USP, que clonaram genes para várias doenças genéticas. Uma iniciativa conjunta da FAPESP e diversas universidades levou ao sequenciamento do genoma da bactéria Xilela fastidiosa, que causa a doença dos laranjais, chamada amarelinho, e à criação do Projeto Genoma Humano do Câncer.

Foi também foco do programa abordar os aspectos éticos, legais e sociais envolvidos, pois, além da descoberta da posição de cada gene e sua composição, que seria valiosa para diagnóstico e tratamento de muitas doenças, previa-se e temia-se o perigo do uso indevido das informações genéticas geradas.

Em meados da década de 1990, uma grande quantidade de dados de mapas físicos e genéticos humanos e murinos, bem como sequências de DNAc humanas, de bactérias e levedura foram disponibilizadas para a comunidade científica, mostrando a importância do projeto. Dessa forma, grande quantidade de dados de mapeamento físico e genético, bem como de sequências de DNA, começou a ser depositada nos bancos de dados e disponibilizada imediatamente para uso dos pesquisadores. Isto mudou significativamente a forma de conduzir pesquisas em genética.

Dois grupos independentes, um público e outro privado, competiram para sequenciar o genoma humano, e a sequência rascunho foi anunciada em 2000, por ambos, através de publicações nas revistas Nature (IHFSC) e Science (Celera). Apesar de ainda incompletos, estes continham a maior informação do genoma humano já noticiada. Um resultado surpreendente foi o menor número de genes encontrado, cerca de 30.000 a 40.000, quando se acreditava que os seres humanos teriam ao redor de 100.000 genes. Isto significa que a complexidade de uma espécie não é diretamente proporcional ao número de genes. A disponibilização desses dados gerou um avanço muito grande na localização de novos genes ligados a doenças mendelianas, facilitando muito o acesso à sequência e mapas genéticos.

Um grande problema que se impôs ao sequenciamento do genoma humano estava relacionado com a enorme quantidade de sequências repetitivas, que geraram um grande desafio técnico, por causa da dificuldade de seu sequenciamento. A presença de sequências repetitivas curtas AT ou CG, presentes em centenas de milhares no genoma humano, longas, dispersas ao longo do genoma em todos os cromossomos, causou grandes dificuldades para a amplificação de sequências ou montagem das leituras pelas técnicas utilizadas na época. Assim, decidiu-se concentrar esforços nas sequências únicas, que são as que contêm as informações importantes. Grandes esforços foram então concentrados para sequenciar o DNAc. Os DNAc são produzidos por transcrição reversa dos RNAs mensageiros, não contendo íntrons, ou sequências intergênicas não-codificantes. O seu uso para o sequenciamento levou à redução significativa na quantidade de sequenciamento. O sequenciamento de fragmentos de DNAc foi muito útil na confirmação e validação da montagem da sequência do genoma humano, e atualmente existem bancos de dados públicos, que disponibilizam sequências geradas a partir de mRNAs de vários tipos de tecidos e células humanas.

Posteriormente, retomou-se o sequenciamento do DNA total humano, visto que muitas regiões não-codificantes do genoma têm função importante, tais como as sequências reguladoras da transcrição e os sítios de processamento.

O fechamento final da sequência do genoma exigiu atenção especial às regiões-problema. Um grande trabalho adicional foi necessário para preencher as falhas e corrigir os erros no rascunho da sequência e finalizá-la. A sequência final foi anunciada em julho de 2003 e cobriu mais de 99% das regiões de eucromatina do genoma humano.

A empresa Celera fez o pedido da patente dos 6.500 genes que mapeou, o que gerou problemas de ordem ética, pois isso poderia inviabilizar a produção de medicamentos baseados nesse conhecimento. Portanto, o presidente americano declarou que o genoma humano não poderia ser patenteado.

O desenvolvimento de tecnologias de sequenciamento de alta resolução, capazes de gerar leituras de sequências mais longas, com maior rapidez e precisão, reduziu muito o custo do sequenciamento de DNA. A grande expectativa de contínuas reduções de custo levou diversas companhias a propor o sequenciamento personalizado de cada indivíduo, em busca do genoma de US$ 1.000,00.

Atualmente, já existem muitos genomas humanos personalizados decifrados no mundo e, em 2011, uma colaboração internacional pretende completar mais 1.000, com indivíduos representativos de todos os continentes. Os resultados sugerem que a variabilidade entre as bases nitrogenadas dos seres humanos é bem maior (estimada em 1%) do que se imaginava (a estimativa era de 0,1%). O pequeno número de genes encontrados sugere também que a complexidade humana provavelmente se deve à maior complexidade no funcionamento desses genes, que poderiam se organizar para originar um número maior de proteínas (projeto proteoma). Esses novos dados envolvem a revisão de muitos conceitos básicos da biologia, incluindo o dogma central de um gene – uma proteína.


!!! Agora veja outro vídeo proposto, também do Projeto Genoma.