Vie chretienne Cosmos Arts Engin de recherches Plan du site

Samizdat

Célébrez ENCODE III et la disparition de l'ADN poubelle:

Une projet de recherche internationale sur le génome révèle que de grandes quantités d'ADN non codant
sont transcrites et probablement fonctionnelles, et non du "rebut" comme l'avaient pensé les évolutionnistes.



par Margaret Helder, PhD
Creation-Evolution Headlines (traduction Fabrice Bect)

Ce n'est pas un secret parmi les biologistes que les déclarations d'ENCODE II en 2012 étaient controversées. Des scientifiques internationaux du consortium ENCODE ont fait des déclarations sur la façon dont 80% du matériel génétique humain était "fonctionnel"[1] mais le terme fonctionnel, au cours des deux dernières décennies, était devenu associé à des concepts évolutionnistes. L'idée dominante était que les séquences d'ADN dans la cellule n'étaient pour la plupart pas fonctionnelles mais plutôt constituées d'un "ADN poubelle" qui témoignait de l'origine évolutive du matériel génétique de la cellule. Ainsi, l'équipe ENCODE II s'est trouvée très impopulaire auprès de nombreux collègues biologistes pour avoir suggéré un haut niveau de fonctionnalité dans le génome. Maintenant, cependant, en 2020, un troisième projet ENCODE a été publié. S'appuierait-il sur les conclusions de l'équipe ENCODE II, ou réviserait-il ses estimations de fonctionnalité de manière drastique à la baisse ?

Tout a commencé en 2000, lorsque le Président Bill Clinton et le Premier ministre britannique Tony Blair ont annoncé conjointement qu'une première étape du Human Genome Project était terminée. Depuis 1990, une équipe internationale de scientifiques tentait de décrire l'ordre précis des nucléotides dans les chromosomes des cellules humaines. L'idée était qu'un gène fournit l'ordre correct des nucléotides à coder pour une protéine. Les protéines sont des molécules élaborées qui constituent la plupart des composants des cellules vivantes. Des milliards de cellules composent notre corps. On s'attendait à ce que le Human Genome Project fournisse des informations sur environ 100 000 gènes différents.



Représentation simplifiée d'un ribosome :
ARN messager (jaune) entrant, protéine (verte) sortant. (Illustra Media)

Imaginez la surprise de tout le monde lorsque les scientifiques ont annoncé qu'il n'y avait qu'environ 23 000 (ou moins) gènes dans les plus de 3 milliards de nucléotides du génome humain. Cela signifiait que moins de 2% du génome humain codait pour des protéines ! Que faisait le reste de cette énorme collection de nucléotides non codants ? Cette découverte semblait indiquer que la grande majorité de l'ADN humain n'avait aucune fonction apparente. Selon Ewan Birney, directeur de l'Institut européen de bioinformatique à Cambridge, en Angleterre, les gens ont toujours su qu'il devait y avoir une certaine régulation des gènes, mais même si les informations utiles étaient doublées, par rapport à la quantité dans les gènes, cela ne ferait que résulter dans 8 à 9% d'informations fonctionnelles au plus parmi les 3,2 milliards de nucléotides.

La vue évolutive des rebuts indésirables
Il y avait deux réponses possibles à cette découverte étonnante. L'une consistait à déclarer que le génome humain était rempli d'"ADN poubelle". Selon ce point de vue, le génome était évidemment le produit de longues périodes où l'ADN, qui avait été à l'origine utile, était maintenant endommagé, de sorte que d'autres séquences devaient prendre le contrôle. D'énormes zones de séquences répétées semblaient confirmer l'idée d'un ADN inutile. Le génome humain a été déclaré être une confirmation crue de la réalité de l'évolution et un rejet de la création. Quel créateur laisserait traîner autant de déchets ? Et c'est ainsi que l'ADN poubelle sans fonction a été assimilé à des arguments en faveur de l'évolution. Un autre groupe a demandé ce que faisait le reste du génome. Ces longues séquences étaient-elles fonctionnelles, et si oui, que faisaient-elles réellement ?

L'évolution darwinienne repose sur des mutations aléatoires comme matière première pour la sélection naturelle.

L'approche de la recherche fonctionnelle
Poussé par la curiosité pour la nature du génome, un consortium international de scientifiques de 10 pays a lancé en 2003 une investigation systématique sur 1% du génome humain. Tout ce qu'il y avait dans cette étendue de 1% d'ADN a été étudié, qu'il s'agisse d'un gène (codant pour une protéine) ou d'une séquence non codante de nucléotides. Une telle étude devrait également donner une indication représentative de ce qui se passe dans le reste du génome. C'était donc en 2007, que la ENCODE (ENCyclopedia of DNA Elements) a publié ses résultats. À la surprise de beaucoup, la plus grande partie de l'ADN étudié semblait avoir une fonction, ou du moins était copiée dans d'autres molécules de la cellule. Les scientifiques ont ainsi conclu : "la simple vue du génome comme ayant un ensemble défini de loci isolés [gènes] transcrits indépendamment ne semble pas exacte".[2]

Le rapport initial ENCODE était suffisamment intéressant pour encourager le National Human Genome Research Institute basé aux États-Unis à financer une étude sur l'ensemble du génome humain. En conséquence, en 2012, un nouveau consortium ENCODE plus important a publié ses résultats. En résumé, ils ont constaté que :

Les vastes régions désertiques sont désormais peuplées de centaines de milliers de caractéristiques qui contribuent à la régulation des gènes. Et chaque type de cellule utilise différentes combinaisons et permutations de ces caractéristiques pour générer sa biologie unique.[3]

Ce fut une bombe majeure qui devait sortir de l'étude ENCODE II. En fait, le résultat avait été évoqué dans le premier rapport, à savoir une répudiation du concept d'"ADN poubelle". De nombreux biologistes ont été profondément irrités à l'idée que : "Ces données nous ont permis d'assigner des fonctions biochimiques à 80% du génome, en particulier en dehors des régions codant pour les protéines bien étudiées."[4] Un commentaire dans le même numéro renforçait ce point : "Pourquoi l'évolution conserverait-elle de grandes quantités d'ADN "inutile" était restée un mystère, et semblait peu économique. Il s'avère cependant qu'il existe de bonnes raisons de conserver cet ADN."[5]

Un grand nombre d'autres scientifiques dans le domaine des études ADN ont alors déclaré publiquement s'opposer à tous les aspects de l'étude ENCODE. Pour commencer, ils n'aimaient pas la nature systématique de la recherche. Les études systématiques signifient que les chercheurs abordent la recherche sans attentes quant à ce qu'ils vont trouver. En conséquence, toutes les observations sont également les bienvenues puisqu'elles n'ont pas d'idées préconçues. De nombreux scientifiques préfèrent cependant voir des projets fondés sur des hypothèses. Dans ce cas, le chercheur pose une question précise. Les détails non inclus dans la portée de la question, ne seront pas nécessairement respectés. Certains scientifiques éminents ont déclaré que le consortium ENCODE avait commis une erreur en ne posant pas de question basée sur l'évolution.

Parmi les commentaires négatifs sur ENCODE, il y avait Sean Eddy (actuellement à Harvard) qui a dit dans son blog Cryptogenomicon "ENCODE Says What ?"

Personnellement, je ne pense pas que nous puissions comprendre les génomes à moins d'essayer de reconnaître tous les processus évolutionnaires différents, bruyants, et neutres qui y sont à l'oeuvre.[6]

Mais la personne la plus connue pour ses attaques contre ENCODE était Dan Graur. Concernant l'allégation de fonctionnalité à 80% du consortium pour le génome humain, Dan Graur et ses collègues ont déclaré :

Les progrès dans la compréhension de la signification fonctionnelle des séquences d'ADN ne peuvent être atteints qu'en n'ignorant pas les principes évolutionnaires. [7]

Comme alternative, Graur et ses amis ont plaidé pour une proportion fonctionnelle de 10% dans le génome.[8] Leur article s'intitulait de manière provocante : "Sur l'immortalité des téléviseurs : "Des fonctions" dans le génome humain selon l'évangile sans évolution d'ENCODE." [9]

ARN polymérase (vert) transcrivant l'ADN (Illustra Media). Pourquoi une cellule travaillerait-elle si dur pour transcrire, éditer, copier et emballer des fichiers indésirables ?

Contre-arguments et autres indices
Certains membres du consortium ENCODE assiégé ont répondu aux attaques dans un article paru dans les Proceedings of the National Academy of Sciences. Ils ont passé en revue "les forces et les limites des approches biochimiques, évolutives et génétiques pour définir des segments d'ADN fonctionnels, les sources potentielles des différences observées dans la couverture génomique estimée et les implications biologiques de ces écarts."[10] Mais ils ne se distanciaient pas de leurs conclusions antérieures. Ils ont ainsi évoqué "une activité omniprésente sur une fraction étonnamment importante du génome, y compris les régions non codantes et non conservées et les éléments répétés. Ces résultats augmentent considérablement les estimations de la limite supérieure des séquences fonctionnelles."[11]

Dans sa réponse, cependant, le consortium ENCODE II a évoqué une autre bombe liée à son rapport : le fait que depuis 2005, d'importants marqueurs génétiques liés à des maladies spécifiques, étaient de plus en plus identifiés dans la partie non codante du génome (c'est-à-dire le partie non liée à des gènes, supposément représentant de l'ADN poubelle). Le consortium a utilisé en partie des études d'association à l'échelle du génome (GWAS) pour effectuer ces identifications. Pendant ce temps, des progrès dans la capacité d'obtenir des séquences de génomes entiers de plus en plus de personnes se sont développés. Les spécialistes ont commencé à rechercher des marqueurs uniques chez les personnes atteintes d'une maladie (ou d'un état) spécifique par rapport à d'autres personnes dépourvues de ce trait. Et surprise, surprise :

Plus récemment, des études d'association à l'échelle du génome ont indiqué que la majorité des locus associés aux caractères, y compris ceux qui contribuent aux maladies et à la sensibilité humaines, se trouvent également en dehors des régions codant pour les protéines. Ces résultats suggèrent que les régions non codantes du génome humain abritent un riche éventail d'éléments fonctionnellement significatifs avec diverses fonctions de régulation et autres.[12]

Les scientifiques avaient découvert qu'une activité importante était en cours dans les régions non codantes du génome. Si des marqueurs de la maladie ne sont pas liés à des gènes, cela doit signifier que quelque chose d'important se passe dans ces régions non codantes. Si la zone n'était pas importante, un changement dans l'ordre ADN des nucléotides n'aurait pas d'importance dans un sens ou dans l'autre. Mais cela importait manifestement.

Sources de maladies génétiques dans l'ADN non codant muté
Lorsque les scientifiques ont commencé à étudier le génome humain en détail, on s'attendait à ce que la cause de nombreuses maladies génétiquement déterminées soit résolue en étudiant la protéine pertinente et son codage dans un gène. Cela est certainement vrai pour certaines maladies. Par exemple, l'anémie falciforme est causée par une mutation dans le 17e nucléotide dans une chaîne de 441 nucléotides codant pour la chaîne bêta-globine de l'hémoglobine. Cette erreur modifie la forme de la molécule entière et les résultats peuvent être catastrophiques pour les personnes qui possèdent la mutation. De même, l’espoir était que les causes de la plupart ou de toutes les maladies ou anomalies du développement d’origine génétique seraient résolues par ces études. Cependant, les résultats se sont révélés décourageants jusqu'à ce que les scientifiques commencent à examiner le GWAS pour de grandes populations. Ces études leur ont permis de dépasser l'examen de gènes spécifiques afin de rechercher où les mutations pertinentes se produisaient réellement dans la molécule d'ADN.

ENCODE III apporte plus de lumière
Ces deux bombes d'une forte proportion de fonctionnalité dans tout le génome et la localisation de la plupart des marqueurs associés à la maladie dans les parties non codantes du génome, sont des thèmes majeurs vigoureusement promus dans ENCODE III, huit ans après ENCODE II.[13] Sur la question des marqueurs de maladies, un article d'ENCODE III déclare que "les études de GWAS et de génomique du cancer continuent de déposer des variations de séquence liées à la maladie dans des bases de données publiques, et la plupart de ces variantes tombent dans des régions non codantes.[14] Réfléchissant à ce fait, une équipe du consortium souligne que nous percevons désormais "une caractéristique fondamentale de l'architecture génétique de la maladie qui a jusqu'ici, à notre connaissance, échappé à l'attention".[15] Ce que nous observons maintenant, disent-ils, "a d'importantes implications théoriques et pratiques pour comprendre à la fois l'architecture génétique de la maladie et le problème de la connexion des signaux génétiques avec leurs gènes cibles, ce qui est essentiel pour la traduction thérapeutique".[16]

Ces informations démontrent qu'il reste encore beaucoup à apprendre sur les causes génétiques de nombreuses maladies. Apparemment, la majorité des mutations liées à la maladie se situent loin des gènes codant pour les protéines. En conséquence, un aperçu en ligne de l'Encyclopédie ENCODE version 3 déclare : "plus de 80% des variants signalés par le GWAS se trouvent dans des régions non codantes du génome et le mécanisme de leur contribution à l'apparition de la maladie est inconnu."

Implications pour la fonction
Bien que ces études liées à la maladie nous pointent vers les sections régulatrices (non codantes) du génome, la question vraiment critique est de savoir dans quelle mesure le génome est fonctionnel. Pour commencer, il serait utile que tout le monde s'entende sur ce que signifie le mot "fonctionnel". Les gens d'ENCODE II ont supposé que toute séquence d'ADN copiée dans une autre molécule devait être fonctionnelle. Dan Graur s'est opposé à cette hypothèse, déclarant que "la transcription n'équivaut pas à une fonction".[17] Son argument était que la simple existence d'une activité moléculaire n'implique pas nécessairement que l'activité profite à la cellule ou contribue à son succès évolutif. Le produit moléculaire peut avoir été produit accidentellement. L'équipe ENCODE III n'a pas reculé par rapport aux positions précédentes du consortium. Ils ont continué à défendre l'idée que toute séquence nucléotidique menant à un produit moléculaire ou à toute activité chimique est fonctionnelle.[18]

Alors que l'équipe ENCODE II a commis l'erreur tactique de citer une valeur élevée pour la fonctionnalité du génome, la nouvelle équipe n'a pas commis une telle erreur. À bien des égards, cependant, ils ont indiqué qu'ils étendaient en fait les conclusions d'ENCODE II. Ils ont déclaré : "Il est important de noter que bien que de très nombreux éléments non codants aient été définis, l'annotation fonctionnelle des éléments identifiés par ENCODE n'en est qu'à ses débuts."[19] Il y aura d'autres révélations de ce genre à venir. En outre, ils insistent : "nous ne prétendons pas que le schéma de classification actuel des cCRE [régions de régulation] reflète le spectre biologique complet des activités de régulation codées dans le génome."[20]



Le noyau d'une cellule humaine contient au moins 6 pieds d'ADN.
Cliquez pour voir Illustra Media, "18 billions de pieds à vous".

Perspectives d'avenir
Il y aura sans aucun doute d'autres découvertes à venir. ENCODE III a ajouté à la preuve de la fonction dans l'ADN non codant avec des séquences de régulation nouvellement découvertes telles qu'une "classe d'éléments de séquence fonctionnelle non reconnus auparavant par ENCODE".[21] Le résultat de cette seule découverte est : "Ces données élargissent le catalogue d'éléments fonctionnels codés dans le génome humain par l'ajout d'un grand ensemble d'éléments qui fonctionnent au niveau de l'ARN en interagissant avec les protéines de liaison à l'ARN."[22] De même, ils déclarent : "les données d'ENCODE III ont augmenté le nombre d'éléments cis-régulateurs de près de 22% par rapport à ENCODE II."[23] Ils ont fait des déclarations similaires tout au long du rapport, par exemple sous le titre "Encodage dense d'informations régulatrices".24

De toute évidence, l'équipe ENCODE III étendait l'identification des éléments fonctionnels beaucoup plus loin que ne l'avait fait ENCODE II. Leur déclaration récapitulative confirme la conviction que les arguments en faveur de la fonction génomique dans l'ADN non codant se renforceront :

Il est devenu évident que, par pratiquement n'importe quelle métrique, les éléments qui régissent la transcription, l'organisation de la chromatine, l'épissage et d'autres aspects clés du contrôle et de la fonction du génome sont codés de manière dense dans de nombreuses parties de la séquence du génome humain.[24]

Leçons apprises
Les équipes d'ENCODE III n'ont pas reculé face à la pression des évolutionnistes doctrinaires. Elles ont continué à faire leurs observations et à laisser les preuves parler d'elles-mêmes. En général, elles ont adopté une approche pragmatique de l'ensemble de la question dans l'espoir que "Collectivement, les données et le registre ENCODE fournissent une ressource considérable pour la communauté scientifique afin de mieux comprendre l'organisation et la fonction des génomes humains et murins."[25] Ils ne ressentaient aucune obligation de présenter des théories évolutionnistes non pertinentes sur l'ADN indésirable, d'autant plus que celles-ci ont déjà été réfutées par les résultats d'ENCODE.


 

Margaret Helder a terminé ses études avec un doctorat en botanique de l'Université Western à London, Ontario (Canada). Elle a été embauchée comme professeure adjointe en biosciences à l'Université Brock à St. Catharines, en Ontario. Arrivé en Alberta en 1977, le Dr Helder était un témoin expert pour l'État de l'Arkansas, en décembre 1981, lors du procès de "traitement équilibré" du débat création/évolution. Elle a été membre du comité de rédaction de Occasional Papers du Baraminology Study Group en 2001. Elle a également donné des conférences une ou deux fois par an (sur invitation) dans des cours réguliers à l'Université de l'Alberta (St. Joseph's College) de 1998 à 2012. Ses publications techniques comprennent des articles dans le Canadian Journal of Botany, chapitre 19 de Recent Advances in Aquatic Mycology (EB Gareth Jones. Editor. 1976), et plus récemment, elle a écrit No Christian Silence on Science (2016) qui promeut l'évaluation critique des allégations scientifiques. Elle est mariée à John Helder et ils ont six enfants adultes.


Notes

[1] - ENCODE Project Consortium. 2012. An integrated encyclopedia of DNA elements in the human genome. Nature 489 #7414: 57-74.

[2] - ENCODE Project Consortium. 2007. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project. Nature 447 #7146: pp. 799- 816. See p. 812.

[3] - Brendan Maher. 2012. The Human Encyclopaedia. Nature 489 #7414 pp. 46-48. Voir p.

[4] - ENCODE Project Consortium. 2012. An integrated encyclopedia of DNA elements in the human genome. Nature 489 p. 57.

[5] - Ines Barroso. 2012. Non-coding but functional. Nature 489 p. 54.

[6] - 8 septembre, 2012.

[7] - Dan Graur et al. Genome Biol. Evol. 5 (3): p. 587 italiques ajoutées par moi. Graur et al. 578.

[8] - Genome Biol. Evol. 5 (3): 578-590.

[9] - Manolis Kellis et al. Defining functional DNA elements in the human genome. PNAS 111 #17 pp. 6131-6138. Voir p. 6131.

[10] - Kellis et al. 6134.

[11] - Kellis et al. 6131 italiques ajoutées par moi.

[12] - ENCODE Project Consortium. 2020. Perspectives on ENCODE. 583 #7818: 693-698. And flagship article: Expanded encyclopaedias of DNA elements in the human and mouse genomes. pp. 699-710.

[13] - Fabian Grubert et al. Landscape of cohesin-mediated chromatin loops in the human genome. Nature 583 #7818: PP. 737-743. Voir p. 743.

[14] - Wouter Meuleman et al. Index and biological spectrum of human DNase I hypersensitive sites. Nature 584 #7820: pp. 244-251. Voir 250.

[15] - Meuleman et al. 251.

[16] - Graur et al. 581.

[17] - La séquence de nucléotides "qui spécifie des produits moléculaires (par exemple, des gènes codant pour des protéines ou des ARN non codants) ou des activités biochimiques avec des rôles mécanistes dans la régulation du gène ou du génome (par exemple, des promoteurs ou des amplificateurs de transcription)" est fonctionnelle. p. 699 et il y avait une définition similaire avec ENCODE II p. 57.

[18] - ENCODE Project Consortium. 2020. Perspectives on ENCODE p. 697.

[19] - ENCODE Project Consortium. 2020. Flagship article p. 706.

[20] - ENCODE Project Consortium. 2020. Flagship article p. 702.

[21] - Eric L. Van Nostrand et al. A large-scale binding and functional map of human RNA-binding proteins. Nature. 583 #7818: pp. 711-719. Voir p. 711.

[22] - ENCODE Project Consortium. 2020. Flagship article p. 706.

[23] - Meuleman et al. 247.

[24] - ENCODE Project Consortium. 2020. Flagship article p. 709.

[25] - ENCODE Project Consortium. 2020. Flagship article p. 699.



Brins d'ADN (Illustra Media).
Leçon : Ne soyez pas trop pressé de rejeter ce que vous ne comprenez pas.