le-génome-humain-a-été-entièrement-séquencé-après-20-ans
Lorsque les scientifiques ont annoncé qu’ils avaient lu l’intégralité de l’ADN d’une personne il y a 20 ans, il leur manquait encore quelques éléments. Maintenant, grâce à de bien meilleures méthodes de lecture de l’ADN, il a enfin été possible de lire l’ensemble du génome d’un bout à l’autre.

Le génome entier après 20 ans

« Ayant participé au premier projet sur le génome humain en 2001, et m’étant particulièrement concentré sur les régions difficiles, je suis très satisfait de voir que cela a été fait, même si cela a pris 20 ans », déclare Evan Eichler, de l’université de Washington à Seattle. Le nouveau génome comprend 200 millions de paires de bases ou « lettres » d’ADN supplémentaires, et ajoute plus de 2000 gènes.
Nos gènes contribuent à faire de nous ce que nous sommes. Les humains en possèdent des milliers, bien que le nombre exact soit incertain et dépende en partie de la façon dont on les compte. Ils sont stockés sur de longues molécules d’ADN au centre des cellules. L’information génétique existe sous la forme de quatre molécules appelées bases (C, G, T et A) qui sont enfilées le long de la molécule d’ADN.
Le génome humain contient un peu plus de 3 milliards de lettres. Les premières séquences complètes ont été publiées à grand renfort de publicité en 2001 : l’une par le Consortium international de séquençage du génome humain (HGSC) et l’autre par la société américaine Celera Genomics. Le projet avait débuté dix ans plus tôt, en 1990. Comme le génome devait être lu par petits morceaux puis réassemblé, certaines sections hautement répétitives se sont avérées impossibles à placer, un peu comme un puzzle dont toutes les pièces se ressemblent.
Au cours des trois années suivantes, le HGSC a comblé certaines des lacunes et, en 2004, il a annoncé qu’il avait fait tout ce qu’il pouvait. Les généticiens ont continué à améliorer le génome de référence, mais en grande partie en améliorant la précision des séquences existantes, plutôt qu’en en ajoutant de nouvelles. Environ 8 % des séquences étaient encore soit manquantes, soit susceptibles d’être erronées.

Le consortium Telomere-to-Telomere a créé ce génome

Cette nouvelle version du génome a été créée par le consortium Telomere-to-Telomere, dirigé par Karen Miga, de l’Université de Californie à Santa Cruz, et Adam Phillippy, de l’Institut national de recherche sur le génome humain dans le Maryland. En 2018, ils ont fait partie d’une équipe qui a séquencé de gros morceaux du génome, de plus de 100 000 bases, ce qui leur a permis de combler certaines parties manquantes. « Elle [Miga] m’a appelé et m’a dit ‘Je veux terminer le génome' », raconte Phillippy. J’ai répondu : « Moi aussi ».
Ils ont choisi de lire l’ADN d’une lignée cellulaire appelée CHM13. Elle provient d’une masse de tissu appelée môle hydatiforme, une sorte de grossesse ratée dans laquelle un ovule dans un utérus a en quelque sorte perdu son génome, et a ensuite été fécondé par un spermatozoïde. La cellule résultante n’avait que la moitié de l’ADN d’un embryon normal, et l’ADN du spermatozoïde a donc été dupliqué. De telles cellules forment des excroissances dangereuses, comme les cancers, et doivent être retirées. Elles peuvent ensuite être cultivées en laboratoire – apparemment indéfiniment.
« C’est un cas unique, car il ne s’agit pas du génome d’une personne ayant jamais vécu », explique M. Phillippy. L’ADN provient d’un seul spermatozoïde, il s’agit donc de la moitié du génome d’un père potentiel, qui a été dupliqué. Les cellules ont été recueillies de manière consensuelle il y a plusieurs décennies, mais l’identité du donneur a été rendue anonyme par une société qui a depuis cessé ses activités, de sorte que l’on ne sait pas de qui elles proviennent.
Les cellules humaines normales possèdent deux copies de chaque portion d’ADN, qui présentent souvent des différences importantes car l’une provient de la mère et l’autre du père. Il est donc plus difficile de séquencer l’ADN avec précision, car il est difficile de distinguer les erreurs de séquençage des véritables différences. L’utilisation de CHM13 permet de contourner ce problème, car les deux copies sont pratiquement identiques.

Des techniques de séquençage complémentaires

Pour assembler les séquences du génome, l’équipe a combiné deux technologies. L’une était un type de séquençage qui lit des tronçons extrêmement longs, de plus d’un million de lettres, et l’autre un type qui offre une précision extrêmement élevée et peut donc traiter des sections très légèrement différentes – comme les copies multiples d’un même gène.
L’ADN humain est stocké sur de grandes molécules appelées chromosomes, dont les quatre bras se rejoignent en leur centre pour former un X. Une grande partie de l’ADN difficile à lire se trouvait autour des points centraux, appelés centromères. En outre, certains chromosomes sont asymétriques, avec une paire de bras plus courts que l’autre : les bras plus courts contiennent beaucoup d’ADN difficile à lire.
Dans un premier temps, en août 2020, l’équipe a publié l’intégralité du chromosome X humain déterminant le sexe. Ils ont maintenant publié l’intégralité du génome humain. Cette nouvelle version ajoute près de 200 millions de lettres à la version précédente, avec 2 226 sections qui sont des copies quasi identiques de gènes connus. Parmi ces nouveaux gènes, l’équipe prévoit que 115 codent des protéines.

Allumer et éteindre l’ADN

Ce nouveau génome facilitera grandement l’étude des gènes dupliqués, déclare Aida Andrés, car les séquences qu’il répertorie pour eux ont beaucoup plus de chances d’être correctes que les versions antérieures. Il est crucial de comprendre les duplications segmentaires car certaines d’entre elles sont à l’origine de troubles génétiques, explique Eichler.
Dans un troisième article, une équipe dirigée par Winston Timp de l’université Johns Hopkins de Baltimore a examiné des marqueurs chimiques appelés groupes méthyles qui s’attachent à l’ADN en divers points. Ces marqueurs « épigénétiques » affectent les gènes qui sont activés ou désactivés. L’équipe de Timp a utilisé ce  nouveau génome pour cartographier la méthylation dans les zones nouvellement explorées.
Ils ont constaté que les niveaux de méthylation sont faibles autour des centromères, au cœur des chromosomes. Ces régions sont cruciales pour la reproduction et la division cellulaire. Lorsque cela se passe mal, les résultats peuvent être dangereux. « Dans le cas du cancer, il arrive souvent que l’on gagne un chromosome entier ou que l’on en perde un », explique M. Timp. À long terme, la compréhension du fonctionnement de la division cellulaire et du rôle que la méthylation pourrait ouvrir la voie à de nouveaux traitements contre le cancer.
Cette recherche a été pré-publiée en trois parties dans bioRxiv-1, bioRxiv-2, bioRxiv-3.
Source : New Scientist
Crédit photo : Pixabay

Le génome humain a été entièrement séquencé après 20 ansmartinBiologie
Lorsque les scientifiques ont annoncé qu'ils avaient lu l'intégralité de l'ADN d'une personne il y a 20 ans, il leur manquait encore quelques éléments. Maintenant, grâce à de bien meilleures méthodes de lecture de l'ADN, il a enfin été possible de lire l'ensemble du génome d'un bout à l'autre. Le...