Le génome T2T complet par séquençage ouvre la voie à l'ère post-génomique.

En 2021, à l'occasion du 20e anniversaire de la publication du croquis du séquençage du génome humain, le consortium Telomere-to-Telomere (T2T) a annoncé le dernier séquençage complet du génome humain, CHM13v1.1, qui contient non seulement toutes les séquences non résolues mais corrige également les erreurs d'assemblage originales, en faisant le séquençage de génome humain le plus complet à ce jour. Les résultats incluent l'assemblage sans couture de tous les 22 autosomes humains et des chromosomes X, à l'exception du chromosome Y, complétant une tâche difficile que 8 % du Projet Génome Humain n'a pas encore résolue.

Contexte

Les télomères sont la partie terminale des chromosomes linéaires eucaryotes, une région structurelle spéciale qui joue un rôle important dans la structure et la stabilité des chromosomes linéaires. L'ADN des télomères est composé de séquences d'ADN simples et hautement répétitives qui sont difficiles à assembler.

La version la plus récente de l'atlas du génome humain a été publiée en 2013, avant la publication du génome humain complet, et a été appelée GRCh38. Depuis lors, elle a été régulièrement mise à jour. À ce jour, elle présente encore des lacunes, manquant de plus de 8 % du génome, y compris tous les amas de satellites des régions mitotiques, les télomères, les grandes répétitions du génome et les régions d'ARNr qui sont depuis longtemps dans un état de séquence inconnu ou inconnaissable. Ces génomes manquants sont dissimulés dans de longues séquences avec un grand nombre de copies de gènes répétitifs, qui ne peuvent pas être perfectionnées par des techniques de lecture courte et d'assemblage.

Avec les technologies de séquençage à lecture longue HiFi de Pacific Biosciences (PacBio) et d'Oxford Nanopore Technologies (ONT), surmontant le faible débit du séquençage Sanger et la courte longueur de lecture des technologies de séquençage à courte lecture, combinées à l'optimisation continue des algorithmes d'assemblage, de plus en plus de génomes parfaits d'organismes modèles sont publiés.

Carte génomique T2T complète

En utilisant des données de séquençage ONT ultra-long et PacBio HiFi avec une haute précision et de longues séquences, des chercheurs du consortium T2T ont assemblé et publié la première carte de complétion du chromosome X humain, la carte de complétion des autosomes et la carte de complétion du génome humain, et les résultats connexes ont été publiés dans Science et d'autres revues.

L'objectif du génome T2T est d'obtenir un génome de haute qualité avec une grande précision, continuité et complétude, de télomère à télomère. Les chercheurs ont complété l'assemblage du génome au niveau des chromosomes en combinant la technologie Hi-C pour obtenir des informations sur les positions relatives des gènes sur les chromosomes, et un ajustement manuel pour les régions complexes afin d'obtenir la séquence du génome de référence T2T.

The Complete T2T Genome Opens the Door to Post-Genomic EraL'assemblage complet du génome humain T2T-CHM13 (Nurk S et al., 2022)

Dans cette carte du génome humain complétée, les chercheurs ont ajouté ou corrigé 238 Mb de nouvelles séquences, dont 182 Mb étaient complètement nouvelles, et ont annoté 2 226 nouveaux gènes. En conséquence, les résultats éliminent des dizaines de milliers de variants faussement positifs dans chaque échantillon, y compris une réduction des faux positifs pour 269 tests génétiques médicalement pertinents de plus de 90 %.

En plus du génome humain de télomère à télomère, la séquence complète du génome T2T de Arabidopsis a été assemblé. En utilisant les données PacBio HiFi et ONT ultra-long, une carte presque complète d'Arabidopsis contenant cinq ancrages a été assemblée : les chromosomes 1, 3 et 5 contiennent la séquence complète de télomère à télomère, tandis que 2 et 4 restent non assemblés dans la région rDNA 45s du bras court et la région télomérique adjacente. Grâce à l'identification et à l'analyse des séquences, les chercheurs révèlent un modèle pour le processus d'homogénéisation basé sur la recombinaison dans Arabidopsis, faisant progresser l'étude de la structure et de la fonction des ancrages, ainsi que des mécanismes évolutifs.

Signification

L'assemblage du génome T2T est très difficile, et il reste difficile de lire à travers des régions avec de longues séquences répétitives ainsi que des régions mitotiques chez certaines espèces avec les technologies de séquençage et d'analyse de données actuelles. L'assemblage du génome humain actuel contourne une partie de cette complexité en utilisant une lignée cellulaire haploïde avec des extensions de staphylocoques humains afin d'éviter de séquencer 2 chromosomes X différents. Depuis lors, la construction d'un génome de référence plus parfait contenant des informations T2T, des informations sur les haplotypes et des informations sur les chromosomes sexuels deviendra une tendance de recherche en génomique. De plus, des séquences de génome de référence T2T de haute qualité peuvent aider à révéler des informations génétiques plus importantes sur les maladies, le vieillissement, l'évolution et d'autres processus vitaux importants.

Services recommandés

CD Genomics propose Séquençage du génome humain entier par PacBio SMRT et Séquençage du génome entier basé sur Illumina, Séquençage par nanopore et Séquençage SMRT de PacBio plateformes. Nous proposons des services complets de séquençage du génome, y compris le séquençage, l'assemblage et l'analyse des données pour une variété d'espèces.

Références :

  1. Nurk S, Koren S, Rhie A, et al. La séquence complète d'un génome humain. Science, 2022, 376(6588) : 44-53.
  2. Logsdon, G. A. et al. La structure, la fonction et l'évolution d'un chromosome humain 8 complet. Nature 593, 101–107 (2021).
  3. Naish, M. et al. Le paysage génétique et épigénétique de la Arabidopsis centromères. Science 374, eabi7489 (2021).
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Parlez à nos scientifiques
De quoi aimeriez-vous discuter ?
Avec qui allons-nous parler ?

* est un élément requis.

Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut