Analyse des génomes mitochondriaux humains à travers des données de séquençage à haut débit

Génome mitochondrial humain

Les mitochondries, organites essentiels présents dans toutes les cellules eucaryotes, sont au cœur de la production d'énergie par la respiration aérobie et jouent des rôles clés dans les processus cellulaires. Elles possèdent leur propre matériel génétique unique, le génome mitochondrial (ADNmt).

ADNmt humain est une molécule circulaire, s'étendant sur 16 569 paires de bases, composée de brins lourds et légers. C'est principalement une région codante, englobant 37 gènes, dont 22 ARNt, 2 ARNr et 13 protéines essentielles pour les composants de la chaîne de transport des électrons mitochondriaux. Contrairement à l'ADN nucléaire, l'ADNmt suit un schéma d'héritage strictement matrilinéaire.

Au sein des cellules, les mitochondries sont nombreuses, chacune contenant plusieurs copies d'ADNmt. Cette nature multicopie entraîne une diversité génétique, avec des pourcentages de mutations variant de 0 % à 100 %. Les changements dans la charge mutationnelle lors de la division cellulaire peuvent affecter la production d'énergie, provoquant un "effet seuil" et une dysfonction cellulaire.

Germline selection shapes human mitochondrial DNA diversity.La sélection germinale façonne la diversité de l'ADN mitochondrial humain. (Wei et al., 2019)

Séquençage à haut débit des génomes mitochondriaux

Dans les études cliniques et scientifiques, il y a une préférence croissante pour l'utilisation de techniques avancées telles que le séquençage de nouvelle génération (NGS), englobant le séquençage de panels ciblés, le séquençage de l'ensemble du génome mitochondrial, le séquençage de l'exome entier (WES), et Séquençage du génome entier (SGE), pour l'analyse complète des génomes mitochondriaux. En adoptant ces méthodologies, non seulement l'efficacité analytique est considérablement accrue, mais la sensibilité de la détection des variants pathogènes est également nettement améliorée, principalement en raison de l'augmentation des tailles d'échantillons.

Germline selection shapes human mitochondrial DNA diversity.Détection précise des mutations de l'ADN mitochondrial tumoral par séquençage de nouvelle génération. (Guo et al., 2020)

  • Séquençage de panel ciblé

Dans les premières étapes du séquençage de nouvelle génération (NGS) pour les maladies mitochondriales, seules des segments spécifiques du génome mitochondrial sont séquencés. Ces segments englobent des peptides codant pour la chaîne respiratoire et des gènes bien connus associés à la maladie. Alternativement, nous pouvons sélectionner tous les gènes liés aux mitochondries, y compris l'ADN mitochondrial (ADNmt) et l'ADN nucléaire (ADNn), tels que listés dans MitoCarta. Ce panel complet est couramment appelé le "MitoExome."

  • Séquençage du génome mitochondrial complet

L'utilisation du NGS pour le séquençage complet du génome mitochondrial nous permet de détecter les variantes de l'ADN mitochondrial (ADNmt) et fournit une évaluation précise de l'hétérogénéité des variantes. Avant de commencer le séquençage de l'exome complet (WES) ou Séquençage du génome entier (SGE)De nombreux centres de diagnostic mitochondrial effectuent souvent un séquençage de l'ADNmt. Cela sert à la fois à identifier des variants potentiellement pathogènes de l'ADNmt et à exclure leur présence. Il convient de noter que de nombreux variants pathogènes de l'ADNmt se trouvent exclusivement dans des tissus cliniquement affectés, tels que le muscle squelettique.

  • Séquençage de l'exome complet

Essentiellement, Séquençage de l'exome complet (WES) implique le séquençage ciblé des régions exoniques au sein du génome. Cependant, une part substantielle des données de WES est générée à partir de régions non ciblées, y compris le génome mitochondrial. Étant donné que le génome mitochondrial se compose de milliers de copies, contrairement au génome nucléaire diploïde, il y a significativement plus de séquences d'ADN mitochondrial hors cible que de séquences d'ADN nucléaire hors cible (par un facteur de 30 à 120 fois). Notamment, la proportion de séquences d'ADN mitochondrial capturées est corrélée à l'abondance d'ADN mitochondrial dans l'échantillon total d'ADN original. Par exemple, les cellules individuelles dans le cœur et le muscle squelettique contiennent un contenu en ADN mitochondrial plus élevé que celui du sang périphérique. La nature à nombre de copies élevé de l'ADN mitochondrial entraîne un mélange d'ADN mitochondrial de type sauvage et mutant dans des proportions, connu sous le nom d'hétérogénéité, qui peut théoriquement varier continuellement de 0 % à 100 %. De plus, les mutations pathogènes de l'ADN mitochondrial sont généralement très hétérozygotes ou homozygotes chez les porteurs, mais elles présentent une faible hétérozygotie dans les cas de mutations pathogènes de l'ADN mitochondrial asymptomatiques. En revanche, le nombre de copies d'ADN mitochondrial est connu pour être très variable et est associé à diverses maladies, y compris le cancer. Ainsi, le nombre de copies d'ADN mitochondrial est une métrique cruciale pour l'analyse du génome mitochondrial. Comme la couverture des données de séquençage est directement proportionnelle au nombre de chromosomes, il est possible d'estimer le nombre de copies d'ADN mitochondrial à partir des données de WES.

  • Séquençage du génome entier

WGS offre la capacité de détecter toutes les variantes génétiques à travers l'ensemble du génome humain, améliorant considérablement le potentiel diagnostique des maladies mitochondriales. Certaines études ont montré un degré élevé de concordance entre les méthodes traditionnelles basées sur la PCR et WGS données pour analyser les variantes de l'ADNmt. De plus, en ce qui concerne l'évaluation du nombre de copies, les estimations du nombre de copies de l'ADNmt dérivées des données de séquençage génomique complet (WGS) ont tendance à être plus fiables.

Analyse bioinformatique des génomes mitochondriaux

  • Détection des variantes mitochondriales

Actuellement, la cohérence des logiciels et des processus utilisés pour identifier les variants mitochondriaux dans divers articles de recherche fait défaut. Plusieurs outils logiciels ont été développés pour l'analyse et la détection des variants mitochondriaux à partir de données de séquençage à haut débit, tels que mtDNA-Server, MitoSeek, MToolBox, entre autres. Pour des conseils complets sur l'analyse des génomes mitochondriaux, il est utile de se référer aux procédures recommandées fournies par GATK, comme détaillé ici.

De plus, lors de l'analyse des gènes mitochondriaux en utilisant Séquençage de l'exome complet (WES) ou Séquençage du génome entier (SGE) Les données, le processus de contrôle de qualité des variants ressemble étroitement à celui du génome nucléaire. Il est essentiel de prêter attention à la référence de la version du génome lors du calcul de la profondeur de séquençage. Notez que dans le génome de référence humain hg19, le génome mitochondrial est représenté comme CRS (NC_001807), mais le génome mitochondrial de référence humain actuellement dominant est rCRS (NC_012920).

  • Attribution des Haplogroupes Mitochondriaux

Actuellement, le logiciel le plus couramment utilisé pour attribuer des haplogroupes mitochondriaux aux échantillons est HaploGrep2. HaploGrep2 attribue les haplogroupes mitochondriaux à chaque échantillon en se basant sur PhyloTree17, avec rCRS servant de génome de référence. Ce logiciel permet également l'entrée directe d'un fichier d'appel de variantes (fichier vcf) pour déterminer l'haplogroupe mitochondrial le plus approprié pour chaque échantillon, en fonction des variantes mitochondriales détectées dans chaque échantillon. Une autre option viable pour l'attribution des haplogroupes est MitoTool.

  • Estimation du nombre de copies mitochondriales

Lors du séquençage de nouvelle génération (NGS), les chromosomes autosomiques et mitochondriaux ont une probabilité égale d'être détectés. Par conséquent, la couverture moyenne des chromosomes autosomiques et mitochondriaux est théoriquement proportionnelle à leur nombre de copies.

Bases de données des variantes mitochondriales

Contrairement à l'ADN nucléaire (nDNA), la disponibilité des bases de données de population pour les variants de l'ADN mitochondrial (mtDNA) est considérablement limitée. Heureusement, la pratique de réanalyser les séquences de mtDNA à partir de séquençages de tout l'exome (WES) et Séquençage du génome entier (SGE) Les ensembles de données sont largement adoptés et utilisés. Plusieurs bases de données mitochondriales à l'échelle de la population ont émergé, notamment Mitomap, HmtDB, 1000 Genomes, gnomAD et MitImpact.

Mitomap se positionne comme le choix prééminent pour l'analyse de l'ADN mitochondrial. Au-delà de servir de répertoire des variantes d'ADN mitochondrial à travers les populations, il est devenu une ressource essentielle pour la communauté de recherche mitochondriale. Avec des décennies de reconnaissance, Mitomap met à jour son ensemble de données en extrayant des séquences d'ADN mitochondrial de GenBank deux fois par an et en les soumettant à une analyse bioinformatique rigoureuse. Au 1er juillet 2022, Mitomap comprend 56 910 séquences complètes d'ADN mitochondrial et 78 504 séquences de la région de contrôle de l'ADN mitochondrial, y compris 19 449 polymorphismes à un seul nucléotide (SNP) de l'ADN mitochondrial.

Le gnomAD (Genome Aggregation Database), la plus grande base de données de variations humaines en open source, a rendu les variants de l'ADN mitochondrial accessibles au public pour la première fois en novembre 2020 avec gnomAD v3.1, comprenant un total de 56 434 séquences d'ADN mitochondrial à partir de données de séquençage génomique complet, abritant 10 850 variants d'ADN mitochondrial.

Inversement, la base de données HelixMTdb est fondée sur des données WES provenant de 196 554 individus non apparentés, détectant un total de 15 035 variantes mitochondriales. Notamment, une grande partie de ces échantillons provient de populations européennes.

HmtDB est une autre base de données remarquable, englobant des échantillons avec des phénotypes sains et liés à des maladies. Elle est soigneusement conçue pour soutenir la génétique des populations et aider les cliniciens à évaluer la pathogénicité de variantes spécifiques de l'ADNmt. Il convient de souligner que HmtDB et Mitomap obtiennent leurs séquences d'ADNmt de GenBank, ce qui entraîne un chevauchement significatif des sources d'échantillons entre ces deux bases de données.

De plus, certaines des bases de données sur les maladies les plus utilisées pour les variants de l'ADN nucléaire, y compris ClinVar, Clinvar Miner et OMIM, sans oublier Mitomap et HmtDB, fournissent également des informations concernant les implications cliniques des variants de l'ADNmt. Au 1er juillet 2022, Mitomap a compilé des données sur 455 mutations d'ARNr/ARNt et 545 variants codants/non codants associés à des maladies, dont seulement 97 variants ont été définitivement classés comme pathogènes.

Outils pour prédire l'impact des variants mitochondriaux

De nombreux outils conçus pour évaluer la nocivité des variants au sein des régions codantes de l'ADN nucléaire (nDNA) peuvent également être appliqués aux variants au sein des régions codantes de l'ADN mitochondrial (mtDNA). Parmi ces outils, on trouve CADD, PolyPhen-2, SIFT, Mutpred et PROVEAN, dont plusieurs sont largement utilisés pour prioriser les variants de l'ADN nucléaire. Cependant, il est important de noter que certains de ces outils, initialement conçus pour les régions codantes de l'ADN nucléaire, peuvent présenter une précision réduite lorsqu'ils sont appliqués aux régions codantes de l'ADN mitochondrial.

Outil Applicabilité Caractéristiques clés
Outils courants pour évaluer les variants de l'ADNmt et de l'ADNn À la fois les variantes de la région codante de l'ADNmt et de l'ADNn. - CADD, PolyPhen-2, SIFT, Mutpred et PROVEAN.
- Conçu à l'origine pour l'ADN nucléaire, peut avoir une précision réduite pour l'ADN mitochondrial.
Outils mtDNA spécialisés avec de meilleures performances Conçu spécifiquement pour l'ADNmt - MToolBox
- APOGÉE
- Mitoclass
Outils pour les variantes de tRNA mitochondrial Variantes d'ARNt mitochondrial - MitoTIP
- PON-mt-ARN
MToolBox Analyse des variantes mitochondriales - Analyse les séquences mitochondriales humaines à partir du NGS.
- Fournit une annotation de l'hétérogénéité des variants mitochondriaux.
- Aide à l'identification des variants pathogènes.

Références

  1. Wei, Wei, et al. "La sélection germinale façonne la diversité de l'ADN mitochondrial humain." Science 364.6442 (2019) : eaau6520.
  2. Guo, Shanshan, et al. "Une stratégie d'analyse de données innovante pour la détection précise des mutations de l'ADN mitochondrial tumoral par séquençage de nouvelle génération." Thérapie Moléculaire-Acides Nucléiques 23 (2021) : 232-243.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut