Le pan-génome de Arabidopsis thaliana

Introduction

Comme technologie de séquençage continue d'avancer et la qualité des assemblages de génomes continue de s'améliorer, de plus en plus de génomes de haute qualité sont publiés dans la même espèce, fournissant des ressources génétiques pour des études approfondies de la variation dans les génomes des espèces. Un pangénome est une collection de toutes les séquences d'une espèce, incluant un grand nombre de séquences concordantes, de grandes variantes structurelles (SV) et de petites variantes (telles que les SNP, InDels). Les pangenomes linéaires simples ne peuvent pas caractériser visuellement la variation structurelle, tandis que l'assemblage de pangenome basé sur des graphes peut intégrer efficacement la variation génétique à travers tous les génomes nouvellement assemblés.

Notre service de pan-génome

La construction de notre carte du pan-génome non seulement cela fournit une information génétique plus complète de l'espèce, mais cela nous permet également d'obtenir la variation de chaque individu ou population en comparant les individus séquencés avec le génome de référence : des simples polymorphismes de nucléotides uniques (SNP), des mutations d'insertion-suppression (InDel), jusqu'à de grands segments de variation structurelle (SV), de variation du nombre de copies (CNV) et de variations de présence/absence (PAV). De plus, le mécanisme de génération de phénotypes partagés et uniques des espèces peut également être exploré en profondeur grâce à une analyse comparative des fonctions et des propriétés des gènes dans les génomes de base/variables.

Nous fournissons également services de séquençage à lecture longue pour promouvoir des projets d'assemblage de pan-génomes. PacBio HiFi les lectures se caractérisent par une longue longueur de lecture et une haute précision, qui peuvent être utilisées pour l'assemblage du génome sans avoir besoin de correction automatique des données de séquençage à longue lecture et de correction des données NGS, ce qui permet ainsi d'économiser efficacement le temps d'analyse et les ressources informatiques, et peuvent être utilisées pour recherche sur le pan-génome après l'assemblage de lectures HiFi à faible profondeur (10-15X). Comparé à le données de séquençage de nouvelle génération à haute profondeurLes lectures HiFi peuvent être assemblées avec un meilleur effet, et les informations sur le pan-génome obtenues sont plus précises, ce qui peut être utilisé pour la détection de toutes les variantes (SNP, InDel, SV, CNV, PAV), et évite les inconvénients des données NGS, tels que la courte longueur des lectures.

Assemblage de génome de haute qualité de A. thaliana

Cette étude a complété un assemblage de génome de haute qualité de 32 représentants A. thaliana écotypes utilisant la stratégie de séquençage PacBio HiFi, dont 6 écotypes sont des écotypes solanacées avec des différences distinctes, et les 26 autres écotypes sont des écotypes non solanacées qui ont subi une expansion monophylétique après l'âge de glace. Analyse pan-génomique basé sur le regroupement des familles de gènes, des gènes variables ont été identifiés chez Arabidopsis qui ont élargi le réservoir génétique de différents écotypes et ont ainsi contribué à l'adaptation à l'environnement local. Pour identifier variants structurels (SVs) Dans les 32 écotypes, les chercheurs ont également construit un pangenome graphique et identifié 61 332 variantes structurelles à large bande (>50 pb) basées sur le pangenome graphique, couvrant 18 883 gènes, dont certains sont fortement corrélés avec les adaptations écologiques chez Arabidopsis. Par exemple, une insertion spécifique de 332 pb dans la région promotrice du gène HPCA1 dans l'écotype tibétain (Tibet-0) a entraîné une expression régulée à la hausse du gène, ce qui facilite l'adaptation d'Arabidopsis aux environnements alpins. Cette étude révèle la contribution génétique de la variation structurelle à l'adaptation locale dans différents écotypes d'Arabidopsis.

Pan-genome of 32 A. thaliana ecotypes.Pan-génome de 32 écotypes d'A. thaliana. (Kang et al., 2023)

Référence:

  1. Kang, Minghui, et al. "Le pan-génome et l'adaptation locale d'Arabidopsis thaliana." Communications Nature 14.1 (2023) : 6259.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut