Pan génome

L'introduction du séquençage du pan-génome

Le concept de pan-génome englobe l'ensemble des gènes présents dans toutes les souches d'une espèce donnée, offrant ainsi une perspective complète sur la diversité génétique qui transcende les limites des séquences de génomes individuels. Il comprend deux composants principaux :

  • Génome de base : Ce segment comprend des gènes présents de manière ubiquitaire dans toutes les souches de l'espèce. Ces gènes fondamentaux sont généralement associés à des fonctions biologiques essentielles et à des traits phénotypiques primaires, reflétant ainsi la stabilité évolutive de l'espèce. Par exemple, dans Escherichia coliLes gènes essentiels comprennent ceux impliqués dans des processus cellulaires fondamentaux tels que la réplication de l'ADN et la transcription.
  • Génome variable (accessoire/dispensable) : En revanche, ce segment englobe des gènes qui ne se trouvent que dans un sous-ensemble de souches ou d'individus au sein de l'espèce. Ces gènes accessoires codent souvent pour des adaptations spécifiques ou des traits uniques, y compris des facteurs tels que la résistance aux antibiotiques ou la virulence. Par exemple, dans Streptococcus pneumoniae, les gènes accessoires contribuent aux variations de pathogénicité et de profils de résistance parmi différentes souches.

Grâce à l'étude approfondie du pan-génome, les chercheurs peuvent acquérir des connaissances sur l'ensemble du spectre de la variabilité génétique au sein d'une espèce, facilitant une compréhension plus profonde de ses dynamiques évolutives, de ses adaptations fonctionnelles et de sa réponse potentielle aux pressions environnementales.

Figure 1. Overview of the Solanum section Petota pangenome composition.Figure 1. Composition d'un pan génome

La poursuite du séquençage du pan-génome implique de tirer parti de séquençage à haut débit technologies aux côtés d'outils de bioinformatique sophistiqués. Cette approche implique la construction méticuleuse de bibliothèques de séquençage suivie d'un séquençage complet d'individus, de sous-espèces ou de lignées au sein d'une espèce. L'assemblage ultérieur de ces séquences conduit au développement d'une carte du pan-génome. Cette carte sert à enrichir le répertoire génétique de l'espèce et permet l'exploration de questions biologiques cruciales, contribuant de manière significative à notre compréhension de la diversité génétique et des processus évolutifs.

Pourquoi la recherche sur le pan-génome est-elle essentielle ?

Au cours de l'évolution extensive, influencée par des facteurs géographiques et environnementaux, les organismes individuels développent des traits génétiques hautement uniques. Un seul génome de référence est insuffisant pour englober l'ensemble des informations génétiques d'une espèce entière. En d'autres termes, s'appuyer uniquement sur un seul génome de référence pour des études sur la domestication génétique et la variation peut entraîner la perte de contenu génomique significatif, car de nombreuses séquences uniques ne sont pas représentées dans le génome de référence.

De plus, la diminution du coût du séquençage du génome a rendu la recherche sur les pan-génomes de plus en plus viable ces dernières années. Cette réduction des coûts facilite l'exploration de la diversité génétique à une profondeur et à une échelle qui étaient auparavant inaccessibles. Par conséquent, l'étude des pan-génomes est devenue un domaine en pleine expansion, offrant des perspectives profondes sur la complexité de l'information génomique et le potentiel d'adaptation des espèces.

Différence entre le pan-génome et le génome complet

Le concept de génome complet concerne l'ensemble du matériel génétique trouvé au sein d'un individu ou d'une souche unique, généralement utilisé comme référence dans la recherche génomique. En revanche, le pan-génome amalgamé les informations génétiques de plusieurs individus ou souches, offrant un paysage génétique plus holistique et complet de l'espèce.

Différences clés

  • PortéeLe génome entier délimite l'architecture génétique d'une seule souche. En revanche, le pan-génome encapsule toutes les variantes génétiques présentes dans plusieurs souches, capturant ainsi un spectre plus large et plus inclusif de la diversité génétique.
  • RésolutionL'analyse du pan-génome élucide les variations génétiques qui peuvent rester non détectées lorsqu'on se fie uniquement à un seul génome de référence. Cela comprend des gènes accessoires uniques qui entraînent des caractéristiques et des adaptations spécifiques à certaines souches.

Par exemple, l'examen du pan-génome de Mycobacterium tuberculosis révèle une variabilité génétique considérable parmi différentes souches, un facteur d'une importance capitale pour comprendre les mécanismes de résistance aux médicaments et pour le développement d'interventions thérapeutiques efficaces.

Avantages du Pan Génome

  • Enrichir les informations génomiques de l'espèce en séquençant les sous-espèces et les individus.
  • Trouvez rapidement des gènes ou des variations structurelles de gènes liés à des traits importants en fonction de l'étude du génome variable.
  • Étudiez les différences au sein des espèces du point de vue des séquences génétiques uniques.
  • Petite population, efficace en termes de coût et de temps

Applications du Pan Génome

  • Évolution des espèces et phylogénétiqueAide à retracer les relations évolutives et la diversité génétique entre les espèces.
  • Découverte et élevage de traitsIdentifie les gènes associés à des traits souhaitables pour améliorer la sélection des cultures.
  • Recherche sur les agents pathogènes: Révèle des variations génétiques chez les agents pathogènes liées à la virulence et à la résistance, informant les mesures de contrôle.
  • Études écologiques et environnementales: Fournit des informations sur les adaptations des espèces à différents environnements et niches écologiques.

Flux de travail du pan-génome

The Workflow of GWAS.

Spécifications de service

Exigences d'échantillon
  • Type d'échantillon : ADN génomique ;
  • Bibliothèque de petits fragments : ≥1 μg ;
  • Bibliothèque de fragments de grande taille de 2 Kb à 6 Kb : ≥20 μg ;
  • Bibliothèque de fragments de 10 Kb : ≥30 μg ;
  • Bibliothèques de fragments de 20 Kb et 40 Kb : ≥60 μg ;
  • Pour le séquençage de génome entier, la quantité requise d'ADN d'échantillon est d'environ 500 μg à 1 mg ;
  • Concentration d'échantillon : Bibliothèque de petits fragments ≥30 ng/μl ; Bibliothèque de grands fragments : ≥133 ng/μl ;
  • Pureté de l'échantillon : le rapport OD260/280 doit être compris entre 1,8 et 2,0.
  • Tout l'ADN doit être traité avec de l'ARNase et ne doit montrer aucune dégradation ni contamination.
Remarque : Les montants d'échantillons sont indiqués à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Cliquez
Stratégie de séquençage
  • Génome simple (taille du génome <2 Gb, hétérozygotie <0,5 %, ratio de séquences répétées <50 %) ;
  • Génome complexe (taille du génome >2Gb, hétérozygotie >0,5 %, ratio de séquences répétées >50 %) ;
  • lectures longues ONT
  • lectures ultra-long ONT
  • Lectures longues continues PacBio (CLRs)
  • Lectures HiFi PacBio
Analyse bioinformatique
Nous proposons plusieurs analyses bioinformatiques personnalisées :
  • Construction du pan-génome
  • Évaluation de l'assemblage
  • Annotation du génome
  • Annotation de séquence répétée
  • Annotation de la fonction des gènes
  • Annotation des ARN non codants
  • Analyse génomique comparative
  • Analyse biologique
  • …et plus encore
Remarque : Les sorties de données et les contenus d'analyse recommandés affichés sont à titre de référence uniquement. Pour des informations détaillées, veuillez contactez-nous avec vos demandes personnalisées.

Pipeline d'analyse

The Data Analysis Pipeline of GWAS.

Livrables

  • Les données de séquençage originales
  • Résultats expérimentaux
  • Rapport d'analyse des données
  • Détails dans le Pan Génome pour votre écriture (personnalisation)

Résultats de la démo

Les résultats partiels sont affichés ci-dessous :

The GWAS Results Display Figure.

Références

  1. Liu Y, Du H, Li P, et al. Pan-génome des soja sauvages et cultivés. Cellule2020, 182(1) :162-76.
  2. Chen J, Liu Y, Liu M, et al. L'analyse du pangenome révèle des variations génomiques associées aux traits de domestication du millet à balai. Nature Génétique. 2023, 55(12):2243-54.

FAQs sur le Pan Génome

Combien d'échantillons sont nécessaires pour le séquençage du pan-génome ?

Un minimum de deux individus ou sous-espèces est essentiel pour commencer une analyse du pan-génome. Cependant, pour obtenir une compréhension plus exhaustive de la diversité génétique au sein d'une espèce, un plus grand nombre d'échantillons devrait être considéré. L'inclusion d'échantillons supplémentaires améliore considérablement la résolution de la variation génétique et conduit à une carte du pan-génome plus complète.

2. Un génome de référence est-il nécessaire pour l'analyse du pan-génome ?

L'utilisation d'un génome de référence dans l'analyse du pan-génome n'est pas strictement obligatoire mais peut être bénéfique. Un génome de référence sert de cadre initial pour l'annotation des gènes et l'analyse comparative. Néanmoins, l'objectif principal des études sur le pan-génome est de découvrir des variations génétiques qui transcendent le cadre d'un seul génome de référence. Par conséquent, l'analyse du pan-génome est conçue pour identifier et intégrer la diversité génétique au-delà de celle représentée par un seul référentiel, garantissant une capture holistique du paysage génomique de l'espèce.

3. Quels types d'analyses sont effectuées dans les services de pan-génome standard ?

Assemblage de Pan-Génome : Inclut l'analyse du contenu en GC, l'analyse de la profondeur de séquençage et la construction de super-scaffolds à l'aide de génomes de référence.

Annotation structurale du pan-génome : implique la prédiction des génomes core et accessoires, l'annotation des séquences répétées et l'identification des ARN non codants.

Études de cas sur le Pan-Génome

Les analyses de pangenome révèlent l'impact des éléments transposables et de la ploïdie sur l'évolution des espèces de pommes de terre.

Journal : Actes de l'Académie nationale des sciences
Facteur d'impact : 12,779
Publié : 24 juillet 2023

Contexte

Pomme de terreSolanum tuberosum) est une culture mondiale clé avec une riche diversité génétique. Originaire des hauts plateaux andins, elle couvre plusieurs niveaux de ploïdie. Cette étude présente le pan-génome de pomme de terre le plus complet, combinant des séquences de 296 accès et identifiant 132 355 pangènes. L'analyse met en évidence la diversité génétique, l'adaptation et les relations évolutives au sein de la section Solanum. Petota.

Matériaux et Méthodes

Préparation des échantillons

  • Pomme de terre
  • Séquences génomiques des accessions de pomme de terre

Méthode

  • Téléchargement de données de séquençage
  • Construction du pangenome

Analyse des données

  • De nouveau assemblage
  • Alignement
  • Annotation du pangenome
  • Analyse PAV
  • Analyse des différences de fréquence génique

Résultats

1. Le Pangenome de Solanum Section Petota

Le pangenome comprend 296 échantillons de pommes de terre d'origines et de niveaux de ploïdie divers, incluant 154 Gbp de nouvelles assemblées et d'assemblées publiques, résultant en 514 888 contigs et 132 355 modèles de gènes.

Fig 1. Pangenome of the Solanum section Petota. (Bozan et al., 2023)Fig 1. Le Solanum section Petota pangenome.

2. Variation PAV dans les gènes codant pour des protéines

La variation des gènes codant des protéines entre les échantillons est influencée par la ploïdie et la domestication, affectant le nombre de gènes et la sélection.

Fig 2. Gene content variation among accessions in the Solanum section Petota pangenome, based on presence/absence variation (PAV). (Bozan et al., 2023)Fig 2. Contenu génétique des accès inclus dans le Solanum section Petota pangenome basé sur PAV.

3. Regroupement des Accès en Fonction du Contenu Génétique

L'analyse phylogénétique et l'ACP identifient des clades et des sous-groupes distincts, reflétant des variations dans le contenu génétique.

Fig 3. Maximum likelihood phylogenetic tree derived from PAV data for the Solanum section Petota pangenome. (Bozan et al., 2023)Fig 3. Un arbre phylogénétique par maximum de vraisemblance construit à partir des données PAV pour le Solanum section Petota pangenome.

4. La variation du contenu génétique distingue les clades et les sous-groupes

Les différences de contenu génétique sont notables entre les clades, mettant en évidence des traits évolutifs et d'adaptation.

5. Contenu TE dans le Pangenome

Le pangenome contient 75,5 % d'éléments transposables, avec une variation spécifique aux clades et des différences dans le contenu en TE.

Conclusion

La survie future des cultures de pommes de terre face au changement climatique dépend de la conservation de la biodiversité et de son intégration dans de nouvelles variétés. Un pangenome de 296 accès provenant de 60 Solanum section Petota Les espèces révèlent que le PAV, en particulier la variation des TE, joue un rôle dans la spéciation et montre un contenu accru en TE dans les matériaux propagés in vitro, similaire à l'activité des TE induite par le stress naturel.

Référence

  1. Bozan I, Achakkagari SR, Anglin NL, et al. Les analyses de pangenome révèlent l'impact des éléments transposables et de la ploïdie sur l'évolution des espèces de pomme de terre. Actes de l'Académie nationale des sciences2023, 120(31):e2211117120.

Publications connexes

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Collection de données génétiques dans des études basées sur l'ethnicité chez les Aymaras, Quechuas et Mestizos : les défis de l'étude sur la génétique de la maladie d'Alzheimer dans la population péruvienne (GAPP)

Journal : Alzheimer et Démence

Année : 2022

Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Évaluation des biomarqueurs plasmatiques pour la classification A/T/N de la maladie d'Alzheimer chez les adultes d'origine hispanique des Caraïbes

Journal : JAMA Network Open

Année : 2023

Désolé, je ne peux pas accéder à des liens externes.

Augmentation de la production de spores fongiques pathogènes et aéroportées suite à l'exposition d'une mycobiote du sol à des polluants hydrocarbonés aromatiques chlorés.

Journal : Microbiology Spectrum

Année : 2023

Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Une variante d'épissage dans le gène SLC16A8 entraîne un déficit de transport du lactate dans les cellules épithéliales pigmentaires rétiniennes dérivées de cellules iPS humaines.

Journal : Cellules

Année : 2021

Désolé, je ne peux pas accéder à des liens ou des contenus externes. Si vous avez un texte spécifique à traduire, veuillez le fournir et je serai heureux de vous aider.

Voir plus articles publiés par nos clients.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Ressources en vedette
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut