Exploration des variations structurelles à travers la carte du pan-génome de la tomate

Analyse d'association à l'échelle du génome (GWAS) sert d'outil puissant pour identifier les gènes associés à des traits, jouant un rôle clé dans l'identification des loci génomiques candidats influençant les variations phénotypiques. Cependant, les GWAS conventionnels s'appuient principalement sur des informations provenant de variants de nucléotides uniques (SNPs) établir des associations avec des phénotypes, en négligeant des variants structurels substantiels (SV) ayant des tailles d'effet phénotypique considérablement plus grandes. Bien que le nombre total de SV dans le génome soit inférieur à celui des SNP, les SV couvrent une étendue de bases plus large et influencent un nombre total de variations de séquences génomiques significativement plus élevé que les SNP.

Contrairement aux variants polymorphes de séquence, les variants structurels peuvent avoir un impact plus profond sur les génomes et les traits génétiques des plantes et des animaux. Notamment, analyses GWAS basées sur SV ont trouvé une application répandue dans diverses espèces, y compris le maïs, le concombre, le raisin, le blé et la tomate.

Génome de la tomate

Dans une publication récente dans Nature Génétique intitulé "Les analyses de super-pangenome mettent en évidence la diversité génomique et la variation structurelle entre les espèces de tomates sauvages et cultivées," ils ont compilé 11 niveaux de chromosomes, génomes de haute qualité à partir de variétés de tomates sauvages et cultivées. Cet effort a conduit à la création du premier super-pangenome mondial pour les tomates, facilitant une avancée révolutionnaire Analyse SV-GWAS basé sur les profils de pangenome. Les résultats de cette étude sont prêts à accélérer considérablement la recherche biologique et la culture des tomates, une culture d'importance mondiale.

Un total de 11 variétés de tomates, comprenant 8 variantes de type sauvage, 1 espèce de tomate proche du sauvage et 2 variétés cultivées, ont été acquises pour cette étude. En utilisant des technologies de séquençage avancées telles que PacBio et Hi-C, les génomes de ces 11 variétés de tomates ont été méticuleusement assemblés au niveau chromosomique. Par la suite, un super-pan-génome a été construit, intégrant les profils génétiques de tous les 11 génomes de tomates. Ce génome consolidé a servi de base pour analyser les variations structurelles dans le contexte des variants structurels (SV).

Phylogenetic relationships and genomic components of wild and domesticated tomatoes.Relations phylogénétiques et composants génomiques des tomates sauvages et domestiquées. (Li et al., 2023)

Super-pangenome des tomates

L'enquête a ouvert la voie à l'assemblage d'un super pangenome complet pour les tomates, englobant 11 espèces de Solanum. En s'appuyant sur une analyse de clusters, l'étude a révélé 40 457 familles de gènes pan, regroupant des gènes codant des protéines provenant de 11 génomes au niveau des chromosomes et de deux précédemment publiés. À partir des résultats rapportés pan-génome de la tomate3 441 des 4 874 gènes non introniques ont été incorporés, tandis qu'un supplément de 9 320 gènes non redondants absents dans le pan-génome rapporté a été identifié.

L'analyse comparative du génome a révélé entre 2,0 et 8,193 milliards de SNPs et entre 0,6 et 1,5 million de petites InDels (≤50 pb) à travers 12 génomes de tomate. De plus, l'étude a identifié 103 333 insertions, 119 794 suppressions, 41 960 CNVs, 23 516 translocations et 1 320 rétrogradations (< 1 Mb de longueur) au sein des 12 germoplasmes de tomate. Notamment, l'étude a détecté avec précision des SVs précédemment rapportés associés à la variation phénotypique. En s'éloignant de la cartographie pan-SV de tomate précédente, l'étude a exclusivement identifié 180 314 SVs, contribuant à un total de 224 447 SVs.

L'intégration de ces SV identifiés avec un ensemble de données pan-SV (comprenant 112 germoplasmes de tomate) a facilité l'exploration des différences de SV dans l'évolution de la tomate. La subdivision des 112 cultivars en quatre groupes a révélé que la majorité des SV se produisaient à de faibles fréquences (inférieures à 0,25) dans tous les groupes. Fait intéressant, 8 094 SV ont montré des variations de fréquence significatives entre les groupes sauvages et cultivés. L'analyse fonctionnelle a mis en évidence l'implication de ces gènes dans des processus tels que le développement des tissus méristématiques et le transport de l'ammonium. De plus, 388 SV hautement différenciés ont été identifiés entre les tomates sauvages et cultivées, ajoutant une couche nuancée à notre compréhension de l'évolution génétique de la tomate.

Super-pangenome and the landscape of structural variation among wild and cultivated tomatoes.Super-pangenome et le paysage de la variation structurelle entre les tomates sauvages et cultivées. (Li et al., 2023)

Découverte de gènes cruciaux améliorant le rendement des tomates

Dans la comparaison entre les variétés de tomates sauvages et cultivées, cette enquête a identifié 388 variations structurelles (SV) qui ont influencé de manière significative 278 gènes. Notamment, une modification remarquable de la fréquence d'une délétion de 244 paires de bases a pris la deuxième position, se manifestant dans l'exon initial du Sgal12g015720 gène. Ce gène code pour une protéine appartenant à la superfamille des cytochromes P450 (CYP), connue pour son rôle essentiel dans la croissance des plantes, le développement et la biosynthèse des métabolites secondaires. Sgal12g015720 présenté des niveaux d'expression maximaux dans les tiges de la tomate sauvage, S. pennellii, tandis que son expression était presque négligeable dans les deux espèces de tomates cultivées.

L'occurrence de l'événement de délétion de 244 paires de bases est hypothétisée comme un sous-produit de la domestication de la tomate, entraînant la pseudogénisation de la Sgal12g015720 gène dans les tomates cultivées. Cet événement revêt une signification potentielle dans la régulation de la taille des plantes et du rendement au cours de l'élevage de tomates. Des études ultérieures ont corroboré cette hypothèse par des analyses expérimentales impliquant la surexpression du gène. Les résultats soulignent le rôle central de Sgal12g015720 dans la formation du rendement des tomates, mettant en lumière son application potentielle dans les futures stratégies de sélection.

Characterization of a wild tomato cytochrome P450 gene, Sgal12g015720.Caractérisation d'un gène cytochrome P450 de tomate sauvage, Sgal12g015720. (Li et al., 2023)

Cette étude présente les génomes au niveau chromosomique de neuf espèces de tomates sauvages et de deux cultivars, les amalgamant avec deux génomes publiés précédemment pour dévoiler la phylogénie de la tomate. Grâce à cette approche complète, un super-pan-génome pour les tomates a été construit. L'enquête a exploré les variations structurelles au sein du génome de la tomate, mettant en lumière la diversité génomique inhérente aux parents sauvages des tomates. Notamment, l'étude a conduit à l'identification d'un gène de tomate sauvage avec un potentiel prometteur pour améliorer le rendement des tomates cultivées contemporaines.

Le construction de génomes basée sur des cartes a servi de base pour mener des études d'association génomique à l'échelle du génome basées sur des variations structurelles (SV), révélant de nombreux signaux étroitement liés aux traits liés à la saveur et aux métabolites des fruits dans les tomates. Cette exploration holistique fournit des informations précieuses sur les facteurs génétiques influençant les caractéristiques des tomates, offrant une voie pour tirer parti de ces connaissances dans la quête d'une amélioration des rendements des cultures et des profils de saveur améliorés.

Référence:

  1. Li, N., He, Q., Wang, J. et al. Les analyses de super-pangenome mettent en évidence la diversité génomique et la variation structurelle entre les espèces de tomates sauvages et cultivées. Nat Genet 55, 852–860 (2023).
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut