Qu'est-ce que l'appel de variantes ?
La variation génétique est un type de variation qui peut être héritée par la descendance, causée par des changements dans le matériel génétique d'un organisme. C'est cette variation qui amène les organismes à présenter une diversité génétique à différents niveaux. La diversité génétique est la base matérielle de la survie et du développement de la société humaine et des plantes. Il existe de nombreux types de variation génétique, allant de l'inversion chromosomique visible au microscope aux mutations de nucléotides uniques. Avec le développement de la génomique, les informations sur la variation génétique sont devenues plus complètes et ont inclus SNP, InDel, SV, CNV et mutations de transposons, et al.
L'appel de variantes fait référence à l'utilisation de séquençage à haut débit technologie pour séquencer et analyser les différences dans l'ensemble du génome d'un individu ou d'une population d'une espèce, afin d'obtenir une grande quantité d'informations sur la variation génétique, telles que Polymorphisme nucléotidique simple (SNP)Sites d'insertion et de suppression (InDel) et sites de variation structurelle (SV), variation du nombre de copies (CNV) et autres informations. L'appel de variants peut fournir la base de données la plus fondamentale et complète pour le cartographie fine fonctionnelle des gènes ultérieurs et analyser rapidement, avec précision et efficacité les différences entre les génomes, analyser chaque base du génome entier et obtenir les marqueurs moléculaires les plus étendus.
Méthodes de détection des variants structurels
La détection des variants structurels (SV) est un aspect essentiel de la recherche génomique. Plusieurs méthodologies ont été développées pour accomplir cette tâche, chacune ayant ses forces et ses applications spécifiques :
- Méthode de lecture-paire (RP)
La méthode Read-Pair implique l'analyse des lectures de séquençage à paires pour examiner leurs relations spatiales. Les variants structurels sont déduits des anomalies dans les tailles d'insertion attendues ou des incohérences dans l'orientation des lectures appariées. Les écarts par rapport aux distances ou orientations anticipées suggèrent la présence de variants structurels.
- Méthode de Lecture Scindée (SR)
La méthode Split-Read se concentre sur les cas où un segment d'une lecture se mappe au génome de référence tandis que son homologue ne le fait pas. Cette technique est particulièrement efficace pour identifier les insertions, les délétions et d'autres altérations structurelles complexes au sein du génome. La méthode excelle à localiser précisément les points de rupture des SVs.
- Méthode de Lecture en Profondeur (RD)
La méthode Read-Depth évalue la profondeur des lectures de séquençage mappées à des régions génomiques spécifiques pour révéler des CNV. Les fluctuations de la profondeur de lecture peuvent signifier des augmentations ou des diminutions du nombre de copies génomiques, révélant ainsi des CNV. Cette méthode est avantageuse pour détecter des duplications ou des délétions à grande échelle.
- Méthode d'assemblage (AS)
La méthode d'assemblage tire parti des technologies de séquençage de troisième génération, telles que PacBio SMRT ou Oxford Nanopore, en conjonction avec des approches d'assemblage de novo pour identifier des variants structurels étendus et complexes. Cette méthodologie facilite la caractérisation des altérations génomiques à longue portée et complexes directement à partir des données de séquençage brutes, offrant une vue d'ensemble des SVs.
Avantages et caractéristiques de l'appel de variantes
- Abondance : Analyse approfondie de tous les aspects de la variation génétique, y compris les SNP, InDel, SV, SNV, gènes nouveaux, etc.
- Flexibilité : avec ou sans référence est approprié.
- Précision : différentes méthodes de séquençage peuvent être appliquées en fonction du matériel différent.
Applications de l'appel de variants
- Recherche sur les maladies : La découverte de variants génétiques associés aux maladies éclaire leurs fondements génétiques et aide à identifier des biomarqueurs potentiels et des cibles de traitement.
- Médecine personnalisée : Les connaissances génétiques permettent d'élaborer des plans de traitement personnalisés et d'améliorer l'utilisation des médicaments en identifiant les variantes qui influencent le métabolisme des médicaments.
- Recherche Agricole : L'identification des variants génétiques liés à des traits souhaitables aide à développer de nouvelles souches et à augmenter la productivité dans l'élevage des plantes et des animaux.
Flux de travail d'appel de variantes

Spécifications de service
Exigences d'échantillon
|
|
Cliquez |
Stratégie de séquençage
|
| Analyse bioinformatique Nous proposons plusieurs analyses bioinformatiques personnalisées :
|
Pipeline de technologie de séquençage
- Basé sur assemblage du génome entier
- Basé sur rééchantillonnage de l'ensemble du génome
- Basé sur le séquençage du génome à représentation réduite

Livrables
- Les données de séquençage originales
- Résultats expérimentaux
- Rapport d'analyse des données
Références
- Jansen S, Aigner B, Pausch H, et al. Évaluation de la variation génomique dans une population de bovins par le re-séquençage d'animaux clés à faible à moyen couverture. BMC Genomics, 2013, 14(1) : 1.
- Zheng L Y, Guo X S, He B, et al. Modèles de variation génétique à l'échelle du génome chez le sorgho sucré et le sorgho grain (Sorghum bicolor). Biologie du génome, 2011, 12(11):287-302.
- Alkan C, Coe BP, Eichler EE. Découverte et génotypage des variations structurelles du génome. Nature Reviews GeneticsMai 2011 ; 12(5) : 363-76.
Les résultats partiels sont présentés ci-dessous :

1. Quels types de variants génétiques peuvent être détectés ?
Les variants génétiques peuvent être largement classés en variants de séquence, tels que les SNP et les petites InDels, et en variants structurels, y compris les grandes délétions, duplications, inversions et translocations. Les variations du nombre de copies (CNV) sont un sous-type de SV et peuvent également être détectées.
2. Comment les technologies de séquençage à longues lectures bénéficient-elles à l'appel de variants ?
Séquençage à lecture longue technologies, comme Séquençage SMRT de PacBio et Oxford Séquençage par nanopore, offrent des avantages tels que la détection de variants dans des régions génomiques complexes qui sont difficiles à analyser avec des méthodes à court tirage. Ils offrent une grande précision, évitent le biais de PCR et permettent la résolution du phasage des variants.
3. Quel est le flux de travail typique pour l'appel de variants chez CD Genomics ?
Le flux de travail comprend le traitement des données et le contrôle de la qualité, le mapping des lectures sur le génome de référence, l'appel de variants, l'annotation des variants et la visualisation des résultats. Cela garantit une détection complète et précise des variants génétiques.
Assemblage du génome du pak choi non-heading et comparaison avec les génomes du chou chinois à tête et du sarson jaune oléagineux.
Journal : Journal de biotechnologie végétale
Facteur d'impact : 10,1
Publié : 07 décembre 2020
Contexte
Les cultures de Brassica comprennent des espèces diploïdes et des espèces amphidiploïdes. Le génome du pak choi, étroitement lié au sarson jaune et au chou chinois à pomme, a été assemblé en utilisant Séquençage de molécules uniques PacBio et les technologies Hi-C. Cette assemblée a identifié de nombreux variants génétiques, y compris des SNP, des indels et des gènes spécifiques à certaines espèces, améliorant notre compréhension de la diversité des cultures de Brassica et de la génétique des traits.
Matériaux et Méthodes
Préparation des échantillons
- Matériaux végétaux
- Échantillons de feuilles
- Extraction d'ADN
Séquençage
- Séquençage du génome
- Séquençage SMRT de PacBio
- RNA-seq
- De nouveau assemblage
- Assemblage et évaluation des chromosomes
- Analyses du transcriptome
- Répéter l'annotation
- Prédiction génique
- annotation fonctionnelle
- Analyse de la variation structurelle
- Analyse comparative du génome
Résultats
Dans une publication en ligne de 2020 sur le "Chou"[1]Une analyse comparative des variations parmi trois types de chou, y compris les variations de présence/absence (PAV) entre les gènes, les variants structurels (SV) au sein du génome et les polymorphismes de nucléotides uniques (SNP), a révélé des informations significatives. En particulier, des différences dans les SV au sein des gènes de forme de feuille (par exemple, KAN de la famille des facteurs de transcription GARP) et les rôles inhibiteurs des gènes liés à la floraison (par exemple, MAF4, SVP) ont été observés parmi les trois types morphologiques (comme illustré dans la Figure 1, à gauche). Ces résultats revêtent une importance cruciale pour déchiffrer les mécanismes moléculaires régissant la morphogenèse des organes et la floraison, ainsi que pour les améliorations génétiques, dans le chou et les cultures légumières apparentées.
Figure 1 : PAV et SV spécifiques dans le génome du chou[1]
Autres cas :
L'influence des variants structurels (SV) sur la structure des gènes et l'expression des gènes
Pour valider l'applicabilité de l'analyse SV et explorer son utilité dans les études évolutives de population, une publication en ligne de 2020 sur "la tomate"[2] une enquête a été menée. Les chercheurs ont obtenu un arbre évolutif systématique basé sur plus de 800 matériaux avec des SNP issus de données de séquençage à lecture courte (Figure 2A). Par la suite, ils ont sélectionné un ensemble représentatif de 100 matériaux provenant de 7 lignées et ont collecté des données de séquençage à lecture longue pour construire un diagramme en arbre basé sur des données de SV (Figure 2B).
Les résultats ont indiqué que les matériaux sélectionnés étaient répartis au sein de leurs groupes taxonomiques connus, en accord avec la classification basée sur les SNP. Cela démontre la pertinence des SV pour l'analyse génétique des populations.
Figure 2 : Arbre évolutif systématique de la tomate[2]
Dans une publication en ligne de 2020 sur le "riz"[3]Les chercheurs ont construit des diagrammes de structure de population basés à la fois sur des données SNP (Figure 3A) et des données SV (Figure 3B). L'analyse SNP a révélé une large division de la population en environ six groupes, avec une distinction claire entre les variétés de riz japonica et indica. Fait intéressant, l'analyse SV a produit des résultats très cohérents, soutenant davantage la différenciation observée dans l'analyse SNP.
Figure 3 : Structure génétique du riz[3]
Spectre de fréquence des mutations de la population SV
Pour enquêter sur les impacts significatifs des variants délétères, la publication de 2020 sur le riz[3] spectres de fréquence calculés pour des sites non codants dans différents groupes (Figure 4-A, B, C). Chaque SFS comprend cinq types de SV (DUP, DEL, TRA, MEI et INV) et deux types de SNP (Syn, Nsyn) et révèle trois caractéristiques notables :
Des différences significatives existent entre les différents groupes de population, en accord avec un dérive génétique accrue lors des goulets d'étranglement de domestication et des changements dans les systèmes d'accouplement.
La proportion de SV fixes est inférieure à celle des SNP synonymes fixes et des SNP non synonymes. Les SV ont une fréquence plus faible dans le génome et sont plus susceptibles d'être éliminés après mutation, ce qui indique une probabilité plus élevée de dommages associés aux SV.
Les événements INV présentent les SFS les plus extrêmes, avec plus de 90 % des événements INV identifiés chez trois individus ou moins dans chaque groupe, ce qui implique que les événements INV peuvent être soumis à une forte sélection au cours du processus évolutif.
Les chercheurs ont effectué une analyse statistique des emplacements des SV et des SNP sur les chromosomes, et les résultats des tests indiquent une corrélation significative entre la diversité des SV et des SNP dans des fenêtres chromosomiques (Figure 4-D). Cela suggère que les SV fournissent des informations génétiques de population qui sont fondamentalement cohérentes avec les SNP.
Figure 4 : Spectres de fréquence SV[3]
Analyse de déséquilibre de liaison avec des SVs
Dans l'étude sur le [riz][3], LD (Déséquilibre de Liaison) a été calculé pour trois groupes de population distincts en utilisant des données de SNP, SV et SNP+SV. En raison de leurs effets potentiellement nocifs, les SV présentent souvent des fréquences de population plus faibles par rapport aux SNP et peuvent connaître une décroissance du LD plus rapide sur des distances physiques (Figure 5). Les données de SNP ont montré qu'à environ 100 kb, le r2 pour les SNP japonica restait autour de 0,2, tandis que pour les indica, il était d'environ 0,1. À la même distance physique, le r2 pour les rufipogon était inférieur à 0,05. Cependant, les valeurs de r2 pour les SV étaient inférieures à celles des SNP dans tous les groupes de population, avec des valeurs dépassant 0,1 uniquement sur des distances très courtes (<15 kb).
Figure 5 : Analyse de déséquilibre de liaison[3]
Étude sur la domestication des populations
Dans la recherche menée sur le riz[3]Une évaluation des disparités génomiques entre les polymorphismes nucléotidiques uniques (SNPs) et les variants structurels (SVs) a révélé une distinction notable. L'étude a observé que l'estimation moyenne de FST pour les SNPs était nettement plus élevée par rapport aux SVs. Cette découverte indique que les SVs présentent généralement des fréquences de population plus faibles par rapport aux SNPs.
En intégrant ces données avec des gènes de domestication et d'amélioration bien établis, l'enquête a réaffirmé l'enrichissement substantiel de ces gènes au sein des intervalles FST des 1 % et 10 % supérieurs. Par conséquent, cela a fourni des informations précieuses sur les gènes fonctionnels associés aux processus physiologiques, aux caractéristiques morphologiques et à la qualité des aliments (Figure 3).
Figure 6 : Caractéristiques SV associées à la domestication[3]
Analyse d'association à l'échelle du génome entier
Dans la publication de 2020 sur [colza][4]Une étude d'association à l'échelle du génome (GWAS) a été réalisée en utilisant les PAV identifiés à partir de huit variétés de colza. Cette analyse a révélé des relations causales entre les PAV et des traits tels que la longueur des siliques, le poids des graines et le temps de floraison. Fait intéressant, ces découvertes significatives ont été négligées dans les résultats du SNP-GWAS (Figure 7).
De même, dans la publication de 2021 sur [pêche][5]Des SVs candidats associés à des traits tels que la maturation précoce des fruits, la couleur du péricarpe autour du noyau, la forme des fruits et la formation de formes plates ont été observés (Figure 8).
Figure 7 : Résultats de l'analyse PAV_GWAS sur le colza[4]
Figure 8 : Résultats de l'analyse SV_GWAS de la pêche[5]
Références
- Li P, Su T, Zhao X, et al. Assemblage du génome du pak choi non pommé et comparaison avec les génomes du chou chinois pommé et du sarson jaune oléagineux. Journal de biotechnologie des plantes, 2020.
- Alonge M, Wang X, Benoit M, et al. Impacts majeurs de la variation structurelle généralisée sur l'expression génique et l'amélioration des cultures dans la tomate. Cellule, 2020.
- Yixuan K, Yi L, Tuomas T, et al. Génétique évolutive de la variation structurelle dans la domestication du riz asiatique (Oryza sativa). Biologie moléculaire et évolution, 2020.
- Song J, Guan Z, Hu J, et al. Huit génomes de haute qualité révèlent l'architecture du pan-génome et la différenciation des écotypes de Brassica napus. Plantes de la nature, 2020.
- Jiantao G, Yaoguang X, Yang Y, et al. Les analyses de variation de la structure du génome de la pêche révèlent la dynamique des populations et une inversion causale de 1,67 Mb pour la forme des fruits. Biologie du Génome, 2021.
Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :
Collection de données génétiques dans des études basées sur l'ethnicité parmi les Aymaras, Quechuas et Mestizos : les défis de l'étude sur la génétique de la maladie d'Alzheimer dans la population péruvienne (GAPP).
Journal : Alzheimer et Démence
Année : 2022
Évaluation des biomarqueurs plasmatiques pour la classification A/T/N de la maladie d'Alzheimer chez les adultes d'ethnie hispano-caribéenne.
Journal : JAMA Network Open
Année : 2023
Augmentation de la production de spores fongiques pathogènes et aériennes lors de l'exposition d'une mycobiote du sol à des polluants chlorés aromatiques.
Journal : Microbiology Spectrum
Année : 2023
Une variante d'épissage dans le gène SLC16A8 entraîne un déficit de transport de lactate dans les cellules épithéliales pigmentaires rétiniennes dérivées de cellules iPS humaines.
Journal : Cellules
Année : 2021
Voir plus articles publiés par nos clients.