Service de séquençage par skim : génotypage à faible coût et à haut débit pour l'agriculture et la recherche

Le séquençage par écumage est un service de génotypage avancé conçu pour révolutionner les études génétiques à grande échelle en tirant parti du séquençage du génome entier à ultra-faible couverture (0,01x – 1x). Cette optimisation de profondeur spécifique nous permet de réduire considérablement les coûts de séquençage tout en conservant la capacité de fournir des informations génétiques complètes. En combinant une préparation de bibliothèque rentable avec pipelines bioinformatiques robustesnous permettons l'analyse simultanée de milliers d'échantillons sans compromettre l'utilité des données. Que ce soit pour l'estimation du dosage chromosomique, l'identification de translocations ou la découverte de marqueurs à haute densité, notre service rend l'accessibilité au génome entier une réalité pour les chercheurs et les éleveurs opérant avec un budget limité.

Directives de Soumission d'Échantillons

A flowchart illustrating the Skim Sequencing workflow, from large-scale sample collection and cost-effective library preparation to ultra-low coverage sequencing ($0.01\text{x}$–$1\text{x}$) and comprehensive genotyping insights.

  • Atteignez une efficacité de coût inégalée avec une profondeur de séquençage de 0,01x à 1x.
  • Couverture génomique sécurisée supérieure à celle des puces de génotypage limitées.
  • Réalisez une évolutivité extrême en traitant des milliers d'échantillons simultanément.
  • Faites confiance à une précision éprouvée pour un dosage précis et un appel de variantes.
  • Exploitez l'expertise en bioinformatique optimisée pour l'analyse de données à faible couverture.
Table des matières

    Qu'est-ce que le séquençage Skim ?

    Le séquençage par échantillonnage, également connu sous le nom de séquençage du génome entier à faible couverture, est une application de séquençage de nouvelle génération (NGS) où chaque échantillon est séquencé à une couverture faible (généralement comprise entre 0,01x et 1x). Contrairement aux méthodes qui séquencent seulement une fraction du génome (comme le GBS ou le RAD-seq), les lectures de séquençage par échantillonnage sont distribuées de manière aléatoire à travers tout le génome. Lorsqu'il est combiné avec des pipelines d'imputation et d'analyse sophistiqués, ces données à faible couverture peuvent être utilisées pour appeler des variants, génotyper des individus et caractériser des structures génomiques avec une grande précision.

    Développé à l'origine pour surmonter les limitations de coût et d'évolutivité du séquençage profond pour de grandes populations, il tire parti de la diminution constante des coûts de séquençage pour fournir une vue "à l'échelle du génome" qui est à la fois complète et économique. Au-delà des cibles à forte abondance telles que les plastomes, ces données peuvent également être exploitées pour identifier des gènes nucléaires à faible copie, élargissant ainsi considérablement le champ de leurs applications.

    Pourquoi choisir le séquençage par échantillonnage ?

    Pour les entreprises agroalimentaires, les institutions de recherche et les programmes de conservation, le séquençage par survol représente l'équilibre optimal entre la richesse des données, le débit et le budget.

    Comparaison des approches de génotypage :

    Caractéristique Séquençage par survol Génotypage par séquençage (GBS) Microarrays SNP
    Couverture du génome Génome entier, échantillonnage aléatoire Représentation réduite (sites spécifiques) Positions fixes prédéfinies
    Découverte de marqueurs Illimité, à l'échelle du génome Limité aux sites de restriction Pas possible (système fermé)
    Coût par échantillon Très bas (à grande échelle) Bas Modéré à Élevé
    Évolutivité Extrêmement élevé (1000s d'échantillons) Élevé Élevé
    Meilleur pour Élevage à grande échelle, découverte de nouveaux traits, analyse des variants structurels Études ciblées, espèces avec de petits budgets Dépistage de routine avec des ensembles de marqueurs connus et stables

    Le principal moteur de l'adoption est coûtLe séquençage par balayage réduit le principal goulot d'étranglement des coûts et du temps de construction de bibliothèques grâce à des protocoles hautement multiplexés et à faible volume. De plus, il fournit données pérennesContrairement aux tableaux, les données de séquence brutes peuvent être réanalysées à mesure que de nouvelles questions génétiques se posent ou que les génomes de référence s'améliorent, protégeant ainsi votre investissement.  

    Applications de service de séquençage par balayage en génomique agricole

    Notre service est spécifiquement conçu pour renforcer l'agriculture :

    • Sélection génomique et amélioration accéléréeGénotyper rapidement de grandes populations de reproduction (par exemple, des milliers de lignées) pour prédire la performance des traits complexes et sélectionner des parents supérieurs, réduisant ainsi considérablement les cycles de reproduction.  
    • Cartographie génétique haute résolution: Réaliser des études d'association à l'échelle du génome (GWAS) et du mapping de locus de traits quantitatifs (QTL) avec des marqueurs denses à l'échelle du génome pour identifier les gènes contrôlant le rendement, la résistance aux maladies, la tolérance à la sécheresse et les traits de qualité.  
    • Suivi de l'introgression et du retour en arrièreIdentifier et caractériser précisément des segments génomiques souhaitables (par exemple, provenant de parents sauvages) dans les lignées de sélection. Surveiller les progrès des croisements arrières pour maintenir les génétiques essentielles tout en ajoutant de nouveaux traits.  
    • Analyse structurale et cytogénétiqueDétecter les anomalies chromosomiques, estimer la variation du nombre de copies (dosage) et identifier les translocations ou l'aneuploïdie - essentiel pour les cultures polyploïdes comme le blé et pour la santé du bétail.  
    • Diversité génétique et caractérisation des ressourcesProfilage efficace des collections de germoplasme, des variétés anciennes et des parents sauvages pour évaluer la diversité génétique, identifier des allèles uniques et informer les stratégies de conservation.  

    Flux de travail du service de séquençage Skim

    Notre flux de travail rationalisé, de bout en bout, garantit fiabilité, qualité et rapidité d'exécution.

    Skim Sequencing Service Workflow

    Analyse bioinformatique de séquençage de skim

    Nous transformons les données de séquençage brutes en informations biologiques exploitables. Nos forfaits standard et avancés comprennent :

    Traitement de données standard

    • Démultiplexage et découpe d'adaptateurs.  
    • Contrôle de la qualité (FastQC, MultiQC).  
    • Alignement au génome de référence (BWA-MEM).  
    • Appel de variantes brutes (GATK).  
    • Livraison des fichiers FASTQ, BAM et VCF initiaux.

    Modules d'analyse avancée:

    • Imputation de génotypesUtilise des informations sur les haplotypes au niveau de la population pour prédire avec précision les génotypes manquants, augmentant ainsi efficacement la résolution et l'utilité des données à faible couverture.  
    • Génétique des populationsAnalyse de la diversité génétique, de la structure des populations et des relations phylogénétiques à l'aide d'outils tels que PLINK et ADMIXTURE.  
    • Étude d'Association à l'Échelle du Génome (GWAS)Identification de marqueurs statistiquement associés à des traits d'intérêt.  
    • Détection de variantes structurellesIdentification des variants de nombre de copies (VNC), des inversions et des translocations à l'aide d'analyses de profondeur de lecture et de lecture fractionnée.  
    • Applications sans assemblagePour les échantillons métagénomiques ou non caractérisés, nous proposons des outils comme Skmer, qui calcule les distances génomiques pour l'identification sans avoir besoin d'un génome de référence.

    Pour une analyse bioinformatique personnalisée ou des besoins de recherche spécifiques, veuillez contacter nos experts pour des conseils professionnels et un soutien adaptés aux exigences de votre projet.

    A flowchart illustrating a genomic data pipeline, divided into two sections: 'Standard Data Processing' and 'Advanced Analytics.' The standard process flows vertically through Data Processing, QC, Alignment, and Variant Calling to Delivery. From Delivery, the path branches out into five advanced analytics options: Imputation, Population Genetics, GWAS, Structural Variants, and Assembly-Free analysis.

    Exigences échantillons pour le séquençage Skim

    Pour garantir le succès du projet, nous recommandons ce qui suit :

    Type d'échantillon Quantité minimale Métriques de qualité
    ADN génomique 100 ng (pour la préparation de la bibliothèque) A260/A280 : 1,8-2,0 ; A260/A230 > 2,0. Intact sur gel (haute masse moléculaire).
    Tissu végétal Tissu foliaire jeune (100-200 mg) Frais, congelé (dans de l'azote liquide N₂) ou conservé dans un tampon fiable (par exemple, CTAB, gel de silice).
    Tissu animal 25 mg (par exemple, échantillon d'oreille, sang, sperme) Frais congelé ou conservé dans de l'éthanol. Évitez la contamination croisée.

    Pourquoi choisir CD Genomics pour le séquençage Skim ?

    Nous ne sommes pas seulement un prestataire de services ; nous sommes un partenaire dans votre découverte scientifique.

    • Expertise et technologie éprouvéesNotre protocole est basé sur des méthodes publiées et évaluées par des pairs, développées pour le génotypage à grande échelle des plantes et des animaux. Nous mettons en œuvre des pipelines d'imputation à la pointe de la technologie, éprouvés dans le cadre de travaux contractés par le gouvernement.  
    • Scalabilité pour les projets à grande échelleQue vous traitiez 100 ou 10 000 échantillons, notre flux de travail de multiplexage optimisé offre une précision constante sans dépasser votre budget. Nous sommes entièrement équipés pour soutenir les essais étendus essentiels à la recherche agricole moderne.
    • Support et personnalisation de bout en boutDe la conception expérimentale à l'interprétation finale, notre équipe de scientifiques de niveau doctorat fournit un soutien continu. Nous personnalisons les analyses pour diverses espèces, des cultures en rangées et du bétail aux espèces spécialisées et aux communautés microbiennes.  
    • Sécurité des données et conformitéNous respectons des accords stricts de confidentialité des données. Notre pipeline de bioinformatique peut s'intégrer de manière optionnelle avec des outils de dépistage de la biosécurité (par exemple, NCBI BLAST, SecureDNA) pour examiner les séquences par rapport aux agents pathogènes préoccupants, garantissant ainsi une conduite de recherche responsable.

    Thermocycler for DNA and PCR tests and analyzes against the backdrop of a medical laboratory

    Références :

    1. Adhikari L., et al. Une approche de séquençage à haut débit pour le génotypage, l'estimation de dosage et l'identification des translocations. Sci Rep 12(1), 17583 (2022).
    2. Kumar P., et al. Séquençage par balayage : une technologie NGS avancée pour l'amélioration des cultures. J Genet 100, 38 (2021).
    3. Sarmashghi S., et al. Skmer : identification d'échantillons sans assemblage et sans alignement utilisant des génomes réduits. Genome Biol 20, 34 (2019).
    4. Berger B.A., et al. Les profondeurs inattendues des données de génomique superficielle : une étude de cas examinant les gènes de symétrie florale des Goodeniaceae. Appl Plant Sci 5(10), 1700042 (2017).

    FAQ

    1. Quelle est la couverture minimale que je peux utiliser et quelle est la précision ?

    Pour des espèces bien caractérisées avec de bons génomes de référence et des données de population pour l'imputation, une couverture aussi basse que 0,1x à 0,5x peut produire des appels de génotype très précis (par exemple, pour les GWAS et la sélection génomique). Pour détecter des variants structurels ou travailler avec des espèces nouvelles, une couverture de 1x ou plus peut être recommandée. Nos bioinformaticiens vous conseilleront sur la couverture optimale pour vos objectifs.

    2. Mon organisme n'a pas de génome de référence parfait. Puis-je quand même utiliser le séquençage skim ?

    Absolument. Pour la génétique au sein d'une population, un génome de référence ou un génome d'un proche parent est souvent suffisant pour l'alignement et l'appel de variants. De plus, méthodes sans assemblage comme Skmer peut être utilisé pour l'identification d'échantillons et l'analyse de la diversité sans aucun génome de référence.

    3. Comment le séquençage par échantillonnage compare-t-il au séquençage du génome entier (WGS) pour mon programme de reproduction ?

    Le séquençage par survol est essentiellement WGS à faible couvertureLa principale différence réside dans le coût par échantillon. Pour le prix du séquençage profond (30x) d'un individu, vous pouvez effectuer un séquençage par échantillonnage sur des centaines. Si vos objectifs principaux sont le génotypage, la sélection et le cartographie—et non la découverte de chaque variante rare chez un individu—le séquençage par échantillonnage offre une bien plus grande puissance et un meilleur retour sur investissement pour l'élevage.

    4. Pouvez-vous manipuler des échantillons du terrain, comme des feuilles conservées dans de l'RNA-later ou du gel de silice ?

    Oui. Nous avons une vaste expérience dans le traitement de divers types d'échantillons. Bien que l'ADN frais congelé de haute qualité soit idéal, nous offrons des conseils sur les meilleures méthodes de conservation adaptées à vos conditions de terrain et pouvons effectuer des services d'extraction si nécessaire.

    Étude de cas

    Une diversité haplotypique limitée sous-tend l'architecture des traits polygéniques au cours de 70 ans de sélection du blé.

    JournalBiologie du génome

    Facteur d'impact17,9 (2022)

    Publié: 2021 

    DOIDésolé, je ne peux pas accéder aux liens ou au contenu externe.

    À première vue

    • Organisme : Blé tendre hexaploïdeTriticum aestivum), ~17 Go de génome.
    • Population : NIAB Diverse MAGIC (500+ Lignes Inbred Recombinantes).
    • Méthode : Séquençage par survol (WGS à faible couverture) à environ 0,3x de couverture.
    • Résultat : 1,1 million de SNPs de haute qualité imputés avec une précision de plus de 99 %.
    • Point clé : Le séquençage par survol a fourni un taux d'appel 3 fois supérieur à celui du génotypage direct et a permis une cartographie à haute résolution des traits polygéniques.

    Le défi : Génotypage d'un polyploïde complexe

    Des chercheurs de NIAB et de l'UCL ont cherché à analyser l'architecture génétique des changements phénotypiques historiques chez le blé. Ils ont créé une population d'intercroisement avancé multi-parent (MAGIC) dérivée de 16 variétés de blé historiques du Royaume-Uni, publiées entre 1935 et 2004.

    Les Obstacles:

    • Taille du génomeLe génome du blé est massif (17 Gb) et hexaploïde, rendant le séquençage profond prohibitif en termes de coûts pour des centaines de lignées.
    • Limitations des tableauxLes SNP arrays traditionnels souffrent souvent d'un biais de détection (ne détectant que les variants communs) et ont des difficultés avec la complexité polyploïde.
    • ÉchelleL'étude a nécessité le génotypage de plus de 500 lignées recombinantes consanguines (RIL) pour cartographier efficacement les traits.

    La solution : séquençage par échantillonnage + imputation

    Au lieu d'utiliser des séquençages profonds coûteux ou des matrices restrictives, l'équipe a utilisé le séquençage Skim. Ils ont séquencé les 550 RIL à une profondeur moyenne de seulement 0,304x.

    Pour récupérer des données génotypiques de haute qualité à partir de ces données brutes rares, ils ont appliqué une imputation en utilisant le logiciel STITCH. Ce processus a tiré parti des blocs d'haplotypes hérités des fondateurs pour combler les lacunes.

    La méthodologie

    • FondateursLes 16 lignées fondatrices ont été séquencées plus en profondeur en utilisant la capture promoteur-gène pour créer une référence haplotypique.
    • ProgénitureLes plus de 500 RIL ont été séquencés à faible couverture (~0,3x).
    • ImputationLes génotypes ont été déduits en fonction de la probabilité de porter des haplotypes fondateurs spécifiques.

    Validation : Précision Comparable aux Arrays de "Standard d'Or"

    L'étude a validé les données de séquençage Skim par rapport à un sous-ensemble de marqueurs de l'array SNP Axiom 35k. Les résultats ont confirmé que le séquençage à faible couverture est très fiable.

    Métrique Résultat
    Précision de l'imputation 99,1 % de concordance avec les génotypes de l'array.
    Rendement SNP 1,13 million de SNPs de haute qualité (contre environ 20 000 sur la puce).
    Taux d'appel efficace 99,6 % (augmenté de trois fois par rapport aux données brutes lues).

    Perspicacité critiqueL'analyse de sous-échantillonnage a montré que les génotypes pouvaient être inférés avec précision à partir d'une couverture aussi basse que 0,076x par échantillon. De plus, la précision de l'imputation est restée élevée (>98 %) même sans utiliser les fondateurs comme panneau de référence, démontrant la robustesse de la méthode.

    Application : Cartographie de précision et prédiction génomique

    Les données à haute densité générées par le séquençage Skim ont permis aux chercheurs de disséquer des traits agronomiques complexes avec précision.

    1. Cartographie QTL haute résolution

    L'équipe a identifié 136 associations significatives à l'échelle du génome pour 47 traits.

    • Ils ont identifié 42 loci génétiques distincts contrôlant des traits tels que le rendement, la résistance aux maladies et la hauteur.
    • La plupart des traits se sont avérés être hautement polygéniques, contrôlés par un brassage fin des haplotypes.

    2. Découverte des compromis

    Les données ont révélé une pléiotropie extensive (des gènes uniques affectant plusieurs traits). En particulier, ils ont analysé le compromis négatif entre le rendement en grains (GY) et la teneur en protéines des grains (GPC).

    • En utilisant les données génétiques denses, ils ont identifié que la présence d'épis (barbes sur l'épi de blé) est associée à une déviation positive par rapport au compromis rendement-protéines.
    • Cette idée offre un objectif clair pour les éleveurs afin d'améliorer simultanément le rendement et la protéine.

    3. Prédiction génomique

    En utilisant des modèles LASSO sur les données Skim Seq, les chercheurs ont atteint une grande précision de prédiction pour des lignes hors échantillon.

    • La précision des prédictions était en moyenne de 0,43, utilisant environ 155 SNPs par phénotype.
    • L'étude a conclu que les futurs gains génétiques nécessiteraient de sélectionner des dizaines d'allèles polygéniques à faible effet, facilité par ce type de données génomiques.
    À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
    Services associés
    Demande de devis
    ! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
    Contactez CD Genomics
    Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
    Haut