Solution d'analyse des variants structurels et des haplotypes

Les variants structurels et les haplotypes expliquent souvent des motifs génomiques que l'analyse basée uniquement sur les SNP ne peut pas résoudre complètement. CD Genomics propose une solution d'analyse des variants structurels et des haplotypes qui relie la stratégie de séquençage, la détection des SV, le phasage des haplotypes, l'annotation, la visualisation et la bioinformatique personnalisée en un flux de travail axé sur la recherche.

Nous vous aidons à passer des données de variation génomique brutes aux résultats que votre équipe peut examiner, discuter et utiliser pour la prochaine décision de recherche. Cette solution est particulièrement utile pour les études de population, le mapping de traits, la recherche sur des organismes non-modèles, la comparaison de souches et l'analyse génomique complexe.

  • Détecter les suppressions, insertions, inversions, duplications, translocations et CNV.
  • Résoudre le contexte des variantes phasées à travers les régions candidates
  • Intégrer les résultats de SV et d'haplotype avec GWAS, QTL-seq, BSA ou analyse de population.
Directives de soumission d'échantillons

Structural variant and haplotype analysis workflow overview

Livrables

  • Tables de jeux d'appels SV et d'annotation des variants
  • Sorties de phasage de haplotypes et fichiers de variantes phasées
  • Résumé et rapports de projet prêts pour la visualisation

Conçu pour la recherche génomique complexe, la comparaison des populations et l'interprétation en aval.

Table des matières

    Genome variation analysis output overview

    Explore comment les preuves de longues lectures, l'appel de variations structurales, le phasage des haplotypes et la bioinformatique personnalisée peuvent soutenir l'interprétation complexe du génome.

    Quand les SNP ne suffisent pas : pourquoi les variants structurels et les haplotypes sont importants

    Les SNP et les petites indels sont utiles, mais ils ne représentent qu'une couche de variation génomique. De nombreuses questions de recherche dépendent de changements génomiques plus importants, tels que des variations du nombre de copies, de grandes insertions, des inversions, des translocations, des variants associés aux répétitions ou des combinaisons de variants spécifiques à un allèle.

    Un projet d'analyse des variants structurels et des haplotypes va au-delà des changements de base isolés. Il pose une question plus pratique : quelle architecture génomique est liée à la différence biologique que vous étudiez ?

    Les variants structurels peuvent affecter la dose génique, les séquences codantes, les régions régulatrices, l'organisation du génome et les intervalles candidats. L'analyse des haplotypes ajoute une couche supplémentaire en montrant quels variants se produisent ensemble sur le même allèle ou le même contexte génomique. Ce contexte peut être important lorsque le signal de recherche dépend de blocs hérités, d'allèles parentaux, de la structure de la population, des différences entre souches ou de la variation au niveau des cultivars.

    Le séquençage à longue lecture est souvent précieux dans ce domaine car les longues lectures peuvent couvrir des régions répétitives, des réarrangements complexes et des variants liés que les courtes lectures peuvent ne pas résoudre efficacement. Des études récentes ont montré que le séquençage à longue lecture peut améliorer la découverte de variants structurels et l'analyse tenant compte des haplotypes dans des régions génomiques difficiles.

    Pour de nombreuses équipes, la question principale n'est pas simplement de savoir si les SVs sont présents. La question plus utile est de savoir si les SVs et les haplotypes peuvent être liés à des gènes candidats, des régions candidates, des différences entre groupes ou une interprétation en aval. C'est là qu'une solution planifiée a de l'importance.

    Ce que cette solution vous aide à résoudre

    Notre solution d'analyse des variants structurels et des haplotypes est conçue pour les projets où l'analyse standard des variants laisse des questions importantes sans réponse.

    Interprétation des traits complexes et des régions candidates

    Si votre Étude d'association à l'échelle du génome (GWAS), QTL-seq, Analyse de ségrégation en vrac (BSA)ou l'analyse de la population indique une région candidate, les résultats au niveau des SNP peuvent ne pas expliquer l'intégralité du signal.

    • Examiner les régions candidates pour la variation structurelle
    • Connectez les SVs avec les gènes et les annotations à proximité.
    • Organiser des preuves par étapes autour de la question de recherche.

    Comparaison de population, de souche, de cultivar ou de germoplasme

    Dans Génétique des populations, la recherche sur la reproduction et les études au niveau des souches, la même région génique peut porter différentes formes structurelles selon les groupes.

    • Comparer les modèles SV entre les groupes
    • Résumer les structures de haplotypes par population ou lignée.
    • Soutenir les études sur le matériel génétique et la diversité

    Analyse de génome complexe et organisme non-modèle

    De nombreuses plantes, animaux, microbes et organismes environnementaux présentent des régions répétitives, une qualité de référence variable, une grande hétérozygotie, de la polyploïdie ou des ressources génomiques incomplètes.

    • Réviser la taille du génome et le statut de référence
    • Évaluer la qualité des échantillons avant la sélection de la plateforme.
    • Adapter l'analyse à la complexité du génome

    Intégration avec l'analyse en aval

    Les résultats des SV et des haplotypes sont les plus utiles lorsqu'ils se connectent au reste de l'étude.

    Nos capacités de service pour les projets SV et haplotypes

    Nous ne considérons pas l'analyse de SV et d'haplotypes comme un seul pipeline standard. Un plan de projet utile dépend de votre échantillon, de l'espèce, de la structure du génome, des données existantes et de la question biologique.

    Conception de stratégie de séquençage

    Nous examinons si votre projet est mieux adapté à un séquençage à court ou à long reads, ou à une stratégie hybride. Les projets axés sur de grands SV, des répétitions, des haplotypes, des loci complexes ou des génomes non modèles bénéficient souvent de preuves à long reads.

    Lorsque le séquençage à long fragment est approprié, nous pouvons vous aider à évaluer des options telles que Séquençage SMRT de PacBio et Séquençage par nanopore.

    Détection et annotation des variants structurels

    • Suppressions
    • Insertions
    • Inversions
    • Duplications
    • Translocations
    • CNVs
    • Réarrangements complexes, lorsqu'ils sont soutenus par les données.

    Pour les projets axés sur les CNV, Services de séquençage CNV peut être considéré comme un module connexe.

    Phasage des haplotypes et interprétation tenant compte des haplotypes

    Le phasage des haplotypes aide à organiser les variants par allèle ou contexte génomique. Cela peut aider votre équipe à comprendre si les variants sont liés, comment ils diffèrent entre les groupes, et si une région candidate contient des motifs de variants phasés qui sont importants pour l'interprétation.

    Bioinformatique personnalisée

    Les projets SV et haplotypes ont souvent besoin de plus qu'une exportation de fichier par défaut. CD Genomics fournit Bioinformatique, Analyse des données génomiqueset Service d'analyse des données de séquençage longue lecture pour des projets nécessitant une conception d'analyse personnalisée, une logique de filtrage, une comparaison de cohortes ou une visualisation prête à être présentée.

    Nous pouvons préparer des résultats qui aident votre équipe à examiner et à communiquer les résultats, y compris des tableaux récapitulatifs SV, des fichiers de variantes par phase, des tableaux d'annotation, des pistes de navigateur génomique, des figures récapitulatives et des rapports de projet.

    Stratégie technologique : Longue lecture, courte lecture ou hybride ?

    La meilleure stratégie dépend de ce que vous devez résoudre. Aucune plateforme ou méthode d'analyse unique n'est la meilleure pour chaque projet de SV et d'haplotype. Un benchmark de Nature Communications de 2024 comparant les méthodes de détection de SV basées sur l'alignement et sur l'assemblage a révélé des compromis clairs. Les méthodes basées sur l'assemblage ont bien performé pour les grands SV, en particulier les insertions, tandis que les méthodes basées sur l'alignement ont montré des avantages pour la précision du génotypage à faible couverture et pour certaines classes de SV complexes. L'étude a également souligné qu'il n'existe pas d'outil universellement supérieur dans tous les scénarios.

    Stratégie Meilleur ajustement Valeur de détection SV Valeur de haplotype Sensibilité de l'échantillon Les besoins en bioinformatique Notes pratiques
    Séquençage génomique à lecture courte Découverte de SNP/Indel, séquençage large, données de cohortes existantes Limité pour les SVs grands ou complexes ; utile pour les petites variantes et les preuves de soutien. Phasage limité à moins d'être soutenu par des données supplémentaires. Généralement plus tolérant à l'ADN fragmenté que les flux de travail à lecture longue. Appel de variantes standard, filtrage, annotation Utile lorsque des données de variantes petites au niveau de la cohorte sont nécessaires.
    Séquençage à lecture longue HiFi de PacBio Découverte précise de variantes à longues lectures, régions complexes, analyse tenant compte des haplotypes Forte pour les insertions, les suppressions, les variants associés aux répétitions et les régions complexes. Forte lorsque la longueur de lecture et la précision soutiennent le phasage. Nécessite de l'ADN génomique de haute qualité Alignement de longues lectures, appel de variations structurales, phasage, annotation Bon choix lorsque la précision de la séquence et le contexte des longues lectures sont importants.
    Séquençage à long brin d'Oxford Nanopore Lectures longues, potentiel de lecture ultra-longue, régions structurelles complexes Utile pour les grands SV, les lectures couvrant des répétitions et les réarrangements. Peut prendre en charge le phasage lorsque la couverture, la qualité de lecture et la conception du pipeline sont adéquates. Nécessite un examen minutieux de l'intégrité de l'ADN, en particulier pour les objectifs ultra-longs. Alignement conscient de l'ONT, appel de SV, stratégie de polissage ou de filtrage Bon choix lorsque la longueur de lecture et la puissance de couverture sont des priorités.
    Hybrid lecture courte + lecture longue Données de courtes lectures existantes plus nouvelles preuves de longues lectures Combine un large contexte de variantes avec des preuves de SV à longues lectures. Peut améliorer la confiance lorsque plusieurs couches de preuves s'accordent. Dépend des deux types de données. Intégration, validation croisée, rapport fusionné Utile lorsque le projet dispose déjà de données de séquençage WGS ou de resequencement à lecture courte.
    Assemblage résolu par haplotype Génomes complexes, haute hétérozygotie, pan-génome ou études spécifiques aux allèles. Forte pour la découverte structurelle lorsque la qualité de l'assemblage est élevée. Forte pour la structure génomique spécifique à l'allèle Nécessite une entrée de haute qualité et une planification plus approfondie. Assemblage, polissage, phasage, comparaison, annotation Meilleur lorsqu'une base génomique de référence ou résolue par allèle est nécessaire.

    Flux de travail de bout en bout avec points de contrôle de QC

    De la réception du projet aux résultats SV et haplotypes prêts à être rapportés

    End-to-end structural variant and haplotype analysis workflow with QC checkpoints

    Nous commençons par examiner votre espèce, le type d'échantillon, le nombre d'échantillons, l'état du génome de référence, l'objectif de recherche, les types de variants cibles et les besoins en analyses en aval. À ce stade, nous clarifions si le projet est axé sur la découverte de SV à l'échelle du génome entier, une région candidate, une comparaison de populations, une comparaison de matériel de reproduction, une variation au niveau des souches ou une intégration avec des résultats existants.

    Après la soumission de l'échantillon, la qualité de l'ADN génomique est vérifiée avant la préparation de la bibliothèque. Pour les flux de travail à longues lectures, l'intégrité de l'ADN est particulièrement importante car de longues molécules améliorent la capacité à couvrir les répétitions, les points de rupture et les blocs d'haplotype. Si l'échantillon ne correspond pas au flux de travail prévu, nous examinons les ajustements possibles avant de procéder.

    Selon la stratégie confirmée, les échantillons passent à un séquençage à lecture courte, à lecture longue ou hybride. Pour les projets à lecture longue, l'objectif est de générer des lectures capables de soutenir la détection des variations structurelles (SV), la résolution des points de rupture et le phasage lorsque les données le permettent. Les lectures sont ensuite alignées sur le génome de référence ou utilisées dans un flux de travail tenant compte de l'assemblage lorsque cela est approprié.

    Les variants structurels sont appelés, filtrés, classés et annotés. Le phasage des haplotypes est effectué lorsque les données et la conception de l'étude le permettent. Les résultats peuvent ensuite être reliés à des gènes, des régions régulatrices, des intervalles candidats, des groupes de population ou des régions associées à des traits. Vous recevez des fichiers de sortie et un rapport de projet qui résument la logique d'analyse, les types de résultats clés, la structure des fichiers et les sorties prêtes pour la visualisation.

    Exigences d'échantillon et informations sur l'intégration du projet

    La qualité de l'échantillon affecte directement l'analyse des SV et des haplotypes à longues lectures. L'ADN de haute masse moléculaire est particulièrement important lorsque le projet dépend de preuves à longues lectures à travers des répétitions, des points de rupture SV ou des régions phasées.

    Les exigences finales en matière d'échantillons dépendent de l'espèce, de la taille du génome, du type d'échantillon, de la plateforme et de l'objectif du projet. Avant la confirmation du projet, notre équipe examine les informations ci-dessous et recommande le flux de travail le plus approprié.

    Type d'échantillon ou d'entrée Ce que nous examinons Orientation qualité Points de contrôle QC typiques Remarques
    ADN génomique à haut poids moléculaire pour l'analyse à longues lectures Intégrité de l'ADN, concentration, pureté, méthode d'extraction, historique de l'échantillon Longs fragments d'ADN, faible dégradation, faible contamination Qubit, NanoDrop, gel, PFGE ou révision de la taille des fragments le cas échéant Meilleur pour les projets qui s'appuient sur des preuves à longues lectures à travers les répétitions, les points de rupture SV ou les régions phasées.
    ADN génomique standard pour le soutien du séquençage génomique à lecture courte Quantité d'ADN, pureté, dégradation, cohérence de l'échantillon Qualité d'entrée stable pour la construction de bibliothèques Qubit, NanoDrop, vérification de gel, contrôle de qualité de la bibliothèque Utile lorsque les données de séquençage à court terme soutiennent une analyse au niveau des cohortes ou hybride.
    Fichiers FASTQ, BAM, CRAM ou VCF existants Format de fichier, source de la plateforme, métadonnées d'échantillon, version du génome de référence Intégrité des fichiers, exhaustivité des métadonnées, compatibilité avec l'analyse prévue Vérification de l'intégrité des fichiers, vérification du format, examen des métadonnées Peut soutenir la réanalyse, l'intégration hybride ou l'interprétation en aval.
    Matériau tissulaire, cellulaire, végétal, microbien ou environnemental Échantillon source, condition de conservation, qualité d'ADN attendue, faisabilité d'extraction Adéquation pour l'extraction d'ADN et le séquençage en aval Inspection d'échantillons, examen de la faisabilité d'extraction, contrôle qualité des entrées après extraction. Le soutien à l'extraction peut être envisagé lorsque la soumission directe d'ADN n'est pas disponible.
    Données existantes de GWAS, QTL, BSA, pan-génome ou de population Conception de l'étude, étiquettes de groupe, régions candidates, version de référence, format des résultats Compatibilité avec SV et interprétation des haplotypes Revue des métadonnées, revue du système de coordonnées, revue du fichier de résultats Aide à relier les résultats de SV et de haplotype avec des questions biologiques en aval.

    Analyse bioinformatique et livrables

    La principale valeur de cette solution ne réside pas uniquement dans la génération de données. La valeur provient de la transformation des preuves de SV et d'haplotype en résultats organisés, réutilisables et interprétables.

    Nous nous concentrons sur les résultats que votre équipe peut réellement utiliser : des fichiers pour réanalyse, des tableaux pour révision, des pistes pour visualisation et des rapports qui expliquent ce qui a été fait.

    Livrables minimums

    • Résumé de la QC des données brutes
    • Distribution de la longueur et de la qualité des lectures
    • Résumé de l'alignement
    • Résumé de la couverture
    • Ensemble d'appels de variantes structurelles
    • table d'annotation SV
    • Résultats de phasage des haplotypes

    Options supplémentaires

    • Analyse axée sur les CNV
    • Comparaison des SV au niveau de la population
    • Comparaison de la fréquence des haplotypes
    • Intégration de GWAS, QTL-seq ou BSA
    • Comparaison du pan-génome
    • Annotation de région candidate

    Types de fichiers de sortie

    • Fichiers FASTQ, BAM ou CRAM le cas échéant
    • Fichiers VCF ou fichiers VCF phasés
    • Fichiers d'annotation au format BED ou GFF
    • Tableaux récapitulatifs TSV ou CSV
    • Pistes du navigateur génomique
    • rapport de projet au format PDF ou HTML

    Comment choisir la bonne stratégie d'analyse des SV et des haplotypes

    Une bonne stratégie commence par la question biologique. Nous vous aidons à décider quelles couches de preuves et quelle profondeur d'analyse sont nécessaires avant de passer à l'exécution du projet.

    Choisissez d'abord la lecture longue lorsque la complexité structurelle est centrale.

    Une stratégie de lecture longue en premier est souvent appropriée lorsque votre projet se concentre sur de grandes insertions, suppressions, inversions, translocations, répétitions, loci complexes ou blocs haplotypiques.

    Choisissez l'analyse hybride lorsque les données de lecture courte existantes peuvent apporter de la valeur.

    Si vous disposez déjà de données de séquençage génomique à lecture courte (WGS), de reséquençage, d'études d'association génétique (GWAS), de QTL ou de BSA, une stratégie hybride peut vous aider à réutiliser les preuves existantes tout en ajoutant un soutien à lecture longue pour les questions de variation structurelle (SV) et de phasage.

    Ajoutez une analyse de la population ou des traits lorsque l'interprétation dépend des groupes.

    Si votre recherche compare des populations, des souches, des cultivars, des familles ou des groupes phénotypiques, l'analyse ne doit pas se limiter à l'appel de SV sur un seul échantillon.

    Ajoutez des bioinformations personnalisées lorsque les sorties standard ne suffisent pas.

    Un fichier VCF standard peut ne pas répondre à votre question de recherche. La bioinformatique personnalisée peut aider à relier les SV et les haplotypes aux gènes, intervalles, annotations fonctionnelles, différences entre groupes ou visualisations prêtes à être présentées.

    Plan d'analyse de la demande

    Conformité / Avertissement

    CD Genomics fournit ce service uniquement à des fins de recherche (RUO). Ce service n'est pas destiné à un diagnostic clinique, à une interprétation médicale directe ou à des tests destinés aux consommateurs.

    Résultats de la démo

    Les résultats de la démonstration aident votre équipe à comprendre à quoi pourrait ressembler l'analyse finale avant de commencer le projet. Ces exemples montrent des types de résultats, et non des conclusions biologiques fixes.

    SV landscape summary across a genome

    Résumé du paysage SV

    Cette sortie résume les suppressions, insertions, inversions, duplications, translocations et CNV à travers les échantillons ou les régions.

    Haplotype block and phased variant view

    Bloc d'haplotype et vue des variants phasés

    Cette sortie montre des variantes phasées à travers une région, vous aidant à voir quelles variantes se produisent ensemble sur le même haplotype.

    Candidate-region interpretation view integrating SVs and gene annotation

    Interprétation intégrée de la région candidate

    Cette sortie combine des appels SV, des variantes phasées, l'annotation des gènes et des signaux de comparaison de groupes dans une seule région.

    FAQ

    1. Qu'est-ce que l'analyse des variants structurels et des haplotypes ?

    L'analyse des variants structurels et des haplotypes identifie de grands changements génomiques et organise les variants par allèle ou contexte génomique lié. Cela peut inclure l'appel de SV, l'analyse des CNV, la révision des points de rupture, le phasage, l'annotation, la visualisation et l'interprétation en aval.

    2. Quand l'analyse des variants uniquement SNP n'est-elle pas suffisante ?

    L'analyse uniquement basée sur les SNP peut être insuffisante lorsque le signal de recherche implique de grandes insertions, des délétions, des inversions, des duplications, des CNV, des translocations, des répétitions ou des motifs spécifiques d'allèles liés. Si une région candidate semble importante mais que les SNP n'expliquent pas le motif, l'analyse des SV et des haplotypes peut être utile.

    3. Pourquoi les longues lectures sont-elles utiles pour la détection des variants structurels ?

    Les longues lectures peuvent couvrir de plus grandes régions génomiques, des séquences répétitives et des points de rupture de variants. Cela les rend utiles pour détecter et résoudre des SV qui peuvent être difficiles à caractériser uniquement avec des courtes lectures.

    4. Quelles sont les différences entre PacBio et Nanopore pour les projets de SV et d'haplotypes ?

    Les flux de travail de type PacBio sont souvent appréciés pour leurs lectures longues précises, tandis que les flux de travail de type Nanopore peuvent fournir des lectures très longues et une forte capacité de couverture. Le meilleur choix dépend de la qualité de l'échantillon, de la complexité du génome, des types de variants cibles, des besoins en longueur de lecture et des objectifs d'analyse en aval.

    5. Cette solution peut-elle fonctionner pour des organismes non-modèles ?

    Oui, de nombreux projets sur des organismes non-modèles sont adaptés, mais la conception du flux de travail est importante. Nous examinons la qualité du génome de référence, la taille du génome, le contenu en répétitions, l'hétérozygotie, la ploïdie et la qualité des échantillons avant de recommander une stratégie.

    6. Quelles informations sur l'échantillon sont nécessaires avant de recommander un flux de travail ?

    Nous avons généralement besoin des espèces, du type d'échantillon, du nombre d'échantillons, de la quantité d'ADN disponible, de la qualité de l'ADN, de l'état du génome de référence, des données de séquençage existantes, des types de variants cibles et de la principale question de recherche.

    7. Quels livrables puis-je attendre ?

    Les livrables peuvent inclure des résumés de contrôle qualité, des fichiers d'alignement, des ensembles d'appels de SV, des sorties de variants phasés, des tables d'annotation, des fichiers prêts pour la visualisation, des pistes pour le navigateur génomique et un rapport de projet. Les sorties optionnelles peuvent inclure des comparaisons de cohortes ou des interprétations de régions candidates.

    8. Les résultats de SV et d'haplotype peuvent-ils être intégrés avec GWAS, QTL-seq, BSA ou l'analyse du pan-génome ?

    Oui. Les résultats de SV et de haplotypes peuvent être liés à des intervalles cartographiés, des régions candidates, des groupes de population, des motifs de présence/absence dans le pan-génome ou des signaux associés aux traits lorsque la conception de l'étude le permet.

    9. Fournissez-vous des sorties prêtes pour la visualisation ?

    Oui. Nous pouvons préparer des figures résumées, des pistes de navigateur génomique, des graphiques au niveau des régions, des résumés de classes de SV, des vues de blocs d'haplotypes et des panneaux de régions candidates lorsque ces résultats sont inclus dans le plan d'analyse.

    10. Comment devrais-je décider entre une solution uniquement de séquençage et une solution d'analyse complète ?

    Le séquençage seul peut suffire si votre équipe dispose déjà d'un pipeline validé et d'un plan d'interprétation clair. Une solution d'analyse complète est plus utile lorsque vous avez besoin d'aide pour la sélection de la plateforme, l'appel de SV, le phasage, l'annotation, la visualisation et l'interprétation biologique en aval.

    Cas de littérature : Découverte de SV à longue lecture et résolution de haplotypes à l'échelle de la population

    Mise en avant de la recherche publiée

    Variation structure chez 1 019 humains divers basée sur le séquençage à longues lectures

    Journal : Nature
    Publié : 2025

    Contexte

    Les projets de génome à l'échelle de la population ont souvent reposé sur des ressources de lectures courtes. Les lectures courtes sont utiles pour de nombreux petits variants, mais elles peuvent ne pas résoudre correctement les variants structurels, les changements médiés par des répétitions et les régions génomiques difficiles. Cela est important car les variants structurels contribuent à la diversité génétique et peuvent façonner l'architecture génomique spécifique à une population.

    Une étude de Nature de 2025 a abordé ce problème en appliquant le séquençage à longues lectures à un large et diversifié cohort génomique. L'étude a utilisé 1 019 échantillons provenant de 26 populations, en faisant un exemple public solide de la manière dont les données à longues lectures peuvent améliorer la construction de ressources SV et l'analyse tenant compte des haplotypes.

    Méthodes

    L'étude a combiné le séquençage à long terme d'Oxford Nanopore avec une analyse basée sur des génomes linéaires et graphiques. Les auteurs ont aligné les lectures contre des références linéaires et graphiques, utilisé la découverte et le génotypage de variations structurelles (SV) sensibles aux graphes, et construit une ressource de variations structurelles à l'échelle de la population.

    L'analyse a également pris en compte la distribution de la population, l'activité des éléments mobiles, les répétitions en tandem de nombre variable multiallélique et l'analyse liée aux haplotypes. Ce design plus large est pertinent pour les équipes de recherche planifiant la génomique des populations, l'analyse de la diversité ou l'interprétation des variants complexes.

    Résultats

    1. L'étude a rapporté plus de 100 000 variants structuraux bialléliques résolus par séquence et a génotypé 300 000 répétitions en tandem à nombre variable multialléliques.
    2. Il a caractérisé des suppressions, des duplications, des insertions et des inversions à travers les populations.
    3. La cohorte comprenait 1 019 génomes provenant de 26 groupes de population auto-déclarés répartis sur cinq zones continentales.
    4. La figure 1 présente le séquençage à longues lectures et le cadre SAGA, y compris la répartition de la population, la couverture de séquence, la longueur des lectures et la découverte et le génotypage des SV sensibles aux graphes.
    5. La Fig. 10 des données étendues se concentre sur la précision du haplotypage ciblé, ce qui est particulièrement pertinent pour les projets où des loci complexes nécessitent une interprétation au niveau des haplotypes.

    Long-read structural variation study framework and population-scale analysis overviewL'analyse à grande échelle par lecture longue peut soutenir la découverte de variations structurelles, le génotypage et l'interprétation tenant compte des haplotypes.

    Conclusion

    Ce cas littéraire soutient un point de décision clé pour les projets SV et haplotypes : les preuves à lecture longue peuvent révéler des variations structurelles et des motifs haplotypiques qui sont difficiles à capturer avec des approches uniquement basées sur les SNP ou les lectures courtes.

    Pour la planification de projet, la leçon est claire. Un projet SV utile ne doit pas se limiter à la séquençage ou à l'appel de variants. Il doit relier la sélection de la plateforme, la révision QC, l'appel de SV, le phasage, l'annotation, la visualisation et la production de rapports prêts à l'interprétation.

    Publications connexes

    Les publications suivantes soutiennent le raisonnement scientifique pour la détection des variants structurels, le phasage des haplotypes, le séquençage à longues lectures et l'interprétation des variants.

    À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
    Services associés
    Demande de devis
    ! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
    Contactez CD Genomics
    Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
    Haut