Séquençage du génome humain entier par PacBio SMRT

CD Genomics propose depuis quelques années un service de resequencement du génome humain précis et abordable. CD Genomics introduit des éléments auparavant cachés. Technologie SMRT de PacBio cela a un grand potentiel d'application dans le resequencement du génome humain. Les longues lectures de molécules uniques révèlent des variants structurels et produisent des informations de phasage direct des variants à travers les blocs haplotype et la méthylation. Cela est très utile pour élargir l'utilité des efforts de médecine de précision visant à améliorer la santé humaine et favorise grandement le développement des maladies génétiques simples, des maladies complexes et des génomes tumoraux humains.

L'introduction du séquençage SMRT PacBio du génome humain entier

Avoir une carte complète des variations génomiques humaines revêt une importance capitale pour une compréhension approfondie des traits génétiques et pour renforcer la recherche précise sur les maladies. Bien que le séquençage à courte lecture puisse détecter de manière fiable de petites variations telles que les SNP (polymorphismes nucléotidiques simples) et les InDels (insertions et délétions), il présente une sensibilité limitée pour identifier les CNV (variations du nombre de copies) et les SV (variations structurelles). Au cours des dernières années, séquençage à lecture longue a gagné une utilisation répandue dans la recherche génomique humaine. Cette technique déchiffre efficacement des structures génomiques complexes, y compris des régions géniques hautement répétitives et des variations structurelles du génome, ce qui offre une perspective génomique plus complète dans la quête de variations associées aux maladies. La haute précision de séquençage à lecture longue permet de découvrir des variations rares que le séquençage à court terme pourrait manquer, fournissant ainsi des informations plus précises sur les variations génétiques, un élément essentiel pour la médecine de précision et sa recherche fondamentale.

Le séquençage du génome humain par Pacific Biosciences, utilisant la technologie de séquençage à molécule unique en temps réel (PacBio SMRT), est une technologie d'analyse génomique avancée intégrant la technologie propriétaire. séquençage SMRT l'approche développée par Pacific Biosciences. Cette technologie se distingue par sa capacité à générer des longueurs de lecture étendues, à démontrer une grande précision de séquence et à offrir une détection directe des modifications épigénétiques, permettant ainsi une analyse complète et approfondie du génome humain. Remarquablement, Séquençage SMRT de PacBio est capable de générer des lectures extraordinairement longues qui varient généralement de 10 à 15 kilobases (kb), et dans certains cas, dépassent même cette longueur. Cette caractéristique s'avère particulièrement bénéfique pour déchiffrer des structures génomiques complexes, telles que des régions caractérisées par un degré élevé de répétition de séquences ou de variation structurelle.

CD Genomics emploie maintenant Séquençage SMRT de PacBio pour réaliser une analyse complète des génomes humains entiers. Avec la capacité d'effectuer séquençage du génome entier à travers divers échantillons individuels et de population, suivis d'une analyse bioinformatique approfondie à ces deux niveaux, cette méthode ouvre la voie à une large exploration des variations génomiques. Ces variations incluent les polymorphismes nucléotidiques uniques (SNP), les insertions et les délétions (InDels), les variations du nombre de copies (CNVs) et les variations structurelles (SVs). Les aperçus génomiques intimes dérivés de cette exploration directe et extensive sont indispensables pour identifier à la fois les gènes pathogènes et de susceptibilité, ainsi que pour comprendre les mécanismes sous-jacents au début de la maladie et aux schémas d'hérédité.

Avantages du séquençage du génome humain entier par PacBio SMRT

  • Long-reads. Ils sont bénéfiques pour l'extraction d'informations variées sur l'ensemble du génome, l'analyse précise des variants structurels chromosomiques (SV) et des gènes de fusion.
  • Pas d'amplification PCR. Évitant efficacement le biais d'amplification et permettant de couvrir facilement des régions à forte teneur en GC et à forte répétition de séquences, afin d'assurer l'intégrité et l'homogénéité de la couverture génomique.
  • Détecte directement les modifications épigénétiques en mesurant la variation cinétique lors de l'incorporation des bases.

Application du séquençage SMRT PacBio du génome humain entier

1. Détection de SV

Les SV représentent des réarrangements génomiques (typiquement définis comme étant plus longs que 50 pb), et les SV peuvent jouer des rôles importants dans les maladies humaines, l'évolution et la diversité génétique. De nombreuses maladies héréditaires et cancers ont été associés à un grand nombre de SV ces dernières années. Il y a eu des progrès considérables dans la détection des variants de nucléotides uniques (SNV) au cours du dernier quart de siècle, mais les variants structurels de taille intermédiaire (de 50 pb à 50 kb) restent un défi avec les lectures courtes. Séquençage de l'ADNLa longueur de lecture la plus longue des séquences PacBio SMRT est de 40 à 70 K, ce qui peut facilement couvrir les zones de haute répétition et de forte hétérozygotie, offrant la possibilité de détecter des variations structurelles (SV).

2. Génotypage des haplotypes

Un haplotype (génotype haploïde) est un groupe d'allèles chez un organisme qui est hérité ensemble d'un seul parent. génotypage Le gène haplotypique est important ; par exemple, le résultat de la transplantation de moelle osseuse d'un donneur non apparenté est influencé par la correspondance entre le donneur et le receveur pour les HLA. Les lectures longues de PacBio peuvent couvrir plusieurs nucléotides simples et variantes structurelles, ce qui permet de regrouper directement les variantes en haplotypes.

3. Méthylation de l'ADN

La méthylation de l'ADN est un processus par lequel des groupes méthyle sont ajoutés à la molécule d'ADN. Elle est essentielle au développement normal et est associée à un certain nombre de processus clés, notamment l'empreinte génomique, l'inactivation du chromosome X, la répression des éléments transposables, le vieillissement et la carcinogenèse. Il existe plusieurs méthodes pour détecter la méthylation de l'ADN, y compris séquençage bisulfite de tout le génome (WGBS), Séquençage par immunoprécipitation de l'ADN méthylé (MeDIP) et ainsi de suite. Mais ces méthodes sont difficiles à mettre en œuvre expérimentalement.

Bien que la plateforme PacBio puisse décrire la détection directe de la méthylation de l'ADN, sans conversion au bisulfite, en fonction de la différence dans l'intervalle des signaux de pulsation de fluorescence. De plus, le séquençage à longues lectures permet une évaluation plus approfondie de la méthylation des CpG régionaux et augmente la capacité d'étudier la relation entre les variantes nucléotidiques simples phasées et la méthylation des CpG spécifique à l'allèle.

Flux de travail de séquençage du génome humain entier avec PacBio SMRT

Workflow Diagram of Human Whole Genome PacBio SMRT Sequencing.

Spécification de service

Exigences d'échantillon
  • Quantité d'ADN : ≥ 3 μg, Concentration ≥ 80 ng/µL
  • Pureté de l'ADN : OD260/280 = 1,8 ~ 2,0 sans dégradation ni contamination par l'ARN.
Stratégie de séquençage
  • Bibliothèque de 20 Ko
  • ≥ 10X profondeur de couverture du génome
Analyse bioinformatique
CD Genomics propose des services d'analyse de données statistiques et bioinformatiques sur :
  • Détection SV
  • Génotypage de haplotypes
  • Méthylation de l'ADN
  • services de bioinformatique personnalisés

Pipeline d'analyse

The Data Analysis Pipeline of Human Whole Genome PacBio SMRT Sequencing.

Livrables

  • Les données de séquençage originales
  • Résultats expérimentaux
  • Rapport d'analyse des données
  • Détails sur le séquençage du génome humain entier PacBio SMRT pour votre rédaction (personnalisation)

CD Genomics propose un package complet de services de reséquençage du génome entier comprenant la standardisation des échantillons, la construction de bibliothèques, le séquençage approfondi, le contrôle de qualité des données brutes, et bioinformatique analyse. Nous pouvons adapter ce pipeline à vos intérêts de recherche. Si vous avez des exigences supplémentaires ou des questions, n'hésitez pas à nous contacter.

The Human Whole Genome PacBio SMRT Sequencing Results Display Figure.

1. Quelle est la profondeur du resequencement du génome humain complet ?

La profondeur de séquençage est déterminée par l'objectif de recherche, le nombre d'échantillons et vos besoins. La profondeur générale de la reséquençage du génome humain est de 30X. Pour la détection des variations germinales, nous recommandons une profondeur de séquençage de 30-50X, comme pour les recherches sur les maladies à gène unique. Pour les études de population avec plusieurs échantillons, si vous vous concentrez sur les SNP, une profondeur de séquençage de 10X est suffisante. Si vous vous concentrez sur les variations structurelles dans les tissus cancéreux, nous recommandons une profondeur de séquençage supérieure à 50X.

2. Quelles méthodes peuvent être utilisées pour valider les résultats ?

Reséquençage du génome complet peut détecter différents types de variations génétiques, y compris les SNP, InDel, SV et CNV.

  • Amplification et séquençage par PCR ou Génotypage SNP peut être utilisé pour valider les SNPs.
  • amplification PCR et Séquençage de Sanger peut être utilisé pour valider des InDels de courts fragments.
  • La PCR en temps réel est utile pour valider les CNV.
  • Les SVs à petite échelle peuvent être validés par amplification PCR et séquençage, tandis que les SVs à grande échelle doivent être validés par observation microscopique, comme le FISH.

3. Quels sont les avantages du séquençage du génome entier de troisième génération par rapport au séquençage du génome entier de deuxième génération ?

En contraste avec la deuxième génération séquençage du génome entier, qui utilise une construction de bibliothèque impliquant des fragments d'ADN d'environ 350 paires de bases (pb) et emploie une approche de séquençage à extrémités appariées de 150 (PE150), le séquençage du génome entier de troisième génération traite généralement des fragments de plus de 10 kilobases (Kb), avec la capacité de s'étendre jusqu'à plusieurs mégabases (Mb). Cette caractéristique confère des avantages particuliers dans la détection des variations structurelles de grands segments et des variations dans des régions complexes. De plus, le séquençage du génome entier de troisième génération élimine le besoin d'amplification par PCR, permettant ainsi l'extraction simultanée des informations de méthylation.

4. Pourquoi utiliser le séquençage à longues lectures pour détecter les variations structurelles (SV) ?

des méthodes efficaces pour identifier et génotyper les variants structurels (SV) est primordial. technologies de séquençage à lecture longue initier de nouvelles enquêtes sur les structures SV et réaliser des analyses sur la détection des SV dans la population humaine est primordial pour comprendre les maladies liées aux SV.

5. Comment le contrôle de la qualité des données est-il effectué ?

Le contrôle de la qualité des données implique plusieurs étapes pour garantir la haute qualité des données de séquençage :

  • Évaluation de la distribution de la longueur des lectures : Inspection de la distribution de la longueur des lectures générées pour s'assurer qu'elle répond aux attentes.
  • Évaluation du taux d'erreur : Évaluation des taux d'erreur de séquençage à l'aide de séquences de contrôle internes ou de génomes de référence.
  • Évaluation de la couverture : Examen de la profondeur et de l'uniformité de la couverture génomique pour garantir une couverture de données suffisante.

6. Comment sélectionner la profondeur de séquençage appropriée ?

Le choix de la profondeur de séquençage dépend des exigences et des objectifs spécifiques de l'étude :

  • Assemblage du génome entier : nécessite généralement une profondeur de couverture plus élevée pour garantir l'intégrité et la précision de l'assemblage.
  • Détection de variantes : Une profondeur de couverture modérée peut être suffisante pour détecter les SNPs et les InDels, mais la détection des CNVs et des SVs peut nécessiter une couverture plus élevée.
  • Analyse des modifications épigénétiques : La profondeur de couverture doit être suffisamment élevée pour garantir la détection fiable des signaux de modification.

Détection d'une variante d'insertion longue dans SAMD12 par séquençage SMRT : implications du séquençage du génome entier par lectures longues pour les maladies d'expansion de répétitions

Journal : Journal de génétique humaine
Facteur d'impact : 5,881
Publié : 17 décembre 2018

Contexte

Lecture courte séquençage de nouvelle génération (NGS) est largement utilisé dans la recherche médicale et les tests génétiques pour détecter les variants pathogènes à un seul nucléotide et les petites insertions et suppressions (indels). Cependant, cette technologie peut manquer des variations structurelles (SV) s'étendant sur des centaines à des dizaines de milliers de paires de bases. Technologie de séquençage à lecture longue offre la promesse de détecter de manière fiable de nouveaux SV. BAFME, une maladie neurologique autosomique dominante caractérisée par un myoclonus tremblant et des crises rares, est associée à des expansions de répétitions dans le SAMD12 gène. Séquençage SMRT de PacBiocapable de lire des ADN de plus de 10 kb, a le potentiel de couvrir entièrement le SAMD12 expansion de répétition. Longue lecture séquençage du génome entier L'utilisation de PacBio peut être utile pour détecter des SV pathogènes connus et nouveaux, même avec une faible couverture.

Méthodes

Préparation des échantillons :
  • Cinq membres de la famille avec BAFME
  • Leucocytes du sang périphérique
  • Extraction d'ADN génomique
Séquençage :
  • Préparation de la bibliothèque SMRTbell
  • séquençage SMRT
  • Kit de séquençage Sequel 2.0.
Analyse de données:
  • Module d'analyse SMRT
  • Analyse par Southern blot
  • Analyse de diagramme de points

Résultats

Dans une famille japonaise de quatre générations touchée par le BAFME, une variante structurelle (SV) hétérozygote au niveau de la SAMD12 Une région de répétition intronique a été identifiée chez l'individu affecté, ce qui est cohérent avec des études précédentes. La taille de l'expansion de répétition était similaire entre les individus après passage germinal paternel. Le séquençage PacBio SMRT a pu couvrir entièrement la longueur de répétition de 4 kb observée. Le séquençage du génome entier (WGS) par longues lectures utilisant le système Pacbio Sequel a révélé de nombreuses insertions et délétions, y compris six SV spécifiques à l'individu affecté dans la région liée à BAFME1. Une insertion notable de 4661 pb a été identifiée entre les séquences répétitives AluSq2 et (TAAAA)n. L'analyse a montré que cette insertion comprenait une séquence nouvelle plutôt qu'une duplication en tandem, avec une proportion élevée de séquences à faible complexité.

Fig 1. Pedigree of a family harboring pathogenic structural variations in SAMD12. (Mizuguchi et al., 2019)Fig 1. Pédigrée d'une famille avec une variation structurelle pathogène de SAMD12.

Fig 2. Assessment of long-read whole-genome sequencing. (Mizuguchi et al., 2019)Fig 2. Évaluation du séquençage génomique à lecture longue.

Conclusion

Le séquençage à lecture longue permet désormais de lire l'ADN sur plus de 10 kb, ce qui permet de détecter de grandes variations structurelles. Les auteurs ont appliqué le séquençage PacBio SMRT à une famille atteinte d'épilepsie myoclonique familiale bénigne de l'adulte, identifiant six variations structurelles dans une région BAFME1 de 7,16 Mb et confirmant une variation de 4,6 kb. SAMD12 La répétition de l'insertion est causale. Le séquençage génomique à lecture longue offre des perspectives prometteuses pour une analyse complète des variations structurelles et la découverte de nouveaux variants causant des maladies dans des conditions non diagnostiquées.

Référence :

  1. Mizuguchi T, Toyota T, Adachi H, et al.Détection d'une variante d'insertion longue dans SAMD12 par séquençage SMRT : implications du séquençage du génome entier par lectures longues pour les maladies d'expansion de répétitions. Journal de génétique humaine2019, 64(3) : 191-7.

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Les communautés bactériennes de Cassiopea dans les Keys de Floride partagent des taxons bactériens majeurs avec les microbiomes coralliens.

Journal : bioRxiv

Année : 2024

Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique à traduire, veuillez le fournir ici.

Production d'une protéine semblable à une bactériocine PEG 446 à partir de Clostridium tyrobutyricum NRRL B-67062

Journal : Probiotiques et Protéines Antimicrobiennes

Année : 2024

Désolé, je ne peux pas accéder aux liens ou aux contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici.

Démêler le rôle des pathobiontes des espèces de Bacteroides dans les maladies inflammatoires de l'intestin

Journal : bioRxiv

Année : 2023

Désolé, je ne peux pas accéder à des liens externes.

Une ressource génomique au niveau des chromosomes pour étudier les mécanismes de virulence et l'évolution du pathogène de la rouille du café Hemileia vastatrix.

Journal : bioRxiv

Année : 2022

Je suis désolé, mais je ne peux pas accéder à des liens ou à des contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Streptomyces buecherae sp. nov., un actinomycète isolé de plusieurs espèces de chauves-souris

Journal : Antonie Van Leeuwenhoek

Année : 2020

Je suis désolé, mais je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.

Voir plus articles publiés par nos clients.

À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Ressources en vedette
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut