Alors que la biologie moléculaire continue de progresser, les technologies génétiques subissent des mises à jour et des améliorations constantes. En 1977, l'invention par Sanger de la méthode de terminaison de chaîne par didésoxy a marqué une étape importante dans le domaine du séquençage, annonçant une nouvelle ère dans l'analyse des acides nucléiques et ouvrant l'ère de l'automatisation pour le séquençage génétique. Par la suite, l'émergence des technologies de séquençage de deuxième génération, telles que Séquençage de nouvelle génération (NGS), a encore amélioré l'efficacité et les capacités des techniques de séquençage.
Confrontés à d'énormes quantités d'informations génétiques semblables aux étoiles scintillantes dans le ciel nocturne, la complexité de l'hérédité génétique pose des défis significatifs. Tout en exploitant la puissance de la technologie NGS, garantir la qualité du séquençage NGS est devenu un enjeu impératif qui nécessite notre attention immédiate.
Dans cet article, nous explorons l'importance de la validation NGS, le flux de travail de la confirmation NGS et les raisons pour lesquelles la validation est impérative dans l'analyse génomique.
La validation des NGS est l'évaluation systématique de l'exactitude, de la précision et de la fiabilité des tests et des plateformes NGS. Ce processus implique des tests approfondis pour garantir la cohérence et la reproductibilité des résultats produits par les technologies NGS. La validation englobe une gamme de paramètres, y compris la sensibilité analytique, la spécificité, la précision et l'exactitude.
La sensibilité analytique désigne la capacité d'un test NGS à identifier de véritables variantes positives, en particulier celles existant à de faibles fréquences alléliques. En revanche, la spécificité analytique se rapporte à la capacité du test à discerner avec précision les résultats négatifs réels tout en réduisant les faux positifs.
La précision quantifie l'étendue de la reproductibilité ou de la répétabilité des résultats au sein d'un seul essai ou à travers plusieurs essais. En revanche, l'exactitude délimite le degré auquel les données NGS produites s'alignent avec la séquence génomique authentique.
Le flux de travail pour la confirmation dans NGS s'avère essentiel pour préserver la fiabilité et la précision des données génomiques accumulées à partir des plateformes NGS. Ce processus complexe comprend plusieurs phases visant à vérifier les variants détectés en utilisant des méthodologies complémentaires, telles que Séquençage de SangerLe discours suivant examine plus en détail les différentes étapes du flux de travail de confirmation NGS :
Commencer par l'identification des variantes par NGSCes plateformes déploient des technologies de séquençage avancées et à haut débit qui produisent d'énormes quantités de données de séquençage extraites d'échantillons d'ADN génomique. Cette phase naissante dans le flux de travail de confirmation englobe l'identification des variants, où le déploiement d'instruments bioinformatiques est essentiel pour examiner les profuses données brutes de séquençage et discerner les variations génétiques, y compris les SNV, les insertions, les suppressions et les déviations structurelles.
Ce processus englobe l'alignement des interprétations de séquençage sur un génome de référence, la distinction des variants et les commentaires sur leurs connotations fonctionnelles et cliniques.
Pas toutes les variantes détectées par NGS nécessiter une validation par des approches orthogonales. Les variants dépassant les critères de qualité prédéfinis, y compris la profondeur de couverture, la fréquence allélique des variants et la précision de l'appel des variants, peuvent être considérés comme robustes et exemptés de procédures de confirmation. Néanmoins, les variants ne répondant pas à ces normes de qualité ou ayant une pertinence clinique peuvent nécessiter une validation supplémentaire par des tests de confirmation, tels que Séquençage de Sanger.
Séquençage de Sanger, communément appelé séquençage par terminaison de chaîne, est une technique classique de séquençage de l'ADN considérée comme la référence pour corroborer les variants génétiques identifiés par NGSAu cours de la phase de validation, les segments ciblés contenant les variants identifiés subissent une amplification par PCR en utilisant des amorces adaptées à cet effet. Par la suite, les fragments amplifiés sont soumis à un séquençage Sanger, où l'incorporation de didéoxynucléotides terminant la chaîne facilite le séquençage des fragments d'ADN individuels. Les données de séquençage résultantes font l'objet d'une analyse minutieuse pour déchiffrer la séquence de nucléotides, confirmant ainsi l'existence du variant pertinent.
À l'issue de Séquençage de Sanger, les données résultantes sont comparées avec l'original. NGS ensemble de données pour évaluer la concordance. Toute incohérence entre ces ensembles de données fait l'objet d'un examen approfondi afin de déterminer la précision des identifications de variants NGS. La confirmation du variant par séquençage Sanger renforce la confiance dans la fidélité des résultats NGS. En revanche, les résultats discrepants incitent à une enquête plus approfondie pour élucider les facteurs potentiels tels que les erreurs de séquençage, les anomalies d'alignement ou la contamination des échantillons.
En respectant méticuleusement le protocole de confirmation NGS, les laboratoires préservent l'intégrité et la précision des données génomiques provenant des plateformes NGS. Ce régime de validation minutieux joue un rôle essentiel dans le soutien à la prise de décision clinique, la définition d'approches thérapeutiques personnalisées et le maintien des normes les plus élevées en matière de soins aux patients.
Malgré l'adoption généralisée et le perfectionnement continu des procédures standard pour NGSLa validation des performances reste une étape indispensable. Cela est principalement dû au fait que la validation des performances garantit l'exactitude, la fiabilité et la cohérence du NGS dans les applications pratiques, protégeant ainsi la qualité et la sécurité des diagnostics cliniques et des traitements.
L'implémentation de NGS la technologie n'est pas seulement contrainte par des facteurs tels que la compétence du personnel, les conditions de laboratoire, la qualité des instruments et des réactifs, et la standardisation des procédures opérationnelles, mais elle est également sujette à l'introduction d'erreurs à chaque étape en raison de l'inclusion de nombreuses étapes, influençant ainsi de manière significative les résultats de détection finaux. Plus précisément, les problèmes potentiels peuvent inclure :
Compte tenu des raisons mentionnées ci-dessus, différents processus et laboratoires présentent souvent certaines disparités dans la qualité du séquençage et les résultats de l'analyse des informations lors de l'implémentation de la technologie NGS. Par conséquent, dans les applications pratiques, un contrôle rigoureux de la qualité opérationnelle à chaque étape est impératif pour garantir l'exactitude et la fiabilité des données.
La capacité de NGS Les tests visant à identifier des variantes d'importance clinique significative, ainsi que celles dont la signification clinique reste incertaine, nécessitent des variations notables dans les exigences de validation clinique pour chaque variante. De plus, l'utilité principale attendue des tests NGS se concentre sur des cohortes de patients spécifiques, des médicaments ou des domaines de maladies. Cependant, comme le montrent les résultats de recherche du programme d'analyse moléculaire pour le choix de thérapie (MATCH) de l'Institut national du cancer, la sélection des thérapeutiques ou des agents pour le traitement devrait être basée sur des résultats moléculaires spécifiques révélés par une analyse NGS ciblée, plutôt que de se fier uniquement à la classification par type de cancer.
L'avancement rapide des techniques d'enrichissement ciblé et NGS a profondément transformé les tests de diagnostic clinique. Il permet l'analyse simultanée de tous les gènes impliqués dans les phénotypes de maladie à un coût inférieur, surpassant le séquençage par électrophorèse capillaire conventionnelle, devenant ainsi la méthode privilégiée pour la plupart des laboratoires de diagnostic à haut débit. Panneaux NGS ciblés sont devenues la méthode de détection de première ligne pour divers troubles génétiques. Avec l'adoption généralisée du séquençage de nouvelle génération (NGS), de nombreux laboratoires de diagnostic ont introduit des panels pour les gènes de susceptibilité au cancer héréditaire, capables de détecter divers gènes caractéristiques associés au cancer héréditaire.
Il existe de nombreux panels disponibles pour tester les mutations génétiques connues associées au cancer héréditaire. L'exactitude de ces tests peut être influencée par divers facteurs, notamment les plateformes d'enrichissement ciblé, les technologies de séquençage, les flux de travail bioinformatiques utilisés et l'expertise dans l'interprétation des variants.
Fidèles à leur engagement envers l'exactitude et la fiabilité des données génomiques provenant de NGS technologies, des entités estimées telles que les Centers for Disease Control and Prevention (CDC), l'American College of Medical Genetics and Genomics (ACMG) et l'American Society for Clinical Pathology (ASCP) ont collectivement établi un ensemble de directives méticuleuses. Ces instructions normatives concernent la validation efficace des méthodologies NGS, la surveillance diligente des processus analytiques, ainsi que le rapport complet des variants identifiés. Par rapport aux méthodes de détection moléculaire conventionnelles, les tests cliniques via NGS posent généralement des aspects significativement complexes, soulignant ainsi la nécessité critique de processus de validation robustes pour les résultats dérivés du NGS.
Dans une époque progressivement marquée par la médecine de précision et les thérapies personnalisées, le test génétique assume un rôle essentiel dans l'orientation des stratégies thérapeutiques subséquentes adaptées aux besoins d'un patient individuel. La pertinence et l'exactitude de ces résultats diagnostiques offrent aux cliniciens des preuves convaincantes pour informer la sélection des patients les mieux adaptés à des stratégies de traitement spécifiques, augmentant ainsi l'efficacité des traitements. Malgré les avantages appréciables inhérents au NGS - notamment sa capacité à identifier une vaste gamme de variations au sein du génome humain - il reste néanmoins déficient dans l'accomplissement de la validation et de l'examen individuels pour chaque variation proposée. Étant donné les hétérogénéités dans les critères de sélection à travers diverses entités pathologiques, ce manque rend NGS la technologie quelque peu inadéquate pour fournir des conseils thérapeutiques précis lors de scénarios cliniques critiques et non reproductibles nécessitant une urgence.
Vous pourriez être intéressé par
En savoir plus
Le séquençage de nouvelle génération, également connu sous le nom de séquençage à haut débit, a évolué à partir des technologies de séquençage de l'ADN basées sur la PCR et les puces à ADN.
Le séquençage de deuxième génération a introduit une terminaison réversible aux extrémités, permettant ainsi le séquençage par synthèse. Dans le séquençage de deuxième génération, la séquence d'ADN est déterminée en capturant les étiquettes spéciales (généralement des marqueurs moléculaires fluorescents) portées par les bases nouvellement ajoutées lors du processus de réplication de l'ADN. Les plateformes technologiques existantes incluent principalement le Roche 454 FLX et l'Illumina Miseq/Hiseq.
Dans le séquençage de deuxième génération, des molécules d'ADN individuelles doivent être amplifiées en grappes de gènes composées d'ADN identique, puis subir une réplication synchrone pour augmenter l'intensité du signal de fluorescence afin de lire la séquence d'ADN. À mesure que la longueur de lecture augmente, la synergie de la réplication des grappes de gènes diminue, entraînant une baisse de la qualité du séquençage des bases. Cela limite strictement la longueur de lecture du séquençage de deuxième génération (ne dépassant pas 500 pb), lui conférant ainsi les caractéristiques d'un haut débit et d'une courte longueur de lecture.
la méthode de séquençage par terminaison de chaîne dideoxy de Sanger, qui est la méthode dominante du séquençage de première génération, souvent appelée Séquençage de SangerDans quatre systèmes de réaction de synthèse d'ADN, une certaine proportion de ddNTP étiquetés avec des isotopes radioactifs efficaces est ajoutée (la technologie des ddNTP étiquetés et la technologie de détection correspondante s'améliorent et évoluent également en continu). Grâce à l'électrophorèse sur gel et à l'autoradiographie, la séquence d'ADN de la molécule test peut être déterminée en fonction de la position de la bande électrophorétique.
Séquençage de Sanger il est simple à utiliser, mature dans sa méthode, avec une longueur de lecture plus longue et une précision extrêmement élevée. C'est la référence en matière de séquençage et la norme internationale pour l'analyse des séquences génétiques. La technologie de séquençage à grande échelle utilisée dans le Projet Génome Humain (PGH), proposé en 1985 et lancé officiellement en 1990, est basée sur la méthode de Sanger.
Le séquençage Sanger pour la validation du NGS peut efficacement surveiller la qualité des données NGS et atteindre une complémentation et une amélioration techniques.
Résultats de la validation des variants de séquençage de nouvelle génération (NGS) par séquençage Sanger. Les bases vérifiées sont mises en évidence en noir (A) variant homozygote du gène PRNP Val129Met. (B) Variant hétérozygote dans le gène FGA Thr331Ala. (Zuzana Chyra Kufova et al., 2018)
L'article suivant se penche principalement sur les problèmes d'exactitude et de fiabilité concernant les résultats de détection du cancer héréditaire à travers NGS la technologie. Elle examine les circonstances dans lesquelles des résultats variant obtenus par séquençage NGS nécessitent une confirmation supplémentaire par Séquençage de Sanger.
Titre : La confirmation par Sanger est nécessaire pour atteindre une sensibilité et une spécificité optimales dans les tests de panels de séquençage de nouvelle génération.
Q : Quels types de variants ont été soumis au séquençage Sanger dans l'étude ?
Dans cette étude, Séquençage de Sanger a été réalisée pour toutes les variantes non polymorphiques, totalisant 7845. Parmi celles-ci, 1,3 % ont été identifiées comme NGS faux positifs, principalement situés dans des régions génomiques complexes telles que les régions riches en AT, les régions riches en GC, les séquences de répétition de nucléotides uniques et les régions de pseudogènes. La validation des résultats expérimentaux a été réalisée en simulant un seuil de score de qualité de faux positifs à zéro, ce qui a révélé une réduction des taux de faux positifs mais aussi une diminution de la sensibilité. Par conséquent, pour maintenir la plus haute sensibilité et spécificité, la confirmation par séquençage Sanger des variants identifiés par NGS est nécessaire.
Q : Quand la validation du séquençage Sanger est-elle nécessaire pendant Test de panel NGS?
Séquençage de Sanger la validation est justifiée lorsque des variants non polymorphes sont détectés par NGS ne pas répondre aux seuils de qualité conservateurs, tels que la couverture minimale et le rapport d'hétérozygotie, pour le reporting. De plus, dans des régions complexes telles que les régions riches en AT, les régions riches en GC, les séquences de répétition de nucléotides uniques et les régions de pseudogènes, la confirmation par Sanger est recommandée pour améliorer la sensibilité et la spécificité.
Q : Comment définir des seuils de qualité appropriés pour les tests de panneaux NGS ?
Tout d'abord, en ce qui concerne la couverture, garantir une couverture minimale de 100x est essentiel pour garantir l'exactitude et la fiabilité des résultats de détection. Une telle couverture répond adéquatement aux exigences de détection et réduit le risque d'erreurs résultant d'une couverture insuffisante.
Deuxièmement, en ce qui concerne le ratio d'hétérozygotie, pour les variants avec une hétérozygotie plus élevée, il est conseillé de réduire modérément le seuil pour le ratio d'hétérozygotie. Par exemple, fixer le ratio d'hétérozygotie à 40 % ou plus aide à capturer plus d'informations sur les variants, améliorant ainsi la sensibilité de détection.
De plus, lors de la sélection des régions génomiques, il est recommandé d'appliquer des seuils de qualité plus élevés pour certaines régions génomiques complexes telles que les régions riches en AT, les régions riches en GC, les séquences de répétition de nucléotides uniques et les régions de pseudogènes. Cela aide à améliorer la sensibilité et la spécificité de détection tout en réduisant les interférences et les erreurs de jugement résultant des caractéristiques spécifiques aux régions.
Il est important de noter que les seuils mentionnés ci-dessus sont basés sur des conclusions empiriques dérivées d'un vaste ensemble de données et ne constituent pas des normes immuables. Dans les applications pratiques, il est nécessaire d'avoir une flexibilité pour ajuster et optimiser ces seuils en fonction des caractéristiques spécifiques des échantillons, des conditions expérimentales et des exigences de détection afin d'assurer l'exactitude et la fiabilité des résultats de détection.
Le processus de base de Séquençage de Sanger comprend : d'abord, accumuler une quantité suffisante de fragments d'ADN de la région cible par PCR conventionnelle ; ensuite, utiliser les fragments d'ADN résultants comme modèles pour l'amplification avec des ddNTPs afin de produire une série de fragments d'ADN simple brin de longueurs variées ; enfin, le séquençage est effectué. Il est évident que la précision de l'amplification PCR influence directement les résultats de séquençage finaux. Toute déviation lors de l'étape initiale d'amplification PCR peut conduire à des résultats de séquençage inexacts. Les principaux facteurs affectant la précision des résultats PCR sont la spécificité et la précision des amorces d'amplification, soulignant l'importance cruciale de la conception des amorces.
En général, la conception des amorces doit respecter les principes suivants :
La longueur des amorces est généralement comprise entre 18 et 27 pb ; des amorces excessivement longues peuvent entraîner des températures d'extension dépassant 74 °C, ce qui n'est pas adapté aux réactions de la polymérase ADN Taq.
(2) La teneur en GC des amorces est généralement comprise entre 40 % et 60 %, avec une plage optimale de 45 à 55 %. Une teneur en GC trop élevée ou trop basse est défavorable au déclenchement des réactions. La teneur en GC et les valeurs de Tm des amorces en amont et en aval doivent être proches, la valeur de Tm ne devant généralement pas dépasser 5 °C.
(3) L'extrémité 3' du primer ne contient généralement pas de base A et ne doit pas contenir plus de trois bases consécutives, telles que GGG ou CCC, ce qui pourrait entraîner un échec de la réaction PCR.
(4) Les bases de l'amorce sont de préférence réparties de manière aléatoire, et il ne devrait pas y avoir quatre bases complémentaires consécutives entre l'amorce elle-même et entre les amorces.
(5) Utilisez la récupération PCR in silico UCSC pour confirmer la spécificité des amorces.
(6) La distance entre la position chromosomique du primer et le site de détection doit être comprise entre 80 pb et 800 pb.
En abordant les cas où Séquençage de Sanger les résultats divergent de ceux obtenus par NGS séquençage, suite à une validation préliminaire de la fiabilité des données de séquençage NGS, notre recommandation principale est de procéder à une vérification approfondie de la spécificité des amorces utilisées dans le séquençage Sanger. Grâce à un examen minutieux des données NGS, il est impératif de vérifier si les sites de liaison des amorces d'amplification Sanger contiennent des SNV, car ces variantes peuvent interférer avec le processus d'amplification et entraîner des disparités entre les résultats. Si de tels sites variant sont identifiés, il devient nécessaire de redessiner des amorces spécifiques à l'échantillon en question pour rectifier l'incohérence entre les résultats de séquençage Sanger et NGS.
En effet, à part de rares cas où les mutations SNV entraînent des anomalies Séquençage de Sanger Les résultats montrent que le corps humain abrite une vaste gamme de sites SNP. Ces sites SNP, abondants dans le génome, représentent la forme la plus répandue de variation héréditaire chez les humains, englobant plus de 90 % des polymorphismes connus. Dans des scénarios typiques, il peut exister un site SNP pour cinq cents à mille paires de bases, avec un nombre total dépassant trois millions. Ainsi, la présence de ces sites SNP dans les séquences d'amorces peut également induire des biais d'amplification, compromettant ainsi l'exactitude des résultats de séquençage. Dans l'ensemble, le problème des biais de liaison des amorces dans le séquençage Sanger pourrait être répandu et mérite une attention considérable.
Par conséquent, lors de la conception des amorces Sanger, il est nécessaire de faire un effort conscient pour éviter proactivement les sites SNV et SNP potentiels. Pour contourner les sites SNP, il est conseillé de consulter le site UCSC pour vérifier la présence de tels sites dans les séquences d'amorces. En cas de discordance entre Sanger et NGS Lors de l'analyse des résultats de séquençage, une attention particulière doit être portée sur l'alignement des amorces avec les régions SNV.
Il est à noter que même la technique de détection Sanger, reconnue comme le "standard d'or", peut, dans des cas extrêmement rares, donner des résultats faussement positifs et faussement négatifs. Bien que de tels cas soient peu fréquents, ils nécessitent notre plus grande vigilance. Ainsi, en pratique, aucune technique de détection n'est parfaite. Pour garantir l'exactitude et la fiabilité de la détection des variants, il est conseillé d'employer un ensemble complémentaire de méthodologies de détection afin de traiter collectivement les problèmes et de poursuivre la représentation la plus authentique des occurrences de variants.
Références :