Qu'est-ce que le séquençage de novo du génome complet des plantes et des animaux ?
Séquençage de novo du génome entier des plantes et des animaux fait référence à l'assemblage d'un génome complet sans s'appuyer sur une séquence de référence existante. Cette approche est essentielle lorsqu'on travaille avec des espèces qui n'ont pas de génome de référence, qui ont des génomes mal assemblés, ou qui présentent des caractéristiques génomiques complexes telles qu'une forte hétérozygotie, la polyploïdie ou des régions répétitives étendues.
Au lieu d'aligner les lectures de séquençage à un génome connu, l'assemblage de novo reconstruit le génome à partir de zéro—comme résoudre un énorme puzzle en utilisant uniquement les fragments de séquence générés par des plateformes de séquençage à haut débit. Le résultat est un plan génétique haute résolution qui peut être utilisé pour l'annotation fonctionnelle, l'analyse comparative, le croisement moléculaire et les études évolutives.
Chez CD Genomics, nous proposons des services de séquençage de novo de bout en bout pour une large gamme d'espèces végétales et animales. En intégrant des lectures courtes Illumina, des lectures longues PacBio HiFi, des lectures ultra-longues Nanopore et des données d'interaction de chromatine Hi-C, nous livrons assemblages de génomes au niveau des chromosomes prêt pour la recherche en aval et la publication.
Quand devriez-vous utiliser le séquençage de génome de novo ?
Le séquençage de génome de novo est la stratégie privilégiée lorsqu'aucun génome de référence de haute qualité n'existe ou lorsque les références existantes ne peuvent pas répondre à vos objectifs de recherche. Voici les cas d'utilisation les plus courants :
✅ Pas de génome de référence disponible
Pour les espèces nouvellement découvertes ou peu étudiées, le séquençage de novo permet aux chercheurs de générer une référence complète à partir de zéro.
✅ Référence incomplète ou fragmentée
De nombreux génomes disponibles publiquement sont obsolètes, mal assemblés ou fragmentés au niveau des échafaudages. L'assemblage de novo fournit continuité au niveau des chromosomes pour la recherche en haute résolution.
✅ Génomes complexes : Polyploïdie, Hétérozygotie, Répétitions
Les génomes des plantes et des animaux contiennent souvent des niveaux élevés de duplication, de variation structurelle ou d'éléments répétitifs. Les approches de novo utilisant séquençage à lecture longue et Cartographie Hi-C surmonter ces défis.
✅ Construction du pan-génome
Lorsqu'un seul génome de référence ne peut pas capturer la diversité génétique d'une espèce, la construction d'un pan-génome par assemblage de novo de plusieurs individus révèle des variations spécifiques à la population.
✅ Découverte de traits et élevage moléculaire
Des assemblages de haute qualité fournissent la base pour GWAS, Cartographie des QTL, et édition du génome—en particulier dans la recherche agricole, aquacole et sur le bétail.
Astuce Pro :
Le séquençage de novo n'est pas seulement destiné aux espèces nouvelles. Il est souvent le meilleure façon de mettre à niveau un génome à faible contiguïté de qualité prête pour publication, surtout lorsqu'il est combiné avec des données HiFi et Hi-C.
Aperçu de la stratégie technologique : comparaison des plateformes pour l'assemblage du génome
| Plateforme | Rôle dans l'Assemblée | Couverture Typique | Forces | Recommandé pour |
|---|---|---|---|---|
| Illumina / DNBSEQ™ | Enquête génomique, correction d'erreurs | 30–50× | Haute précision, faible coût, essentiel pour le profilage k-mer | Analyse de la complexité génomique initiale |
| PacBio HiFi | Assemblage de novo au niveau des contigs | 30–60× | Précision ultra-élevée (Q20+), excellente pour les génomes riches en répétitions ou polyploïdes. | Génomes de plantes/animaux avec une forte hétérozygotie |
| Oxford Nanopore (ONT) | Fermeture de lacunes, assemblage de lectures ultra-longues | 50–100× | Lectures ultra-longues (>100 kb), idéales pour les assemblages de bout en bout (T2T) | Génomes nécessitant une continuité complète ou presque complète |
| Hi-C | Échafaudage à l'échelle des chromosomes | 100–150× | Construit des pseudomolécules de chromosomes, corrige les erreurs d'assemblage. | Ancrage final des chromosomes et contrôle qualité |
| Lectures liées 10x Genomics | Résolution de répétition, phasage (optionnel) | ~60× | Loci hétérozygotes de phases, soutient la séparation des haplotypes. | Espèces diploïdes ou hautement hétérozygotes |
| Cartographie optique BioNano | Détection de variations structurelles importantes (optionnel) | NA | Détecte les SV, assemble des structures complexes | Génomes très grands ou structurellement complexes |
Aperçu de la stratégie hybride :
La plupart des assemblages réussis combinent des lectures courtes, des lectures longues et Hi-C. Nous adaptons le mélange de plateformes en fonction de la taille du génome, de la ploïdie et de vos objectifs de recherche.
Flux de travail du service de séquençage de génome de novo : de l'échantillon à l'assemblage à l'échelle des chromosomes
Contrôle de qualité des échantillons
- Évaluation de l'intégrité via PFGE ou Femto Pulse
- Contrôles de pureté (ratios OD, Qubit et élimination de la contamination par l'ARN)
Enquête génomique (Illumina)
- Séquençage à lecture courte (~100X de couverture)
- Analyse des K-mers pour la taille du génome, le contenu en répétitions, l'hétérozygotie
- Guides en aval pour la stratégie de lecture longue et Hi-C
Séquençage à lecture longue (PacBio HiFi ou Oxford Nanopore)
- Assemblage de novo à haute contiguïté des contigs principaux
- Plateformes sélectionnées en fonction des propriétés du génome cible
- Couverture de 30 à 100 fois selon la plateforme.
Échafaudage et ancrage des chromosomes (séquençage Hi-C)
- Capture des interactions chromatiniennes à longue portée
- Ancre les contigs aux pseudochromosomes
- Permet l'assemblage du génome à l'échelle des chromosomes
Polissage et correction des erreurs
- Polissage des lectures courtes pour la correction des SNP/indels
- Remplissage des lacunes et résolution des répétitions
- BUSCO et contrôles de qualité basés sur l'alignement
Annotation du génome (optionnel)
- Prédiction de la structure des gènes (ab initio et basée sur des preuves)
- Masquage de région répétée
- Annotation fonctionnelle (GO, KEGG, Pfam)

Analyse bioinformatique
Notre pipeline d'informatique génomique intègre l'assemblage à haut débit, l'annotation et l'analyse comparative, personnalisés pour les espèces végétales et animales. Que vous travailliez avec un génome diploïde, polyploïde ou hautement répétitif, nous fournissons des solutions évolutives et précises pour déchiffrer la complexité.


Flux de travail

Exigences d'échantillons et normes de qualité
| Type d'échantillon | Montant requis | Critères de pureté | Remarques spéciales |
|---|---|---|---|
| Tissu animal frais ou congelé | ≥ 1,5 μg d'ADNg (≥50 kb de longueur moyenne) | OD260/280 : 1,8–2,0 ; OD260/230 : ≥2,0 | Évitez les échantillons contaminés par le sang ; pas de cycles de congélation-dégel. |
| Feuilles ou tiges de plante | ≥ 2 μg d'ADNg (longueur moyenne ≥ 50 kb) | Identique à ce qui précède | Évitez la contamination par les polysaccharides et les polyphénols ; privilégiez les tissus jeunes et tendres. |
| Cellules cultivées (par exemple, poissons, insectes) | ≥ 1,5 μg d'ADNg | Identique à ce qui précède. | Pour les insectes, retirez l'exosquelette en chitine avant l'extraction. |
| Tissu croisé Hi-C | ≥ 1 g de tissu frais ou ~5 millions de cellules | OD non applicable (réticulé) | Le réticulage et la fixation doivent suivre notre protocole de préparation Hi-C. |
Critères généraux de contrôle qualité :
- ADN de haute masse moléculaire : >50 kb préféré pour les plateformes de lecture longue (PacBio HiFi, Oxford Nanopore)
- Aucune contamination par l'ARN, les protéines ou les métabolites secondaires.
- Concentration : ≥50 ng/μL (Qubit) ; Intégrité : Confirmée par gel en champ pulsé ou Femto Pulse.
Besoin d'aide pour l'extraction d'ADN ?
CD Genomics propose des services d'extraction de bout en bout adaptés aux génomes des plantes et des animaux, utilisant la purification par billes magnétiques pour minimiser les coupures et les contaminants. Contactez-nous pour en savoir plus.
Livrables
CD Genomics fournit des livrables complets et bien organisés pour chaque projet de séquençage de génome entier de novo de plantes ou d'animaux. Nos paquets de données sont adaptés pour une analyse en aval fluide et une préparation à la publication.
✅ Livrables standards
| Type de fichier / Contenu | Description |
|---|---|
| Données de séquençage brutes | Fichiers FASTQ provenant des plateformes PacBio HiFi, Nanopore, Illumina et/ou Hi-C. |
| Résultats de l'assemblée | Contigs et échafaudages de génome au format FASTA |
| Rapport sur les métriques d'assemblage | Résumé de la taille du génome, N50, contenu en GC, complétude (BUSCO, etc.) |
| Annotation du génome (optionnel) | Fichiers GFF3/GTF, tables d'annotation fonctionnelle, visualisation de la structure des gènes |
| Carte d'interaction Hi-C | Matrices de contact et graphiques de construction d'assemblage (si Hi-C est inclus) |
| Graphiques Circos et de syntenie | Résumé visuel de l'architecture du génome et analyse comparative |
| Rapport de synthèse en bioinformatique | Méthodes détaillées, versions des logiciels et descriptions des pipelines. |
✅ Options supplémentaires (Améliorations de projet)
Pour les projets nécessitant une analyse de données avancée ou des résultats sur mesure, CD Genomics propose les options de mise à niveau suivantes :
| Option de mise à niveau | Description |
|---|---|
| Assemblage au niveau des chromosomes | Réalisé via le scaffolding Hi-C ou BioNano, fournissant des pseudomolécules à l'échelle des chromosomes. |
| Annotation fonctionnelle du génome | Comprend la prédiction génique, l'enrichissement GO/KEGG, les éléments répétés et les annotations TE. |
| Paquet de génomique comparative | Inclut la syntenie du génome entier, le regroupement d'orthologues et l'estimation de la distance évolutive. |
| Construction du pan-génome | Intégration d'assemblage multi-échantillons, détection de variantes structurelles et ensembles de gènes partagés/uniques |
| Intégration de l'épigénome | Module complémentaire pour les cartes de méthylation ou de modification des histones (nécessite une préparation d'échantillon compatible) |
| Formatage des données prêt pour GWAS | Comprend l'appel SNP/INDEL, le formatage VCF et les fichiers de structure de population pour les pipelines GWAS. |
Aperçu du projet en vedette
| Type d'espèce | Taille du génome | Nombre de contigs | Contig N50 | Taux d'ancrage Hi-C |
|---|---|---|---|---|
| Plante A | 1,02 Go | 626 | 7,15 Mo | 95,4 % |
| Plante B | 793,46 Mo | 347 | 34,19 Mo | 96,1 % |
| Animal Aquatique A | 979,98 Mo | 513 | 5,36 Mo | 97,89 % |
| Animal Aquatique B | 827,62 Mo | 170 | 9,88 Mo | 99,51 % |
| Mammifère | 3,3 Go | 2 658 | 79,41 Mo | 98,58 % |
| Insecte | 979,98 Mo | 513 | 5,37 Mo | 97,89 % |
Ces génomes à haute contiguïté démontrent le pipeline d'assemblage robuste de CD Genomics à travers diverses espèces, des génomes de plantes complexes aux assemblages au niveau des chromosomes chez les mammifères et les organismes aquatiques.
Les résultats partiels sont affichés ci-dessous :
Distribution de la qualité de base.
Distribution du contenu de base.
Numéro SNP partagé entre les échantillons.
Distribution des types de mutations SNP.
Statistiques des annotations SNP en camembert.
Nombre d'InDel partagés entre les échantillons.
Distribution de la longueur des InDels à l'échelle du génome entier et dans les régions CDS.
Statistiques des annotations InDel en camembert.
Questions Fréquemment Posées (FAQ)
Qu'est-ce que le séquençage de novo du génome complet d'une plante ou d'un animal ?
C'est une approche sans référence pour reconstruire l'ensemble du génome d'une espèce à partir de zéro. Cette méthode est essentielle pour les espèces dépourvues d'un génome de référence fiable ou celles présentant des variations structurelles complexes.
Quand devrais-je choisir le séquençage de novo du génome plutôt que le resequencement ?
Répondre :
Choisissez le séquençage de novo lorsque :
- Aucun génome de référence de haute qualité n'existe.
- Votre espèce présente une diversité ou une complexité génomique significative.
- Vous visez à construire un pan-génome ou à améliorer la qualité de référence actuelle.
Quels systèmes de séquençage sont utilisés dans votre service ?
Nous utilisons une stratégie hybride qui combine :
- Illumina (pour l'enquête basée sur les k-mers et le polissage)
- PacBio HiFi / Oxford Nanopore (pour la génération de contigs à longues lectures)
- Hi-C (pour l'échafaudage au niveau des chromosomes)
Cette approche en couches maximise la continuité et la précision de l'assemblage.
Quelle qualité d'échantillon est requise ?
Les exigences typiques incluent :
- ADN génomique de haut poids moléculaire
- OD260/280 = 1,8–2,0
- OD260/230 ≥ 2,0
- ≥10–15 μg d'ADN total selon la plateforme
Nous fournissons des directives de soumission détaillées sur demande.
Quels livrables vais-je recevoir ?
Les livrables comprennent :
- Génome assemblé de haute qualité (FASTA)
- Rapport sur les métriques et la qualité de l'assemblage
- Fichiers de prédiction de gènes et d'annotation fonctionnelle
- Résumé visuel (par exemple, cartes circulaires de génomes, graphiques de syntenie)
Proposez-vous une analyse en aval ?
Oui. CD Genomics propose des options de bioinformatique avancées, y compris :
- Regroupement d'orthologues
- Reconstruction phylogénétique
- Analyse de l'expansion des familles de gènes
- Évaluation de la syntenie et de la colinéarité du génome
Mise en avant de la publication client
Étude de cas : Décodage des mécanismes de méthylation m6A chez Arabidopsis à l'aide du séquençage de novo du génome entier
Journal Nouveau Phytologiste
Facteur d'impact: 8,3
Publié: 2017
DOI: 10.1111/nph.14586
Contexte
En tant qu'organisme modèle pour la génétique des plantes, Arabidopsis thaliana a joué un rôle clé dans la découverte des mécanismes régulateurs épigénétiques. Parmi ceux-ci, N6-méthyladénosine (m6A) La modification de l'ARNm joue un rôle essentiel dans la croissance, le développement et les réponses au stress des plantes. Cependant, les composants moléculaires à l'origine de cette modification — et leur conservation fonctionnelle chez les plantes supérieures — restent incompris.
Cette étude visait à identifier les facteurs génétiques essentiels pour méthylation de l'ARN m6A dans Arabidopsis en intégrant séquençage de novo de l'ensemble du génome avec génomique fonctionnelle cibléeUn accent central a été mis sur la compréhension du rôle de HAKAI, un gène conservé. E3 ligase ubiquitine, au sein de la machinerie de méthylation.
Matériaux et Méthodes
Analyse du génome et dépistage de mutants :
- Des mutants d'Arabidopsis thaliana présentant des défauts de méthylation m6A suspectés ont été sélectionnés à partir de bibliothèques d'insertion T-DNA.
- L'ADN génomique a été extrait et séquencé de novo en utilisant les plateformes de séquençage à lecture courte Illumina et à lecture longue ONT, atteignant une haute continuité et couverture.
- Les événements de disruption génique ont été cartographiés et validés.
Profilage m6A :
- L'ARN total a été isolé des lignées mutantes et de type sauvage.
- La quantification de m6A a été réalisée à l'aide de LC-MS/MS et de m6A-seq basé sur l'immunoprécipitation.
Validation fonctionnelle :
- Des essais de complémentation ont été utilisés pour vérifier la fonction des gènes.
- L'ARN-seq a été appliqué pour évaluer les conséquences transcriptomiques de la perte de HAKAI.
Résultats
Le séquençage de novo de l'ensemble du génome a permis une identification précise des insertions de T-DNA perturbant HAKAI, un gène codant pour une ligase E3 ubiquitine de domaine RING. La perte fonctionnelle de HAKAI a considérablement réduit les niveaux de méthylation m6A globaux, comparable aux mutants de écrivains m6A connus tel que MTA et FIP37.
Principales conclusions :
- La perte de HAKAI a entraîné des défauts dans la dominance apicale, le temps de floraison et la viabilité des embryons, phénotypant d'autres mutants de composants essentiels de m6A.
- L'analyse du transcriptome a révélé une dysrégulation des voies de signalisation hormonale et de développement clés.
- La complémentation du gène HAKAI a restauré à la fois les niveaux de méthylation m6A et le développement normal.
Conclusion
Cette étude a démontré que HAKAI est un composant essentiel du complexe de méthylation m6A. dans les plantes, agissant aux côtés des méthyltransférases canoniques. L'utilisation du séquençage de novo de l'ensemble du génome a permis un mappage précis des disruptions géniques et a été essentielle pour valider des hypothèses fonctionnelles dans des contextes génétiquement complexes.
L'affaire met en évidence comment séquençage de novo du génome entier des plantes, associé à des outils épitranscriptomiques et transcriptomiques, peut révéler des mécanismes régulateurs conservés. CD Genomics soutient des études similaires en proposant des services intégrés. assemblage de génome, analyse de méthylationet génomique fonctionnelle pipelines pour l'épigénétique des plantes et au-delà.
Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :
Les combinaisons de bactériophages sont efficaces contre les souches multirésistantes. Pseudomonas aeruginosa et améliorer la sensibilité aux antibiotiques carbapénèmes
Journal: Virus
Année: 2024
Séquence génomique, gènes de résistance aux antibiotiques et plasmides dans une variante monophasique de Salmonella typhimurium isolé du porc de détail
Journal: Annonces de ressources en microbiologie
Année: 2024
Gènes de Salmonella enterica Sérovar Enteritidis impliqué dans la formation de biofilm
Journal: Microbiologie appliquée
Année: 2024
Séquence complète du génome du probiotique Bifidobacterium adolescentis souche iVS-1
Journal: Annonces de ressources en microbiologie
Année: 2023
Voir plus articles publiés par nos clients.
