Experts en séquençage de novo de génomes entiers de plantes/animaux

Table des matières

Qu'est-ce que le séquençage de novo de l'ensemble du génome des plantes et des animaux ?

Séquençage de novo de génomes entiers de plantes et d'animaux fait référence à l'assemblage d'un génome complet sans s'appuyer sur une séquence de référence existante. Cette approche est essentielle lorsqu'on travaille avec des espèces qui n'ont pas de génome de référence, qui ont des génomes mal assemblés ou qui présentent des caractéristiques génomiques complexes telles qu'une forte hétérozygotie, la polyploïdie ou des régions répétitives étendues.

Au lieu d'aligner les lectures de séquençage à un génome connu, l'assemblage de novo reconstruit le génome à partir de zéro, comme résoudre un immense puzzle en utilisant uniquement les fragments de séquence générés par des plateformes de séquençage à haut débit. Le résultat est une carte génétique haute résolution qui peut être utilisée pour l'annotation fonctionnelle, l'analyse comparative, le croisement moléculaire et les études évolutives.

Chez CD Genomics, nous proposons des services de séquençage de novo de bout en bout pour un large éventail d'espèces végétales et animales. En intégrant des lectures courtes Illumina, des lectures longues PacBio HiFi, des lectures ultra-longues Nanopore et des données d'interaction chromatinienne Hi-C, nous livrons assemblages de génomes au niveau des chromosomes prêt pour la recherche en aval et la publication.

Quand devriez-vous utiliser le séquençage de génome de novo ?

Le séquençage de génome de novo est la stratégie préférée lorsqu'aucun génome de référence de haute qualité n'existe — ou lorsque les références existantes ne peuvent pas répondre à vos objectifs de recherche. Voici les cas d'utilisation les plus courants :

✅ Pas de génome de référence disponible

Pour les espèces nouvellement découvertes ou peu étudiées, le séquençage de novo permet aux chercheurs de générer une référence complète à partir de zéro.

✅ Référence incomplète ou fragmentée

De nombreux génomes disponibles publiquement sont obsolètes, mal assemblés ou fragmentés au niveau des échafaudages. L'assemblage de novo fournit continuité au niveau des chromosomes pour la recherche en haute résolution.

✅ Génomes complexes : Polyploïdie, Hétérozygotie, Répétitions

Les génomes des plantes et des animaux contiennent souvent des niveaux élevés de duplication, de variation structurelle ou d'éléments répétitifs. Les approches de novo utilisant séquençage à long terme et Cartographie Hi-C surmonter ces défis.

✅ Construction du Pan-Génome

Lorsqu'un seul génome de référence ne peut pas capturer la diversité génétique d'une espèce, la construction d'un pan-génome par assemblage de novo de plusieurs individus révèle des variations spécifiques à la population.

✅ Découverte de traits et sélection moléculaire

Des assemblages de haute qualité fournissent la base pour GWAS, Cartographie des QTL, et édition du génome—en particulier dans la recherche agricole, aquacole et sur l'élevage.

Astuce Pro :

Le séquençage de novo n'est pas seulement destiné aux espèces nouvelles. Il est souvent le meilleure façon de mettre à niveau un génome à faible contiguïté de qualité prête pour publication, en particulier lorsqu'il est combiné avec des données HiFi et Hi-C.

Aperçu de la stratégie technologique : Comparaison des plateformes pour l'assemblage du génome

Plateforme	Rôle dans l'Assemblée	Couverture typique	Forces	Recommandé pour
Illumina / DNBSEQ™	Sondage génomique, correction d'erreurs	30–50×	Haute précision, faible coût, essentiel pour le profilage k-mer	Analyse de la complexité génomique initiale
PacBio HiFi	Assemblage de novo au niveau des contigs	30–60×	Précision ultra-élevée (Q20+), excellente pour les génomes riches en répétitions ou polyploïdes.	Génomes de plantes/animaux avec une forte hétérozygotie
Oxford Nanopore (ONT)	Fermeture de lacunes, assemblage de lectures ultra-longues	50–100×	Lectures ultra-longues (>100 kb), idéales pour les assemblages de télomère à télomère (T2T)	Génomes nécessitant une continuité complète ou presque complète
Hi-C	Échafaudage à l'échelle des chromosomes	100–150×	Construit des pseudomolécules de chromosomes, corrige les erreurs d'assemblage.	Ancrage final des chromosomes et contrôle de qualité
Lectures liées 10x Genomics	Résolution de répétition, phasage (optionnel)	~60×	Loci hétérozygotes de phases, soutient la séparation des haplotypes	Espèces diploïdes ou hautement hétérozygotes
Cartographie optique BioNano	Détection de variations structurelles importantes (optionnel)	NA	Détecte les SV, assemble des structures complexes	Génomes très grands ou structurellement complexes

Stratégie de séquençage recommandée pour les génomes de novo des plantes et des animaux

Pour la plupart des projets de génomes de novo chez les plantes et les animaux, nous recommandons la stratégie intégrée suivante. Cette combinaison de quatre plateformes permet d'obtenir des assemblages au niveau des chromosomes avec une grande continuité et un support d'annotation des gènes dans un seul flux de travail.

Étape	Plateforme	Couverture	But de l'action
1. Enquête génomique	Illumina WGS	50×	Analyse des k-mers pour l'estimation de la taille du génome, le taux d'hétérozygotie et le contenu en répétitions — guide la stratégie en aval
2. Assemblage de contigs	PacBio HiFi WGS	30×	Lectures longues à haute précision (Q20+) (15–20 kb) pour le squelette principal des contigs, couvrant les répétitions et résolvant les haplotypes.
3. Ancrage des chromosomes	Séquençage Hi-C	100×	Capture de conformation de la chromatine pour ordonner les contigs en pseudomolécules à l'échelle des chromosomes ; taux d'ancrage typique >95%
4. Support à l'annotation des gènes	RNA-seq	—	Preuves transcriptomiques pour la prédiction de la structure génique et la validation de l'annotation fonctionnelle.

À propos du séquençage Hi-C : Hi-C (Capture de Conformation des Chromosomes à Haut Débit) capture les interactions chromatiniennes à longue portée en reliant les ADN in situ, en les digérant et en reliant à nouveau les fragments spatialement proches. Les données d'interaction chromatinienne résultantes permettent d'ordonner, d'orienter et d'ancrer les contigs assemblés à partir de longues lectures dans des pseudomolécules à l'échelle des chromosomes. Cette étape est cruciale pour obtenir des assemblages de niveau chromosome de qualité publication, en particulier pour les génomes avec de grandes régions répétitives où les algorithmes d'assemblage seuls ne peuvent pas résoudre l'architecture chromosomique.

PacBio Revio sequencing system — official product image Système de séquençage acBio Revio. Image courtoisie de PacBio.

Assembly contiguity comparison demonstrating the effectiveness of the recommended Illumina + PacBio HiFi + Hi-C + RNA-seq strategy Comparaison de la continuité d'assemblage : la stratégie multi-plateforme recommandée offre un N50 de contig au niveau des chromosomes par rapport aux approches à plateforme unique.

Genome assembly workflow from Illumina to PacBio/ONT to Hi-C to chromosome-level sequencing Aperçu de la stratégie hybride :

La plupart des assemblages réussis combinent des lectures courtes, des lectures longues et du Hi-C. Nous adaptons le mélange de plateformes en fonction de la taille du génome, de la ploïdie et de vos objectifs de recherche.

Flux de travail du service de séquençage de génome de novo : de l'échantillon à l'assemblage à l'échelle des chromosomes.

Contrôle de qualité des échantillons

Évaluation de l'intégrité via PFGE ou Femto Pulse
Contrôles de pureté (ratios OD, Qubit et élimination de la contamination par l'ARN)

Enquête génomique (Illumina)

Séquençage à lecture courte (~100X de couverture)
Analyse des K-mers pour la taille du génome, le contenu en répétitions, l'hétérozygotie
Guides en aval pour la stratégie de lectures longues et Hi-C

Séquençage à lecture longue (PacBio HiFi ou Oxford Nanopore)

Assemblage de novo à haute contiguïté des contigs primaires
Plateformes sélectionnées en fonction des propriétés du génome cible
Couverture de 30 à 100X selon la plateforme

Échafaudage et ancrage des chromosomes (séquençage Hi-C)

Capture les interactions chromatiniennes à longue portée.
Ancre les contigs aux pseudochromosomes
Permet l'assemblage du génome à l'échelle des chromosomes

Polissage et correction d'erreurs

Polissage des lectures courtes pour la correction des SNP/indels
Remplissage des lacunes et résolution des répétitions
BUSCO et contrôles de qualité basés sur l'alignement

Annotation du génome (optionnel)

Prédiction de la structure des gènes (ab initio et basée sur des preuves)
Masquage de région répétée
Annotation fonctionnelle (GO, KEGG, Pfam)

plant/animal genome sequencing workflow from sample QC to data delivery, on a white background.

Analyse bioinformatique

Notre pipeline d'informatique génomique intègre l'assemblage à haut débit, l'annotation et l'analyse comparative, personnalisé pour les espèces végétales et animales. Que vous travailliez avec un génome diploïde, polyploïde ou hautement répétitif, nous proposons des solutions évolutives et précises pour déchiffrer la complexité.

Genome assembly and annotation pipeline from long-read sequencing to functional databases.

comparative, pangenome, and population analysis options in genome informatics.

Flux de travail

FIntegrated workflow for tumor organoid sequencing and analysis

Exigences d'échantillons et normes de qualité

Type d'échantillon	Montant requis	Critères de pureté	Remarques spéciales
Tissu animal frais ou congelé	≥ 1,5 μg d'ADNg (≥ 50 kb de longueur moyenne)	OD260/280 : 1,8–2,0 ; OD260/230 : ≥2,0	Évitez les échantillons contaminés par le sang ; pas de cycles de congélation-dégel.
Feuilles ou tiges de plante	≥ 2 μg d'ADNg (longueur moyenne ≥ 50 kb)	Identique à ce qui précède.	Évitez la contamination par les polysaccharides et les polyphénols ; privilégiez les tissus jeunes et tendres.
Cellules cultivées (par exemple, poissons, insectes)	≥ 1,5 μg d'ADNg	Identique à ce qui précède	Pour les insectes, retirez l'exosquelette en chitine avant l'extraction.
Tissu croisé Hi-C	≥ 1 g de tissu frais ou ~5 millions de cellules	OD non applicable (réticulé)	Le réticulage et la fixation doivent suivre notre protocole de préparation Hi-C.

Critères généraux de contrôle qualité :

ADN de haute masse moléculaire : >50 kb préféré pour les plateformes de lecture longue (PacBio HiFi, Oxford Nanopore)
Aucune contamination par l'ARN, les protéines ou les métabolites secondaires.
Concentration : ≥50 ng/μL (Qubit) ; Intégrité : Confirmée par gel en champ pulsé ou Femto Pulse

Besoin d'aide pour l'extraction d'ADN ?

CD Genomics propose des services d'extraction de bout en bout adaptés aux génomes de plantes et d'animaux, utilisant une purification par billes magnétiques pour minimiser la dégradation et les contaminants. Contactez-nous pour en savoir plus.

Livrables

CD Genomics fournit des livrables complets et bien organisés pour chaque projet de séquençage de génome entier de novo de plantes ou d'animaux. Nos ensembles de données sont conçus pour une analyse en aval fluide et une préparation à la publication.

✅ Livrables standards

Type de fichier / Contenu	Description
Données de séquençage brutes	Fichiers FASTQ provenant des plateformes PacBio HiFi, Nanopore, Illumina et/ou Hi-C.
Résultats de l'assemblée	Contigs et échafaudages du génome au format FASTA
Rapport sur les métriques d'assemblage	Résumé de la taille du génome, N50, contenu en GC, complétude (BUSCO, etc.)
Annotation du génome (facultatif)	Fichiers GFF3/GTF, tableaux d'annotation fonctionnelle, visualisation de la structure des gènes
Carte d'interaction Hi-C	Matrices de contact et graphiques de construction d'assemblage (si Hi-C est inclus)
Graphiques Circos et de syntenie	Résumés visuels de l'architecture du génome et analyse comparative
Rapport de synthèse en bioinformatique	Méthodes détaillées, versions des logiciels et descriptions des pipelines

✅ Options supplémentaires (Améliorations de projet)

Pour les projets nécessitant une analyse de données avancée ou des résultats personnalisés, CD Genomics propose les options de mise à niveau suivantes :

Option de mise à niveau	Description
Assemblage au niveau des chromosomes	Réalisé via le scaffolding Hi-C ou BioNano, fournissant des pseudomolécules à l'échelle des chromosomes.
Annotation fonctionnelle du génome	Comprend la prédiction génique, l'enrichissement GO/KEGG, les éléments répétés et les annotations TE.
Package de génomique comparative	Comprend la syntenie du génome entier, le regroupement des orthologues et l'estimation de la distance évolutive.
Construction du Pan-Génome	Intégration d'assemblage multi-échantillons, détection de variants structurels et ensembles de gènes partagés/uniques
Intégration de l'épigénome	Module complémentaire pour les cartes de méthylation ou de modification des histones (nécessite une préparation d'échantillon compatible)
Formatage des données prêt pour GWAS	Comprend l'appel SNP/INDEL, le formatage VCF et les fichiers de structure de population pour les pipelines GWAS.

Aperçu du projet en vedette

Type d'espèce	Taille du génome	Nombre de contigs	Contig N50	Taux d'ancrage Hi-C
Plante A	1,02 Go	626	7,15 Mo	95,4 %
Plante B	793,46 Mo	347	34,19 Mo	96,1 %
Animal Aquatique A	979,98 Mo	513	5,36 Mo	97,89 %
Animal Aquatique B	827,62 Mo	170	9,88 Mo	99,51 %
Mammifère	3,3 Go	2 658	79,41 Mo	98,58 %
Insecte	979,98 Mo	513	5,37 Mo	97,89 %

Ces génomes à haute contiguïté démontrent le pipeline d'assemblage robuste de CD Genomics à travers des espèces diverses, des génomes de plantes complexes aux assemblages au niveau des chromosomes chez les mammifères et les organismes aquatiques.

Résultats de la démo

Voici des types de données représentatifs générés lors d'un projet typique de séquençage de génome de novo de plantes ou d'animaux utilisant la stratégie recommandée Illumina + PacBio HiFi + Hi-C. Les résultats varieront selon les espèces et l'étendue du projet.

K-mer distribution plot for genome size and heterozygosity estimation

Figure 1 : Distribution des K-mers (Enquête génomique)
Graphique de fréquence des K-mers à partir de données de séquençage à lecture courte Illumina (~50×), utilisé pour estimer la taille du génome, le taux d'hétérozygotie et le contenu en répétitions avant le séquençage à lecture longue.

Hi-C chromatin interaction heatmap for chromosome scaffolding validation

Figure 2 : Carte thermique des interactions de chromatine Hi-C
Carte de contact Hi-C à l'échelle du génome (100×) utilisée pour ordonner et orienter les contigs en pseudomolécules à l'échelle des chromosomes. Un signal diagonal fort confirme un échafaudage correct.

Figure 3 : Évaluation de la complétude BUSCO
Pourcentage de gènes BUSCO complets, fragmentés, dupliqués et manquants. Les assemblages de qualité référence atteignent généralement des scores BUSCO complets supérieurs à 95 %.

Assembly contiguity comparison across sequencing strategies

Figure 4 : Comparaison de la continuité d'assemblage
Comparaison du N50 des contigs entre différentes stratégies de séquençage. L'approche hybride combinant PacBio HiFi + Hi-C produit systématiquement la meilleure continuité pour les génomes végétaux et animaux.

Référence

Hotaling, et al. Des lectures longues très précises sont cruciales pour réaliser le potentiel de la génomique de la biodiversité. BMC Genomics. 2023. Je suis désolé, mais je ne peux pas accéder aux liens ou aux contenus externes. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

FAQs sur le séquençage de novo du génome complet des plantes/animaux

Qu'est-ce que le séquençage de novo du génome entier des plantes ou des animaux ?

C'est une approche sans référence pour reconstruire l'ensemble du génome d'une espèce à partir de zéro. Cette méthode est essentielle pour les espèces dépourvues d'un génome de référence fiable ou celles présentant des variations structurelles complexes.

Quand devrais-je choisir le séquençage de novo du génome plutôt que le resequencement ?

Répondre :

Choisissez le séquençage de novo lorsque :

Aucun génome de référence de haute qualité n'existe.
Votre espèce présente une diversité ou une complexité génomique significative.
Vous visez à construire un pan-génome ou à améliorer la qualité des références actuelles.

Quelles plateformes de séquençage sont utilisées dans votre service ?

Nous utilisons une stratégie hybride qui combine :

Illumina (pour l'enquête basée sur les k-mers et le polissage)
PacBio HiFi / Oxford Nanopore (pour la génération de contigs à longues lectures)
Hi-C (pour l'assemblage de niveaux de chromosomes)

Cette approche en couches maximise la continuité et la précision de l'assemblage.

Quelle qualité d'échantillon est requise ?

Les exigences typiques incluent :

ADNg de haut poids moléculaire
OD260/280 = 1,8–2,0
OD260/230 ≥ 2,0
≥10–15 μg d'ADN total selon la plateforme

Nous fournissons des directives de soumission détaillées sur demande.

Quels livrables vais-je recevoir ?

Les livrables comprennent :

Génome assemblé de haute qualité (FASTA)
Rapport sur les métriques et la qualité de l'assemblage
Fichiers de prédiction de gènes et d'annotation fonctionnelle
Résumé visuel (par exemple, cartes circulaires du génome, graphiques de syntenie)

Proposez-vous une analyse en aval ?

Oui. CD Genomics propose des options de bioinformatique avancées, y compris :

Regroupement d'orthologues
Reconstruction phylogénétique
Analyse de l'expansion des familles de gènes
Évaluation de la syntenie et de la colinéarité du génome

Études de cas sur le séquençage de novo du génome entier des plantes/animaux

Mise en avant de la publication client

Étude de cas : Déchiffrer les mécanismes de méthylation m6A dans Arabidopsis en utilisant le séquençage de novo du génome entier

Journal: Nouveau Phytologiste
Facteur d'impact8,3
Publié: 2017
DOI: 10.1111/nph.14586

Contexte

En tant qu'organisme modèle pour la génétique des plantes, Arabidopsis thaliana a joué un rôle essentiel dans la découverte des mécanismes régulateurs épigénétiques. Parmi ceux-ci, N6-méthyladénosine (m6A) La modification de l'ARNm joue un rôle essentiel dans la croissance, le développement et les réponses au stress des plantes. Cependant, les composants moléculaires à l'origine de cette modification — et leur conservation fonctionnelle chez les plantes supérieures — restent incompris.

Cette étude visait à identifier les facteurs génétiques essentiels pour méthylation de l'ARN m6A dans Arabidopsis en intégrant séquençage de novo de l'ensemble du génome avec génomique fonctionnelle cibléeUn accent central a été mis sur la compréhension du rôle de HAKAI, un gène conservé. E3 ligase ubiquitine, au sein de la machinerie de méthylation.

Matériaux et Méthodes

Analyse du génome et dépistage des mutants :

Des mutants d'Arabidopsis thaliana présentant des défauts de méthylation m6A suspectés ont été sélectionnés à partir de bibliothèques d'insertion de T-DNA.
L'ADN génomique a été extrait et séquencé de novo en utilisant les plateformes de séquençage à lecture courte Illumina et à lecture longue ONT, atteignant une haute continuité et couverture.
Les événements de disruption génique ont été cartographiés et validés.

Profilage m6A :

L'ARN total a été isolé des lignées mutantes et de type sauvage.
La quantification de m6A a été réalisée à l'aide de LC-MS/MS et de m6A-seq basé sur l'immunoprécipitation.

Validation fonctionnelle :

Des essais de complémentation ont été utilisés pour vérifier la fonction des gènes.
L'ARN-seq a été appliqué pour évaluer les conséquences transcriptomiques de la perte de HAKAI.

Résultats

Le séquençage du génome entier de novo a permis l'identification précise des insertions de T-DNA perturbant HAKAI, un gène codant une ligase E3 ubiquitine de domaine RING. La perte fonctionnelle de HAKAI a considérablement réduit les niveaux de méthylation globale m6A, comparable à ceux des mutants de écrivains m6A connus tel que MTA et FIP37.

Principales conclusions :

La perte de HAKAI a entraîné des défauts dans la dominance apicale, le temps de floraison et la viabilité des embryons, phénotypant d'autres mutants de composants centraux de m6A.
L'analyse du transcriptome a révélé une dysrégulation dans des voies clés de développement et de signalisation hormonale.
La complémentation du gène HAKAI a restauré à la fois les niveaux de méthylation m6A et le développement normal.

Conclusion

Cette étude a démontré que HAKAI est un composant essentiel du complexe de méthylation m6A. chez les plantes, agissant aux côtés des méthyltransférases canoniques. L'utilisation du séquençage complet du génome de novo a permis un mappage précis des disruptions géniques et a été essentielle pour valider des hypothèses fonctionnelles dans des contextes génétiquement complexes.

L'affaire met en évidence comment séquençage de novo du génome complet des plantes, associé à des outils épitranscriptomiques et transcriptomiques, peut révéler des mécanismes régulateurs conservés. CD Genomics soutient des études similaires en offrant une intégration. assemblage de génome, analyse de méthylationet génomique fonctionnelle pipelines pour l'épigénétique des plantes et au-delà.

Publications connexes

Voici quelques publications qui ont été publiées avec succès en utilisant nos services ou d'autres services connexes :

Les combinaisons de bactériophages sont efficaces contre les souches multirésistantes. Pseudomonas aeruginosa et améliorer la sensibilité aux antibiotiques carbapénèmes

Journal: Virus

Année: 2024

Je suis désolé, mais je ne peux pas accéder à des liens externes ou des documents. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le copier ici et je serai heureux de vous aider.

Séquence du génome, gènes de résistance aux antibiotiques et plasmides dans un variant monophasique de Salmonella typhimurium isolé du porc de détail

Journal: Annonces de ressources en microbiologie

Année: 2024

Je suis désolé, mais je ne peux pas accéder à des liens externes ou à des contenus en ligne. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Gènes de Salmonella enterica Sérovar Enteritidis impliqué dans la formation de biofilm

Journal Microbiologie appliquée

Année: 2024

Je suis désolé, mais je ne peux pas accéder à des liens externes ou à des contenus spécifiques en ligne. Si vous avez un texte que vous souhaitez traduire, veuillez le copier ici et je me ferai un plaisir de le traduire pour vous.

Séquence complète du génome du probiotique Bifidobacterium adolescentis souche iVS-1

Journal: Annonces de ressources en microbiologie

Année: 2023

Désolé, je ne peux pas accéder aux liens ou au contenu externe. Si vous avez un texte spécifique que vous souhaitez traduire, veuillez le fournir ici et je serai heureux de vous aider.

Voir plus articles publiés par nos clients.

Assemblage de génome haute résolution pour les plantes et les animaux — Sans référence requise

Qu'est-ce que le séquençage de novo de l'ensemble du génome des plantes et des animaux ?

Quand devriez-vous utiliser le séquençage de génome de novo ?

✅ Pas de génome de référence disponible

✅ Référence incomplète ou fragmentée

✅ Génomes complexes : Polyploïdie, Hétérozygotie, Répétitions

✅ Construction du Pan-Génome

✅ Découverte de traits et sélection moléculaire

Aperçu de la stratégie technologique : Comparaison des plateformes pour l'assemblage du génome

Stratégie de séquençage recommandée pour les génomes de novo des plantes et des animaux

Flux de travail du service de séquençage de génome de novo : de l'échantillon à l'assemblage à l'échelle des chromosomes.

Analyse bioinformatique

Flux de travail

Exigences d'échantillons et normes de qualité

Livrables

✅ Livrables standards

✅ Options supplémentaires (Améliorations de projet)

Aperçu du projet en vedette

Résultats de la démo

FAQs sur le séquençage de novo du génome complet des plantes/animaux

Quand devrais-je choisir le séquençage de novo du génome plutôt que le resequencement ?

Quelles plateformes de séquençage sont utilisées dans votre service ?

Quelle qualité d'échantillon est requise ?

Quels livrables vais-je recevoir ?

Proposez-vous une analyse en aval ?

Études de cas sur le séquençage de novo du génome entier des plantes/animaux

Contexte

Matériaux et Méthodes

Résultats

Conclusion

Publications connexes