Cartographie des éléments cis-régulateurs dans le génome du porc

Bien que des avancées génomiques substantielles aient transformé le paysage de l'exploration scientifique, notre connaissance des éléments cis-régulateurs dans le génome porcin reste remarquablement limitée. Ce manque de connaissances entrave considérablement l'amélioration génétique et la productivité des porcs, tant en tant que source de viande qu'en tant que modèles de recherche biomédicale. Dans cette enquête, les auteurs ont mené un examen complet des génomes de quatre races porcines distinctes, en utilisant une gamme variée de techniques histologiques de pointe, y compris RNA-seq, ATAC-seq, ChIP-seq, et Hi-C. La stratégie de l'étude rappelle les initiatives épigénétiques à grande échelle telles que l'ENCODE (Encyclopédie des éléments d'ADN) et les projets Roadmap Epigenomics.

Les éléments cis-régulateurs et leurs fonctions ont été systématiquement délimités dans une douzaine de tissus différents à travers ces quatre races de porcs. Cette recherche a généré un ensemble de données substantiel de 199 profils régulateurs épigénétiques, aboutissant à l'identification de plus de 220 000 éléments cis-régulateurs dans le génome porcin. Fait intéressant, cette exploration a révélé un niveau de conservation inattendu des éléments cis-régulateurs entre les génomes humain et porcin, dépassant la conservation observée entre les génomes humain et murin.

De plus, la recherche a révélé des variations dans les domaines structurels associés aux caractéristiques topologiques au sein des génomes porcin et humain, éclairant les changements évolutifs impactant la morphologie craniofaciale. Au-delà de son importance pour la génomique fonctionnelle porcine et la régulation des traits, cette étude fournit des données épigénétiques comparatives essentielles, renforçant l'utilité des porcs en tant que modèles dans la recherche biomédicale humaine.

Éléments cis-régulateurs et structure génomique 3D du génome porcin

Ils ont trouvé un total de 220 723 séquences cis-régulatrices non redondantes, y compris 37 838 promoteurs putatifs, 146 399 enhancers potentiels et 137 838 régions de chromatine ouverte alignées au génome susScr11. Ils ont examiné la distribution de ChIP-seq et les signaux ATAC-seq autour de leurs TSS et ont évalué leurs niveaux d'expression transcriptionnelle. Comme exemples, ils présentent les gènes AGL et FRRS1 sur le Chr4 porcin et le gène MYOG sur le Chr9.

La longueur totale de ces séquences cis-régulatrices non redondantes est d'environ 434,92 millions de paires de bases, ce qui représente environ 17,38 % du génome susScr11. Pour évaluer la précision de localisation des séquences cis-régulatrices identifiées ci-dessus, ils ont comparé les amplificateurs et les promoteurs avec le TSS annoté par le projet Swine de l'Université de Californie, Santa Cruz (UCSC) et avec des publications précédemment publiées. ChIP-seq des données provenant de cellules souches pluripotentes porcines et de tissus hépatiques. Les résultats indiquent qu'environ 50 % des promoteurs putatifs sont cohérents avec les chevauchements de promoteurs ou les TSS identifiés dans les données publiées, tandis que l'autre moitié environ n'est pas rapportée dans le génome porcin. Plus de 86 % des enhancers n'ont également pas été rapportés dans le génome du porc.

La structure 3D du génome porcin a été évaluée à l'aide de données Hi-C in situ, avec du muscle squelettique provenant d'un échantillon de tissu de porc LW représentatif. Au total, 1 189 583 975 lectures en paires ont été séquencées, atteignant plus de 21x de couverture du génome, et ils ont obtenu 408 546 465 contacts valides uniques, dont 290 325 259 étaient des contacts cis, après filtrage des données valides à l'aide de Hi-C-Pro. À partir de ces contacts, ils ont cartographié les conformations de la chromatine en tant que fréquences d'interaction de la chromatine, et la modélisation de la structure du génome 3D a clairement montré les relations spatiales entre les régions génomiques porcines.

Cis-regulatory element landscape of the pig genome.Paysage des éléments cis-régulateurs du génome du porc. (Zhao et al., 2021)

Transcriptome du génome porcin

Dans leur étude, ils ont mené RNA-seq analyse de 52 échantillons dérivés de 11 tissus porcins différents issus de quatre races porcines distinctes. Ils ont révélé des motifs divers d'expression de l'ARN au sein de chaque tissu, qu'ils ont ensuite classés en 20 clusters distincts à l'aide de la fonction K-means dans le langage de programmation R.

Le cluster p20 s'est distingué comme un cluster avec des gènes fortement exprimés dans tous les échantillons. Une analyse supplémentaire, utilisant l'enrichissement de l'ontologie génique DAVID, a indiqué que les gènes de ce cluster jouent principalement des rôles essentiels dans des processus biologiques fondamentaux, suggérant qu'ils peuvent être considérés comme des gènes de ménage. Notamment, plus de la moitié des clusters ont montré une tendance claire d'expression spécifique aux tissus.

Ils ont ensuite identifié 4 510 gènes spécifiques à des tissus, définis comme ceux montrant une expression au moins trois fois plus élevée dans un tissu particulier par rapport aux autres dans toutes les races de porcs. Des analyses d'enrichissement GO DAVID ultérieures ont illustré qu'ils étaient significativement enrichis pour des fonctions spécifiques dans une variété de tissus. Ils ont validé leurs résultats en examinant des exemples typiques, et les résultats ont révélé un haut niveau d'accord entre RNA-seq données et résultats de RT-PCR, renforçant l'exactitude de leur analyse.

De plus, ils ont identifié 3 316 nouveaux transcrits, dont 1 713 ARN non codants longs (lncARN) non documentés auparavant dans le transcriptome porcin. Fait frappant, des nombres similaires de nouveaux transcrits ont été détectés dans tous les tissus examinés, ce qui suggère que les études antérieures ont pu négliger ces transcrits spécifiques. Notamment, ils ont trouvé une abondante signalisation H3K4me3 près du site de début de transcription (TSS) de ces transcrits nouvellement identifiés, fournissant des preuves solides de leur transcription active. Ce processus d'identification robuste souligne les avantages de la construction de bibliothèques spécifiques à l'orientation après l'élimination de l'ARN ribosomique (rARN), une technique rarement utilisée dans les études porcines précédentes. De plus, leurs résultats indiquent que ces transcrits nouvellement identifiés présentent un indice de spécificité tissulaire plus élevé par rapport aux gènes déjà annotés dans le génome.

Transcriptional profiling and cis-regulatory elements analysis.Profilage transcriptionnel et analyse des éléments cis-régulateurs. (Zhao et al., 2021)

Amplificateurs spécifiques aux tissus : Aperçus sur les motifs d'expression génique porcine

Les séquences d'enhancers servent d'éléments régulateurs essentiels régissant l'expression génique spécifique aux tissus, exerçant des impacts fonctionnels profonds sur l'établissement de motifs d'expression génique distincts. Dans cette étude, les auteurs ont méticuleusement catégorisé les motifs spécifiques aux tissus associés aux enhancers putatifs à travers divers tissus porcins, réussissant à identifier 15 753 enhancers spécifiques aux tissus avec un haut niveau de confiance. De plus, en utilisant l'algorithme ROSE, ils ont également découvert entre 414 et 1 306 super-enhancers dans chaque tissu pour chaque race. Comme prévu, les gènes associés à ces super-enhancers ont montré des niveaux d'expression nettement plus élevés par rapport aux gènes liés aux enhancers typiques.

Des pics H3K4me3 largement répandus, en conjonction avec des promoteurs actifs riches en H3K27ac, ont été précédemment documentés comme étant des moteurs significatifs de l'activation transcriptionnelle accrue des gènes. Les résultats de cette enquête ont révélé la présence de pics H3K4me3 de 418 à 1899 large dans chaque tissu à travers différentes races. Semblable aux données sur les super-enhancers, les gènes proches de ces larges pics H3K4me3 ont montré des niveaux d'expression nettement plus élevés par rapport aux gènes sélectionnés au hasard.

Pour valider la robustesse et la précision de leur méthodologie, les chercheurs ont réalisé un essai de gène rapporteur à double luciférase dans des cellules porcines 3D4/21, ciblant 15 amplificateurs non spécifiques aux tissus prédites et 18 séquences de promoteurs choisies au hasard. Les résultats ont souligné une augmentation substantielle de l'activité transcriptionnelle pour les amplificateurs et promoteurs testés par rapport à des régions génomiques randomisées. Il convient également de noter qu'au sein des amplificateurs identifiés, 1216 séquences ont montré une conservation avec des amplificateurs VISTA humains connus.

3D structure and regulation of cis-regulatory elements.Structure 3D et régulation des éléments cis-régulateurs. (Zhao et al., 2021)

Structure génomique 3D du génome porcin

L'identification des boucles de chromatine a été facilitée par l'analyse de la matrice Hi-C. En utilisant l'algorithme amélioré HiCCUPS, nous avons découvert 15 485 boucles à une résolution de 25 kb et 11 838 boucles à une résolution de 40 kb. Une amalgamation complète des données Hi-C et des éléments régulateurs cis a mis en évidence qu'à la résolution de 25 kb, 79,74 % (12 347) de ces boucles étaient associées à des éléments régulateurs cis, avec 44,47 % montrant des associations significatives. Des analyses ultérieures, intégrant les données de boucles avec les régions de chromatine ouverte identifiées par ATAC-seq, ont démontré un enrichissement substantiel des motifs de liaison CTCF au sein des ancres de boucle. Ces résultats soulignent le rôle conservé des domaines de liaison CTCF dans la structuration de la structure 3D des génomes des mammifères.

Pour explorer l'impact mondial des amplificateurs sur la régulation des traits complexes chez les porcs, les auteurs ont rassemblé des SNP qui présentaient des associations significatives avec les publications. études d'association à l'échelle du génome (GWAS) et ont examiné leur proximité avec les amplificateurs. Un total de 7 238 SNP associés aux GWAS, dont 3 445 étaient non redondants, a été collecté. L'analyse a révélé un enrichissement notable des amplificateurs autour des SNPs significativement associés aux GWAS par rapport à des régions génomiques aléatoires à différentes distances. Notamment, des recherches antérieures avaient impliqué le gène PLCB4 comme un gène candidat pour la croissance et le gain quotidien moyen chez les porcs, et notre étude a confirmé que le SNP significativement lié au gain quotidien des porcs est situé près d'un amplificateur significativement associé au gène PLCB4.

Référence :

  1. Zhao, Yunxia, et al. "Un recueil et une analyse épigénomique comparative des éléments cis-régulateurs dans le génome du porc." Communications Nature 12.1 (2021) : 2217.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut