L'origine et l'évolution des rétrovirus endogènes

Les particules rétrovirales abritent le génome viral complet sous la forme d'ARN. Lorsqu'il pénètre dans une cellule cible, cet ARN peut subir une transformation connue sous le nom de transcription inverse, le convertissant en ADN double brin, qui est ensuite intégré dans le génome de l'hôte. Cette séquence d'ADN viral intégrée est appelée provirus, englobant des éléments essentiels tels qu'un promoteur, des segments régulateurs et des séquences codantes pour les protéines structurelles et les enzymes.

Typiquement, les rétrovirus infectent les cellules somatiques, mais il existe une probabilité qu'un rétrovirus puisse infecter des cellules germinales, entrant ainsi dans le pool génétique de l'hôte. À ce stade, le provirus évolue en rétrovirus endogène (ERV). Le destin des ERV au sein d'une population dépend des forces de dérive génétique et de sélection naturelle. En essence, les ERV représentent des loci génétiques provenant de rétrovirus exogènes qui se sont intégrés dans le génome de l'hôte par le processus d'endogénisation. Ces entités conservent le titre d'ERV indépendamment de leur capacité à continuer à exprimer des particules virales infectieuses. Au fil de millions d'années, de nombreuses séquences d'ERV ont perdu leur capacité à produire des particules virales en raison de mutations accumulées.

Env exaptation and the relationship between ancient viral functions and current genome functions.Exaptation environnementale et la relation entre les fonctions virales anciennes et les fonctions génomiques actuelles. (Johnson Welkin E, 2019)

Diversité des rétrovirus endogènes (ERV)

Les rétrovirus endogènes partagent un commun structure du génome, facilité par les processus de transcription inverse et d'intégration. Ces processus entraînent la formation de séquences provirales allant de 5 000 à 10 000 paires de bases de longueur au sein du génome de l'hôte, généralement caractérisées par la présence de séquences de répétition terminale longue (LTR) à chaque extrémité. Ces séquences LTR servent d'éléments essentiels, englobant des promoteurs pour l'expression provirale, des composants régulateurs et des domaines structuraux cis-agissants cruciaux pour l'intégration.

Le contenu génétique des rétrovirus comprend généralement :

  • gag : responsable de l'encodage des protéines structurelles qui constituent le cœur de la particule virale.
  • pro : chargé de coder la protéase virale.
  • pol : hébergeant les gènes de la transcriptase inverse et de l'intégrase.
  • env : responsable de l'encodage des glycoprotéines essentielles pour faciliter la fusion et l'entrée cellulaire.

La séquence de répétition terminale de l'LTR est généralement divisée en trois segments, ordonnés de l'extrémité 5' à l'extrémité 3' : U3, R, U5.

À l'extrémité 5', la jonction entre U3 et R marque le début de la transcription, tandis qu'à l'extrémité 3', la jonction entre R et U5 indique la fin de la transcription.

Le segment U3 est généralement compris entre 190 et 1 200 paires de bases et contient une série d'éléments structurels, y compris des promoteurs, des amplificateurs et d'autres motifs régulateurs. Ces éléments ont la capacité d'interagir avec les facteurs régulateurs de la cellule hôte, exerçant ainsi un contrôle sur l'expression génique du protovirus.

Reconstructing and analysing ancient endogenous retrovirus genes.Reconstruction et analyse des gènes d'endovirus rétroviraux anciens. (Johnson Welkin E, 2019)

Rétrovirus anciens : Aperçus sur l'évolution des hôtes

Les rétrovirus endogènes (ERV) sont des vestiges génomiques de rétrovirus disparus, offrant une fenêtre unique sur la coévolution des rétrovirus et des génomes de leurs hôtes. Ils constituent des outils inestimables pour déchiffrer l'impact des rétrovirus sur l'évolution des hôtes.

Prenons, par exemple, HERV-K (HML-2), un ERV présent dans le génome humain, le génome néandertalien et le génome denisovien. Sa présence ubiquitaire suggère une origine rétrovirale ancestrale au sein de la lignée humaine. En revanche, il reste non fixé dans le génome du gorille, se trouvant dans un état génétiquement séparé avec une séquence relativement complète. Cela indique une activité continue chez les gorilles, ces rétrovirus conservant le potentiel de générer de nouvelles particules virales infectieuses.

Les ERV associés aux spumavirus, découverts chez des animaux marins, fournissent des informations sur un contexte historique plus profond, suggérant que ces virus ont infecté des animaux marins dès l'ère paléozoïque. L'identification d'ERV encore non fixés, comme CrERV-gamma chez les cerfs, peut éclairer les premières étapes de l'endogénisation. Notamment, chez les koalas, le rétrovirus KoRV présente à la fois des séquences endogénisées, non pathogènes, et des séquences qui n'ont pas encore subi d'endogénisation, qui pourraient potentiellement être pathogènes. L'analyse de ces cas aide à comprendre le processus d'endogénisation et l'influence du virus sur l'évolution du génome de l'hôte.

Les ERV peuvent également servir d'horloges moléculaires, permettant d'estimer le moment de l'intégration et fournissant des informations sur l'émergence et la diffusion des anciens rétrovirus.

Gènes env hautement conservés : Perspectives sur l'évolution

Parmi les gènes env complets les plus anciens découverts, nous trouvons ceux au sein du gène percomorf des poissons à épines et du gène HEMO des primates, qui ont persisté pendant des centaines de millions d'années. Leur présence durable suggère une conservation remarquable et une sélection naturelle négative persistante, laissant entrevoir leurs fonctions cellulaires potentiellement vitales.

Par exemple, la conservation du gène percomorf peut ne pas découler de sa capacité à résister aux invasions virales, mais de sa capacité à induire une fusion membranaire médiée par des récepteurs. D'autre part, bien qu'il ne soit pas associé à la fusion membranaire, le gène HEMO exprime la protéine Env de pleine longueur, soumise à une clivage par des protéases cytosoliques. Une partie du produit clivé est sécrétée à l'extérieur de la cellule, détectable dans le sang des femmes enceintes et dans le sang et les tissus du placenta. Malgré ces résultats intrigants, le rôle physiologique précis de ce phénomène reste énigmatique.

Les protéines Env codées par la plupart des rétrovirus peuvent être largement classées en deux types : de type gamma et de type bêta.

  • Le type gamma prédomine chez les vertébrés.
  • Le type bêta est plus répandu chez les mammifères.

L'accent actuel sur la domestication des gènes Env s'est principalement concentré sur le type gamma. Ce choix découle probablement du fait que les gènes env de type gamma sont moins susceptibles d'induire la fusion cellulaire, simplifiant ainsi le processus de domestication par l'hôte.

Impression génomique de la domestication

Dans les séquences ERV, le gène env, responsable de la résistance de l'hôte contre les virus, est généralement accompagné de gènes gag, pro et pol intermittents. Cette double observation implique deux aspects cruciaux : le gène env est hautement conservé et soumis à une sélection naturelle négative soutenue, tandis que plusieurs autres gènes ont accumulé un nombre significatif de substitutions aléatoires.

Diverses méthodes d'évaluation de la sélection naturelle peuvent être employées, telles que le rapport dN:dS, qui mesure le rapport entre les substitutions non synonymes et synonymes. Un rapport inférieur à 1 signifie une sélection naturelle négative, une égalité à 1 dénote une dérive génétique aléatoire, et un rapport supérieur à 1 indique une sélection naturelle positive. La sélection naturelle négative et positive peut coexister au sein d'un même gène ; certains codons peuvent être soumis à une sélection positive, tandis que d'autres peuvent subir une sélection négative pour maintenir la structure et la fonction essentielles des protéines. Notamment, pour les deux ERV, percomorf et HEMO, le rapport dN:dS est inférieur à 1, suggérant qu'ils sont effectivement soumis à une sélection naturelle négative. En revanche, fv1 a été soumis à une sélection naturelle positive soutenue, ainsi qu'à une pression de sélection intrabranchiale spécifique à la cible.

Si le gène Env joue un rôle vital dans le développement des espèces, il devrait rester hautement conservé et subir une pression de sélection négative durable. Cependant, si sa fonction principale est d'inhiber l'invasion rétrovirale exogène, la pression sélective contre les antiviraux devrait présenter des schémas cycliques, s'intensifiant avec l'émergence de virus exogènes et s'atténuant ou se modifiant à mesure que les virus exogènes s'éteignent. Les résultats de l'étude confirment cette hypothèse, les syncytines, liées au développement de la formation placentaire, ayant émergé dès 12 à 80 millions d'années, tandis que certains gènes Env axés sur la résistance à l'invasion virale sont relativement récents, avec des événements d'émergence survenus il y a plus de 20 millions d'années.

Domestication des éléments non codants

Les proto-virus et les ERV ont la capacité d'influencer l'expression régulée des gènes situés à quelques kilobases de leur environnement. Les LTR des ERV peuvent servir de promoteurs ou de sites de liaison pour des facteurs de transcription, contribuant potentiellement longs ARN non codants (lncARN) qui agissent comme des séquences régulatrices. Cette acquisition et perte dynamique de séquences régulatrices d'ERV au cours de l'évolution permettent même à des espèces étroitement liées de manifester une diversité phénotypique significative.

Plusieurs caractéristiques clés des ERV peuvent contribuer à l'évolution des réseaux de régulation des gènes de l'hôte.

  • Les séquences LTR contiennent une forte densité d'éléments régulateurs, englobant des promoteurs et des sites de liaison des facteurs de transcription. La nature de ces séquences reflète les propriétés des virus d'origine au moment de l'intégration, y compris des facteurs tels que la sélectivité de l'hôte et des tissus.
  • L'intégration rétrovirale, bien qu'elle ne soit pas entièrement spécifique à une séquence cible, a tendance à favoriser les unités de transcription et les régions contenant des promoteurs dans le génome hôte. Cette distribution non aléatoire des séquences d'insertion générées lors de l'endogénisation est soumise à diverses forces évolutives. Certaines séquences sont soumises à la dérive génétique ou à une sélection négative, diminuant progressivement dans la population, tandis que d'autres subissent une sélection naturelle et deviennent fixées dans la population, persistant au fil du temps.
  • Des séquences LTR similaires peuvent induire une recombinaison ectopique chromosomique ou une conversion génique.
  • Solo-LTR ne conserve que les séquences LTR rétrovirales, éliminant les séquences codantes et contournant les modifications épigénétiques du génome causées par ces séquences. Cela permet de préserver le potentiel régulateur des séquences LTR.

Référence:

  1. Johnson, Welkin E. "Origines et conséquences évolutives des anciens rétrovirus endogènes." Nature Reviews Microbiologie 17,6 (2019) : 355-370.
À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Services associés
Téléchargement PDF
* Adresse e-mail:

CD Genomics a besoin des informations de contact que vous nous fournissez afin de vous contacter au sujet de nos produits et services ainsi que d'autres contenus qui pourraient vous intéresser. En cliquant ci-dessous, vous consentez à la conservation et au traitement des informations personnelles soumises ci-dessus par CD Genomics pour fournir le contenu que vous avez demandé.

×
Demande de devis
! À des fins de recherche uniquement, non destiné à un diagnostic clinique, un traitement ou des évaluations de santé individuelles.
Contactez CD Genomics
Conditions Générales | Politique de confidentialité | Retour d'information   Droit d'auteur © CD Genomics. Tous droits réservés.
Haut