Microarray est une plateforme expérimentale puissante qui peut étudier simultanément l'expression de milliers de gènes sous différentes conditions expérimentales. Le commun techniques de microarray inclure microarray SNP, microarray CGH, expression génique utilisant des microarrays d'ADN, Microarray de méthylation de l'ADN, etc. L'objectif global du microarray L'analyse des données implique la génération de données d'expression brutes et la détermination de leur signification biologique. Le processus typique peut être divisé en plusieurs étapes (Figure 1) : prétraitement, analyse des gènes exprimés de manière différentielle, découverte de classes et prédiction, ainsi que l'annotation.
Figure 1. Le processus typique d'analyse des données de microarray.
Services qui pourraient vous intéresser
Prétraitement de microarray les données comprennent généralement l'analyse d'images, l'évaluation de la qualité et la normalisation.
Différentes configurations de numérisation peuvent entraîner des images différentes qui peuvent affecter les résultats expérimentaux. Les images générées sont ensuite quantifiées à l'aide de logiciels tels qu'Imagene ou GenePix. Les intensités sont généralement mesurées en tant que valeur moyenne ou médiane des pixels dans la région donnée.
L'évaluation de la qualité commence par un examen visuel des images et des graphiques des données brutes. Les chercheurs expérimentés sont capables de déterminer quels ensembles dans le lot ont une qualité inférieure ou si certaines régions sont inhabituelles en raison de rayures, etc. Les graphiques spatiaux peuvent également aider à identifier des régions avec un signal inhabituel.
Une partie importante du prétraitement des données est la normalisation, qui ajuste les intensités individuelles afin de permettre des comparaisons à la fois au sein d'un tableau et entre des tableaux dans l'expérience. Des exemples de différences qui doivent être ajustées sont les quantités inégales d'ARN, les différences de marquage et les biais systémiques.
La forme d'ajustement la plus couramment acceptée est actuellement le lowess (moindres carrés localement pondérés). microarray analyse de données) (Figure 2). Bien que cette méthode élimine les différences de teinture et d'intensité, elle ne supprime pas les motifs spatiaux. Pour certains réseaux, comme les réseaux Agilent, les pointes d'impression ne sont pas utilisées lors de la fabrication, il est donc difficile de diviser le réseau en sous-grilles pour éliminer les motifs spatiaux. Une alternative dans cette situation est d'utiliser un lissage bidimensionnel.
Figure 2. Graphiques M vs A pour les données brutes non ajustées (à gauche) et après normalisation lowess (à droite) (Société H P. 2004).
Pour analyser un groupe de diapositives, la plupart des méthodes statistiques supposent que les diapositives ont des distributions égales des niveaux d'intensité ; sinon, une diapositive pourrait influencer injustement les résultats. La manière la plus simple de gérer ce problème est de mettre à l'échelle tous les tableaux afin qu'ils aient une variance égale, ou d'ajouter des covariables de diapositive au modèle utilisé pour analyser les données. (Figure 3).
Figure 3. Boîtes à moustaches montrant la distribution des valeurs M dans chacun des 6 arrays hybridés dans le cadre de la même expérience, avant (gauche) et après (droite) normalisation par échelle (Corporation H P. 2004).
Un objectif clé de microarray Les expériences visent à identifier les gènes qui sont exprimés de manière différentielle dans les conditions étudiées. Ainsi, le processus d'analyse peut généralement être décomposé en deux étapes : 1) filtrage pour identifier les gènes exprimés de manière différentielle en utilisant une combinaison de critères, y compris le changement de rapport et la signification statistique déterminée par des statistiques de comparaison, et 2) séparation de ces gènes exprimés de manière différentielle en groupes ou clusters discrets en fonction du modèle d'expression.
Dans les deux conditions expérimentales, le test t et le test de Wilcoxon sont des méthodes de test standard courantes pour l'expression différentielle des gènes entre deux échantillons. Sous deux conditions expérimentales ou plus, le modèle ANOVA et le modèle à effets mixtes peuvent être appliqués efficacement. L'analyseur de microarrays S+ comprend plusieurs méthodes pour les comparaisons entre deux échantillons et les comparaisons entre plusieurs échantillons, y compris divers types de tests t et de tests de Wilcoxon basés à la fois sur la distribution et sur des distributions nulles basées sur des permutations. Quel que soit le test statistique utilisé, les comparaisons multiples sont une considération importante compte tenu du nombre de gènes et de tests.
Après avoir identifié une liste de gènes présentant des niveaux d'expression différentiels, nous devons classer ces gènes en fonction des motifs d'expression. Les méthodes de regroupement sont des outils descriptifs ou exploratoires qui peuvent être utilisés pour identifier des groupes au sein de jeux de données complexes. Des méthodes telles que le regroupement hiérarchique peuvent être utilisées pour aider à identifier des motifs dans un grand ensemble de données, tandis que des méthodes de partitionnement telles que le regroupement K-means peuvent être utilisées pour séparer les données en groupes ou clusters discrets.
|
|
|
Les études de découverte et de prédiction des classes ont des implications pour la classification des tumeurs et la médecine personnalisée. Les méthodes traditionnelles de classification des tumeurs sont principalement basées sur l'analyse morphologique, qui n'est pas très précise. Microarrays peut fournir un outil plus fiable pour l'identification de sous-classes en détectant des marqueurs moléculaires.
Les méthodes de prédiction de classe disponibles dans S-PLUS incluent tous les modèles statistiques standard et les méthodes d'apprentissage supervisé, tels que la régression, les fonctions discriminantes, les arbres (CART et partitionnement récursif), les réseaux de neurones, les modèles additifs généralisés et les machines à vecteurs de support.
Il existe un certain nombre de métadonnées d'annotation disponibles pour un gène donné. Les exemples incluent Unigene, LocusLink, le numéro de chromosome, la localisation chromosomique, les informations sur les voies KEGG et les catégorisations de l'Ontologie des gènes (GO). A microarray un ensemble de données implique généralement un ensemble d'identifiants connus correspondant aux sondes/probabilités utilisées. Ces identifiants sont généralement uniques et peuvent simplement être liés à la source de métadonnées afin que chaque ensemble de sondes/questions sur le microarray Le chip est utilisé pour trouver diverses annotations. Les gènes sont annotés en utilisant certaines bases de données en ligne (telles que Unigene, LocusLink, GO/Amigo).
Informations minimales sur un Microarray Les normes MIAME (Minimum Information About a Microarray Experiment) décrivent les informations minimales requises pour interpréter. microarray des données et garantir que les résultats dérivés de son analyse peuvent être vérifiés de manière indépendante. Les informations requises comprennent des informations telles que la plateforme de l'array, le design expérimental et la préparation des échantillons. La norme MIAME est utilisée comme guide pour la soumission. microarray informations sur les données et les méthodes dans de nombreux journaux, et de nombreux journaux exigent désormais que les auteurs rendent leurs données publiques comme condition de publication. La liste MIAME est disponible sur le Microarray Site web des données d'expression génique (MGED).
Technologie des microarrays présente des avantages notables pour les études génomiques à haut débit, permettant l'analyse simultanée de nombreux gènes. Ses principaux atouts résident dans sa capacité à fournir des profils d'expression génique étendus, à détecter des gènes exprimés de manière différentielle et à démêler des voies biologiques complexes. Microarrays s'avère particulièrement précieux dans diverses applications telles que le diagnostic des maladies, la découverte pharmaceutique et la médecine individualisée, où la compréhension des schémas d'expression génique est essentielle. Le microarray le processus d'analyse des données englobe plusieurs étapes cruciales pour garantir la précision et la fiabilité des données. En essence, microarray l'analyse des données représente une approche robuste pour étudier l'expression des gènes de manière exhaustive. Sa méthodologie globale, allant du prétraitement des données à des analyses statistiques et fonctionnelles sophistiquées, en fait une ressource indispensable dans génomique recherche, approfondissant notre compréhension des systèmes biologiques complexes et propulsant le progrès scientifique.
Les principes et le flux de travail des microarrays SNP
Les applications des microarrays SNP
Références :