La régression multiple est une méthode utilisée pour prédire une variable en utilisant un modèle statistique constitué d' autres variables. Il existe plusieurs variétés de régression multiple , dont l'un est la sélection de l'arrière, également connu comme l'élimination en arrière. Cette technique met toutes les variables du potentiel dans le modèle à la fois puis compare l' un avec l' alimentation moins prédictif contre une donnée " niveau de suppression ", en utilisant une méthode statistique appelée " test t . " Si la variable est au-dessus du niveau de prélèvement , il est éliminé et le modèle est recalculé . Ce processus se poursuit jusqu'à ce que toutes les variables restantes sont sous le niveau de suppression. Instructions
1
Ouvert Minitab , cliquez sur «Fichier» puis cliquez sur « Ouvrir un projet. " Recherchez le fichier de projet contenant vos données , puis double -cliquez dessus.
2
Cliquez sur " Stat " dans la barre de menu en haut , puis «régression », puis « pas à pas ». Cliquez sur l'intérieur de la " réponse " zone de texte , puis double -cliquez sur la variable de réponse dans la liste à gauche . Ensuite, cliquez à l'intérieur de la boîte " prédicteurs " et double- cliquez sur toutes les variables prédictives.
3
Cliquez sur le bouton «Méthodes» , puis cliquez sur le bouton radio " Backwards d'élimination» . Cliquez sur " OK" pour quitter la fenêtre des méthodes , puis sur "OK" pour exécuter la régression multiple.
4
Aller à la fenêtre " Session " pour voir vos résultats . Vous verrez un certain nombre de colonnes. La rangée du haut est intitulé " Step ", et à sa droite sont numérotés colonnes représentant les étapes du processus d'élimination. La première étape comprend toujours toutes les variables , donc regarder vers le bas cette colonne , vous verrez que chaque variable a à la valeur et une valeur p . Numérisation de la colonne et de trouver celui avec la valeur de p plus .
5
vérifier s'il ya une deuxième colonne , étiquetée juste "2. " Si elle n'est pas présente , cela signifie que toutes les variables sont en dessous du niveau de suppression. Ils sont tous des prédicteurs statistiquement significatifs de votre critère. Si vous avez une deuxième colonne , note que la variable avec la valeur de p haut de la colonne ci n'est pas présent. C'est parce qu'il ne permet pas de prédire de façon significative votre variable de réponse .
6
Numériser vers le bas de la dernière colonne dans vos résultats. Si le dernier numéro d' une colonne est plus élevé que le nombre de variables que vous avez inscrits , c'est parce qu'aucun de vos variables prédire la variable de réponse . Notez que l'entrée pour "R- Sq ( adj ) " sur la rangée du bas est nulle ou proche de zéro. Sinon, les variables qui ont des entrées dans la dernière colonne sont ceux qui contribuent au modèle final. Allez vers le bas et cochez la case " R- Sq ( adj ) . " Cela vous indique que le modèle est fortement corrélé avec le critère .