Hur man hittar ett problem med en rest Tomt

I statistiken förbättringarna är skillnaderna mellan värdena för den beroende variabeln som förutsägs av modellen och värdena för den aktuella beroende variabeln . Ordinarie regression förutsätter att residualerna är normalfördelade . Det förutsätter också att variansen av residualerna är konstant över nivåer av de oberoende variablerna , och att förbättringarna inte är relaterade till den oberoende . Ett sätt att kontrollera de sista två antaganden är att titta på en rest tomt , som plottar en oberoende variabel på x-axeln och de rester på y-axeln . Instruktioner
1

Kontrollera om förändring i spridning av variansen som den oberoende variabeln ökar. Titta på residualerna nära den nedre änden av x-axeln , nära mitten av x-axeln och nära den övre änden . Avståndet mellan de högsta och lägsta rester bör vara ungefär lika mellan nivåerna av den oberoende variabeln . Om de inte är , har du ett problem som kallas heteroskedasticitet . Köpa 2

Leta efter en ökning eller minskning i residualerna som den oberoende variabeln ökar. På alla nivåer av den oberoende variabeln , residualerna borde vara centrerad kring 0 Det bör finnas varken en ökning eller minskning , och inte heller bör det finnas ett U – format mönster ( låg i mitten , högt i vardera änden ) eller en inverterad U -formad mönster. Tomten ska se ut som en klump . Om den inte gör det , så har du ett problem med de variabler som finns i modellen .
3

Leta efter extremvärden . Ingen rest borde vara mycket högre än de andra. Om en punkt hoppar ut , eller ett fåtal gör , antingen mycket lägre eller mycket högre än de andra , då de kan förknippas med extremvärden . Detta kan vara en datainmatning fel , eller det kan vara ett mycket ovanligt fall . Addera

Kommentera