Hur man tar bort Outliers Med en Z Betyg

Vid analys av en datamängd , kan du ofta avvikare , de punkter som inte verkar för att matcha mönster av uppgifter som fastställts av resten av datapunkterna . De kan ofta ses genom plottning av resultaten , eftersom att hitta det ”bästa passning” ekvation för en uppsättning punkter kan göra de eftersläntrare mycket uppenbara . De kan orsakas av mätfel , okända fenomen eller bara felaktigheter i den experimentella metoden . Använd z-poängen metod för att eliminera avvikande värden. Instruktioner
1

Beräkna både medelvärdet och medianen av absolut avvikelse om medianen , eller MAD , på din datauppsättning. För att beräkna medelvärdet , lägga till alla de resultat och dela den summan med antalet datapunkter . Beräkna medianvärdet av absolut avvikelse om medianen , subtrahera medelvärdet från varje datapunkt , ta det absoluta värdet och hitta medianen – mitten – värdet av dessa resultat
2

Beräkna z . – poäng för varje datapunkt genom att subtrahera populationens medelvärde från datapunkten och dividera det svaret av MAD . Detta är den datapunkt ändrade z – poäng . Addera 3

Bestäm hur du vill bestämma en avvikare . Den heuristiska testet anger att en datapunkt med en modifierad z – poäng på 3,5 eller mer bör bestämma en avvikare . Beroende på din forskning , kanske du vill eliminera avvikare helt och hållet , eller det i dina resultat och förklara det i din forskning . Addera

Kommentera