Vad är R2 Linjär regression ?

Statistiker och forskare har ofta ett krav för att undersöka sambandet mellan två variabler , kallas x och y . Syftet med att testa två godtyckliga sådana variabler är oftast att se om det finns någon koppling mellan dem , känd som en korrelation inom vetenskapen . Till exempel kan en forskare vill veta om timmar av solexponering kan kopplas till hastigheter av hudcancer . För att matematiskt beskriva styrkan i ett samband mellan två variabler , sådana utredare ofta använder R2 . Linjär regressions

statistiker använda tekniken för linjär regression för att finna den räta linje som bäst passar en serie av X och Y datapar . De gör detta genom en serie beräkningar som härleder ekvationen för den bästa linjen . Denna matematisk beskrivning av linjen kommer att vara en linjär ekvation och har den allmänna formen av y = mx + b , där x och y är de två variablerna i dataparen, m är lutningen på linjen och b är dess y avlyssna .
Korrelationskoefficient

beräkningarna som finner den bästa räta linjen kommer att producera en linjär ekvation för att passa alla uppsättning data , även om dessa data inte är faktiskt väldigt linjärt . För att få en indikation på hur väl uppgifterna passar faktiskt en rak linje , statistiker räkna också ett antal sk korrelationskoefficienten . Denna ges symbolen r eller R och är ett mått på hur väl anpassade dataparenär den bästa räta linjen genom dem . Addera Betydelsen av R

R kan ha ett värde mellan -1 och 1 ett negativt värde på R betyder helt enkelt att den bäst anpassade räta linjen lutar nedåt flyttar vänster till höger , i stället för uppåt. Ju närmare R är till antingen av de två ytterligheterna , desto bättre passning av datapunkterna till linjen , med antingen -1 eller 1 att vara en perfekt passform och ett R-värde på noll vilket betyder att det inte finns någon passning och de punkter är totalt slumpmässigt . Om datapunkterna är väl i linje med den raka linjen , är det sägs vara något samband mellan dem , därav namnet korrelationskoefficienten för R.
R2

Några statistiker föredrar att arbeta med värdet för R2 , som helt enkelt är korrelationskoefficienten i kvadrat , eller multiplicerat med sig själv , och är känd som förklaringsgraden . R2 är mycket lik R och dessutom beskriver korrelationen mellan de två variablerna , men det är också lite annorlunda . Den mäter den procent av variationen i y variabel som kan hänföras till variationen i x variabel. En R2 värde på 0,9 , till exempel innebär att 90 procent av variationen i y uppgifter beror på variation i x -data. Detta betyder inte nödvändigtvis att x är verkligen påverkar y , men att det verkar vara att göra det . Addera

Kommentera