Was ist R2 Lineare Regression
? Statistiker und Wissenschaftler haben oft eine Voraussetzung , um die Beziehung zwischen zwei Variablen , die gemeinhin als x und y zu untersuchen. Zweck der Prüfung zwei solche Variablen ist in der Regel , um zu sehen , wenn es eine Verbindung zwischen ihnen , als Korrelations in der Wissenschaft bekannt. Zum Beispiel , ein Wissenschaftler möchten Sie vielleicht wissen, ob Stunden Sonne kann zu Hautkrebsraten verknüpft werden. Mathematisch zu beschreiben, die Stärke der Korrelation zwischen zwei Variablen, wie Forscher oft R2. Lineare Regression
Statistiker verwenden die Technik der linearen Regression , um die gerade Linie , die am besten eine Reihe von x und y -Datenpaare zu finden. Sie tun dies durch eine Reihe von Berechnungen, die die Gleichung für die beste Linie abzuleiten. Diese mathematische Beschreibung der Linie wird eine lineare Gleichung und haben die allgemeine Form y = mx + b, wobei x und y die beiden Variablen in der Datenpaare , m die Steigung der Linie ist und b der y- Achsenabschnitt .
Korrelationskoeffizient
die Berechnungen , die die beste Gerade eine lineare Gleichung zu produzieren, um eine beliebige Menge von Daten zu passen , auch wenn die Daten tatsächlich nicht sehr linear zu finden. Um einen Hinweis darauf, wie gut die Daten tatsächlich passen eine gerade Linie zu haben, Statistiker berechnen auch eine Nummer wie der Korrelationskoeffizient bekannt. Dies ist das Symbol r oder R gegeben und ist ein Maß dafür, wie eng die Datenpaare ausgerichtet sind , um die beste Gerade durch sie hindurch.
Bedeutung von R
R können jeden Wert haben zwischen -1 und 1 einen negativen Wert von R bedeutet einfach, dass die Ausgleichsgerade schräg nach unten von links nach rechts bewegen , anstatt nach oben. Je näher R ist entweder die von den beiden Extremen liegen die besser ist die Anpassung der Datenpunkte auf der Linie , entweder -1 oder 1, die eine optimale Passform und einen R-Wert von Null bedeutet, dass es keine Passung und die Punkte völlig zufällig . Wenn die Datenpunkte sind dem geraden Linie ausgerichtet , wird es gesagt, eine gewisse Korrelation zwischen ihnen , daher der Name Korrelationskoeffizient für R.
R2
Einige werden Statistiker lieber mit dem Wert von R2 , die einfach der Korrelationskoeffizient quadriert, oder mit sich selbst multipliziert , und wird als der Bestimmungskoeffizient bekannt ist, ist zu arbeiten. R2 ist sehr ähnlich zu R und beschreibt auch die Korrelation zwischen den beiden Variablen , aber es ist auch leicht unterschiedlich. Er misst die prozentuale Änderung in der y -Variable , die Variation in der x-Variablen zugeschrieben werden kann . R2 ein Wert von 0,9 bedeutet zum Beispiel, dass 90 Prozent der Schwankung in der Y-Daten aufgrund der Veränderung in der X-Daten ist . Dies bedeutet nicht unbedingt, dass x wirklich beeinflussen y , aber das scheint es so tun werden.