
Deskriptive Statistik
> Korrelation u. Regressionsanalyse

14.90 EUR

Korrelationsmaße
Text zum Video
Korrelationsmaße.
Wir haben soeben festgestellt, wie man den Zusammenhang zweier Merkmale mit Hilfe einer Regressionsgleichung darstellen kann. Nun werden wir lernen, wie man auch die "Stärke" des Zusammenhangs anhand einiger praktischer Maßzahlen berechnet.
Der Korrelationskoeffizient nach "Bravais-Pearson" ist "ein Maß für den linearen Zusammenhang zweier statistischer Variablen". Man berechnet ihn nach dieser Formel, indem man die Kovarianz durch die Standardabweichung von "x" mal die Standardabweichung von "y" dividiert. Die einzelnen Werte sind uns ja schon bekannt, es ergibt sich für unser Restaurantbeispiel dieser Korrelationskoeffizient.
Was sagt dieser Wert aus?
Ein Korrelationskoeffizient von "1" würde einen "starken positiven linearen Zusammenhang" beider Variablen aussagen, der im Streuungsdiagramm so aussähe.
Bei einem Wert von "-1" würde ein negativer Zusammenhang bestehen und bei "0" gäbe es keinen Zusammenhang.
Was sagt unser Wert von "0,9" also aus? Es besteht ein starker, positiver linearer Zusammenhang zwischen den Variablen "Lebensalter" und "Rechnungsbetrag".
Merke dir: Der Korrelationskoeffizient liegt immer zwischen -1 und 1 und gibt so die Richtung und die Stärke des linearen Zusammenhangs an.
Der Korrelationskoeffizient ist nicht robust gegenüber Ausreißern, da er aus Streuungsparametern gebildet wird, die durch abweichende Einzelwerte stark beinflusst werden. Wesentlich robuster ist der Rangkorrelationskoeffizient nach "Spearman". Wohingegen der Korrelationskoeffizient ein Maß füßr den linearen Zusammenhang ist, ist der Rangkorrelationskoeffizient nach "Spearman" "ein Maß für den monotonen Zusammenhang zweier statistischer Variablen". Was bedeutet das?
Man verwendet nun nicht mehr die genauen Merkmalswerte zur Berechnung, sondern nur noch deren Rangzahl.
Probieren wir's aus!
Wir verwenden wieder unser Beispiel aus dem Restaurant und ordnen den Werten der Datenliste nun aufsteigend "Ränge" zu. Der kleinste Werte hat "Rang 1", der zweitkleinste "Rang 2" usw...
Liegen Merkmalswerte doppelt vor, sind z.B. zwei Gäste gleich alt, so nennt man dies "Bindung". Beide erhielten dann den gleichen Rang, was aber hier nicht der Fall ist.
Der erste notwendige Schritt zur Berechnung des Rangkorrelationskoeffizienten ist also immer die Zuordnung von Rängen. Der zweite Schritt ist die Anwendung dieser Formel. Sie sieht komplizierter aus, als sie ist.
Überm Bruchstrich ziehen wir - beginnend bei Gast 1 - beide Rangwerte voneinander ab und quadrieren sie. So tun wir es auch für die weiteren 8 Gäste.
Man interpretiert den Rangkorrelationskoeffizient genauso, wie den Korrelationskoeffizient. Auch hier deutet der Wert also auf einen relativ starken, positiven, monotonen Zusammenhang der Variablen "Lebensalter" und "Rechnungsbetrag" hin, weil er nahe bei 1 liegt.
Merke dir: Im Gegensatz zum Korrelationskoeffizienten ist der Rangkorrelationskoeffizient robust gegenäber Ausreißern.
Wir haben soeben festgestellt, wie man den Zusammenhang zweier Merkmale mit Hilfe einer Regressionsgleichung darstellen kann. Nun werden wir lernen, wie man auch die "Stärke" des Zusammenhangs anhand einiger praktischer Maßzahlen berechnet.
Der Korrelationskoeffizient nach "Bravais-Pearson" ist "ein Maß für den linearen Zusammenhang zweier statistischer Variablen". Man berechnet ihn nach dieser Formel, indem man die Kovarianz durch die Standardabweichung von "x" mal die Standardabweichung von "y" dividiert. Die einzelnen Werte sind uns ja schon bekannt, es ergibt sich für unser Restaurantbeispiel dieser Korrelationskoeffizient.
Was sagt dieser Wert aus?
Ein Korrelationskoeffizient von "1" würde einen "starken positiven linearen Zusammenhang" beider Variablen aussagen, der im Streuungsdiagramm so aussähe.
Bei einem Wert von "-1" würde ein negativer Zusammenhang bestehen und bei "0" gäbe es keinen Zusammenhang.
Was sagt unser Wert von "0,9" also aus? Es besteht ein starker, positiver linearer Zusammenhang zwischen den Variablen "Lebensalter" und "Rechnungsbetrag".
Merke dir: Der Korrelationskoeffizient liegt immer zwischen -1 und 1 und gibt so die Richtung und die Stärke des linearen Zusammenhangs an.
Der Korrelationskoeffizient ist nicht robust gegenüber Ausreißern, da er aus Streuungsparametern gebildet wird, die durch abweichende Einzelwerte stark beinflusst werden. Wesentlich robuster ist der Rangkorrelationskoeffizient nach "Spearman". Wohingegen der Korrelationskoeffizient ein Maß füßr den linearen Zusammenhang ist, ist der Rangkorrelationskoeffizient nach "Spearman" "ein Maß für den monotonen Zusammenhang zweier statistischer Variablen". Was bedeutet das?
Man verwendet nun nicht mehr die genauen Merkmalswerte zur Berechnung, sondern nur noch deren Rangzahl.
Probieren wir's aus!
Wir verwenden wieder unser Beispiel aus dem Restaurant und ordnen den Werten der Datenliste nun aufsteigend "Ränge" zu. Der kleinste Werte hat "Rang 1", der zweitkleinste "Rang 2" usw...
Liegen Merkmalswerte doppelt vor, sind z.B. zwei Gäste gleich alt, so nennt man dies "Bindung". Beide erhielten dann den gleichen Rang, was aber hier nicht der Fall ist.
Der erste notwendige Schritt zur Berechnung des Rangkorrelationskoeffizienten ist also immer die Zuordnung von Rängen. Der zweite Schritt ist die Anwendung dieser Formel. Sie sieht komplizierter aus, als sie ist.
Überm Bruchstrich ziehen wir - beginnend bei Gast 1 - beide Rangwerte voneinander ab und quadrieren sie. So tun wir es auch für die weiteren 8 Gäste.
Man interpretiert den Rangkorrelationskoeffizient genauso, wie den Korrelationskoeffizient. Auch hier deutet der Wert also auf einen relativ starken, positiven, monotonen Zusammenhang der Variablen "Lebensalter" und "Rechnungsbetrag" hin, weil er nahe bei 1 liegt.
Merke dir: Im Gegensatz zum Korrelationskoeffizienten ist der Rangkorrelationskoeffizient robust gegenäber Ausreißern.
Inhalt



























































































