Korrelationen sind eine grundlegende Methode zur Analyse von Zusammenhängen zwischen zwei Variablen. Die bekannteste Methode zur Korrelationsanalyse ist der Korrelationskoeffizient nach Pearson, der häufig auch als Pearson's r bezeichnet wird.
Wir erläutern Ihnen die Berechnung und Interpretation dieses Korrelationskoeffizienten in SPSS anhand eines Beispieldatensatzes. Der Datensatz ist in folgender Abbildung dargestellt:
Der Datensatz wurde an N=200 Personen erhoben. Er enthält neben der Personen-ID das Alter in Jahren (Age), das jährliche Einkommen (Age) und das Geschlecht (Sex). Nehmen wir nun an, Sie möchten untersuchen ob ein Zusammenhang zwischen Alter und dem Einkommen besteht. Eine mögliche Methode zur Analyse eines solchen Zusammenhanges ist die Korrelation nach Pearson.
Der Korrelationskoeffizient nach Pearson setzt für beide untersuchten Variablen ein metrisches Messniveau vor. Da sowohl Alter als auch Einkommen metrische Variablen sind, ist die Pearson-Korrelation hier in diesem Beispiel geeignet.
Um den Korrelationskoeffizienten nach Pearson in SPSS zu berechnen, öffnen Sie das Menü Analysieren -> Korrelation -> Bivariat wie in folgender Abbildung dargestellt ist:
Es öffnet sich nun ein Menü. Wählen Sie in diesem Menü links die beiden Variablen aus, die Sie analysieren möchten, und fügen Sie die Variablen durch Klicken der Taste mit dem Pfeil in das rechte Feld mit der Überschrift Variablen ein. Drücken Sie dann unten auf OK:
Sie erhalten sodann im SPSS-Output-Fenster den Output der Pearson-Korrelation. Der Output sieht in unserem Beispiel folgendermaßen aus:
Der Output enthält 3 Kennzahlen, die von Interesse sind, nämlich den Korrelationskoeffizienten (Pearson Correlation), den p-Wert (Sig. (2-tailed)) und die Fallzahl (N). Betrachten wir zunächst den Korrelationskoeffizienten (Pearson Correlation). Dieser wird folgendermaßen interpretiert:
Weiterhin muss die statistische Signifikanz (Sig. (2-tailed)) betrachtet werden. Die Signifikanz wird in der Literatur überwiegend als p-Wert bezeichnet, d.h. Signifikanz und p-Wert bedeuten das selbe:
Schließlich ist im Output noch die Zahl N enthalten. Dies ist die Anzahl an Fällen (D.h. Personen), die in die Korrelationsanalyse mit einbezogen wurden. Man erkennt somit, dass die obige Analyse an N=200 Personen durchgeführt wurde.
Beachten Sie noch die folgende Anmerkung zum Pearson-Korrelations-koeffizienten in SPSS: Wie bereits erwähnt, setzt die Methode ein metrisches Messniveau beider Variablen voraus. Weiterhin müssen beide Variablen normalverteilt sein. Beachten Sie jedoch, dass die Voraussetzung der Normalverteilung für Pearson's r nur bei kleinen Stichproben, d.h. bei N < 30 notwendig ist. Wenn Sie eine Stichprobe von N > 30 haben, ist die Normalverteilung keine Voraussetzung mehr, d. h. in diesem Fall dürfen Sie die Pearson-Korrelation mit SPSS auch dann berechnen, wenn keine Normalverteilung vorliegt.
Kommentar schreiben
Ewa Kaluza (Dienstag, 18 Dezember 2018 00:04)
Die Erklärung gefällt mir sehr gut einfach erklärt, verständlich . Bei der Interpretation des T Test bitte korrigieren zwei Mal kommt das Wort grösser vor
Wenn Werte grösser als 0,05 dann...……
wenn Werte kleiner als 0,05, dann. Vielen Dank
MFG
Klara Schmidt (Donnerstag, 28 März 2019 08:53)
Hallo,
woher beziehen Sie die Informationen, dass bei einer Stichprobe N > 30 die Pearson Korrelation robust genug gegen Verletzungen der Normalverteilung ist? Ich würde gern auf die Literaturquelle zurückgreifen.
Danke LG
Wolfgang (Dienstag, 31 März 2020 17:31)
Der Korrelationskoeffizient gibt den Zusammenhang zwischen zwei Variablen an. Dabei kann der Zusammenhang positiv (z. B. je grösser a, desto grösser b) oder negativ (z. B. je grösser a, desto kleiner b) sein. Eine Richtung wird dabei niemals angegeben in dem Sinne, dass a in Richtung b wirkt.
Wenn man sagt, der Korrelationskoeffizient gibt auch die Richtung an, wird Kausalität impliziert, die man auf diese Weise nicht nachweisen kann.
Valerija (Montag, 20 April 2020 17:03)
Vielen Dank für diesen lehrreichen und gut erklärten Beitrag. Mich würde auch die Quelle zur Aussage interessieren, dass bei Stichproben über 30 keine Normalverteilung bestehen muss.
Wäre super wenn Sie diese Frage beantworten könnten!
Mit freundlichen Grüßen
Werner (Mittwoch, 29 April 2020 21:37)
Klasse!
Tina (Montag, 04 Mai 2020 19:57)
Was macht man mit Variablen die als Messniveau "Nominal" angegeben wurden?
Anna (Freitag, 04 September 2020 20:00)
Hallo,
ich wollte nach der Quelle fragen, von der Sie die Aussage mit N > 30 haben.
LG Anna
Michele (Donnerstag, 05 November 2020 07:57)
Hallo, auch ich hätte gerne die Quelle zu der Aussage, dass bei einer Stichprobe N > 30 die Pearson Korrelation robust genug gegen Verletzungen der Normalverteilung ist. Können Sie mir diese nennen?
Danke, LG Michele
John (Donnerstag, 13 Mai 2021 02:27)
Die gesuchte Quelle zum zentralen Grenzwertsatz (N > 30) findet man z.B. bei
Kubinger, und Moder (2009) (2013) - "Zur Legende der Voraussetzungen des t-Tests für unabhängige Stichproben" - https://doi.org/10.1026/0033-3042.60.1.26
Susanne (Freitag, 29 April 2022 08:29)
Sehr hilfreich und genau erklärt, super zur Wiederholung. Besten Dank!
Judith (Samstag, 16 Dezember 2023 05:27)
Warum werden nur 2 Sternchen (**) beim SPSS- Output zur Signifikanz angegeben, obwohl ein p-Wert von < 0,001 normalerweise doch mit 3 Sternchen (***) angegeben wird?
J. Smigierski (Samstag, 16 Dezember 2023 05:40)
@Judith:
Das ist eine Eigenheit von SPSS. In diesem Output wird ein p-Wert von p < 0.001 nur mit 2 Sternen und nicht wie normalerweise üblich mit 3 Sternen markiert.