Korrelation in SPSS berechnen

Pearson-Korrelationskoeffizient in SPSS berechnen (Pearson's r in SPSS)

Korrelationen sind eine grundlegende Methode zur Analyse von Zusammenhängen zwischen zwei Variablen. Die bekannteste Methode zur Korrelationsanalyse ist der Korrelationskoeffizient nach Pearson, der häufig auch als Pearson's r bezeichnet wird.

Wir erläutern Ihnen die Berechnung und Interpretation dieses Korrelationskoeffizienten in SPSS anhand eines Beispieldatensatzes. Der Datensatz ist in folgender Abbildung dargestellt:

Der Datensatz wurde an N=200 Personen erhoben. Er enthält neben der Personen-ID das Alter in Jahren (Age), das jährliche Einkommen (Age) und das Geschlecht (Sex). Nehmen wir nun an, Sie möchten untersuchen ob ein Zusammenhang zwischen Alter und dem Einkommen besteht. Eine mögliche Methode zur Analyse eines solchen Zusammenhanges ist die Korrelation nach Pearson.

Der Korrelationskoeffizient nach Pearson setzt für beide untersuchten Variablen ein metrisches Messniveau vor. Da sowohl Alter als auch Einkommen metrische Variablen sind, ist die Pearson-Korrelation hier in diesem Beispiel geeignet.

Um den Korrelationskoeffizienten nach Pearson in SPSS zu berechnen, öffnen Sie das Menü Analysieren -> Korrelation -> Bivariat wie in folgender Abbildung dargestellt ist:

Es öffnet sich nun ein Menü. Wählen Sie in diesem Menü links die beiden Variablen aus, die Sie analysieren möchten, und fügen Sie die Variablen durch Klicken der Taste mit dem Pfeil in das rechte Feld mit der Überschrift Variablen ein. Drücken Sie dann unten auf OK:

Sie erhalten sodann im SPSS-Output-Fenster den Output der Pearson-Korrelation. Der Output sieht in unserem Beispiel folgendermaßen aus:

Der Output enthält 3 Kennzahlen, die von Interesse sind, nämlich den Korrelationskoeffizienten (Pearson Correlation), den p-Wert (Sig. (2-tailed)) und die Fallzahl (N). Betrachten wir zunächst den Korrelationskoeffizienten (Pearson Correlation). Dieser wird folgendermaßen interpretiert:

Der Korrelationskoeffizient (Pearson Correlation) gibt die Richtung und die Stärke des Zusammenhangs an. Wenn der Korrelationskoeffizient ein positives Vorzeichen hat, bedeutet dies dass zwischen den beiden variablen ein positiver Zusammenhang besteht, d.h. "je größer die eine Variable, desto größer auch die andere".
Wenn der Korrelationskoeffizient ein negatives Vorzeichen hat, bedeutet das dass zwischen den beiden Variablen ein negativer Zusammenhang besteht, also "Je größer die eine Variable, desto kleiner die andere".
Im allgemeinen gilt eine Korrelation als schwach, wenn Sie im Bereich -0.10 oder +0.10 liegt, als mittelstark wenn Sie im Bereich -0.3 oder 0.3 und als stark wenn Sie im Bereich -0.5 oder +0.5 liegt. Beachten Sie. Das Vorzeichen (also + oder -) spielt für die Stärke der Korrelation keine Rolle. Es kommt hier nur darauf an, dass die Korrelation umso stärker ist, je weiter der Wert von Null entfernt ist.
In unserem Beispiel liegt die Korrelation bei r=0.645. Somit liegt zwischen Alter und Einkommen eine starke, positive Korrelation vor.

Weiterhin muss die statistische Signifikanz (Sig. (2-tailed)) betrachtet werden. Die Signifikanz wird in der Literatur überwiegend als p-Wert bezeichnet, d.h. Signifikanz und p-Wert bedeuten das selbe:

Bei der Signifikanz müssen Sie vor allem darauf achten, ob der Wert kleiner oder größer als 0.05 ist. Wenn die Signifikanz kleiner als 0.05 ist, dann liegt eine statistisch signifikante Korrelation vor. Die im Output mit einem Stern (*) gekennzeichnet ist.
Wenn die Signifikanz kleiner als 0.01 ist, spricht man von einer hochsignifikanten Korrelation, die mit zwei Sternen (**) gekennzeichnet wird.
Man erkennt, dass in unserem Beispiel die Signifikanz 0.00 beträgt, und die Korrelation somit hochsignifikant ist.

Schließlich ist im Output noch die Zahl N enthalten. Dies ist die Anzahl an Fällen (D.h. Personen), die in die Korrelationsanalyse mit einbezogen wurden. Man erkennt somit, dass die obige Analyse an N=200 Personen durchgeführt wurde.

Beachten Sie noch die folgende Anmerkung zum Pearson-Korrelations-koeffizienten in SPSS: Wie bereits erwähnt, setzt die Methode ein metrisches Messniveau beider Variablen voraus. Weiterhin müssen beide Variablen normalverteilt sein. Beachten Sie jedoch, dass die Voraussetzung der Normalverteilung für Pearson's r nur bei kleinen Stichproben, d.h. bei N < 30 notwendig ist. Wenn Sie eine Stichprobe von N > 30 haben, ist die Normalverteilung keine Voraussetzung mehr, d. h. in diesem Fall dürfen Sie die Pearson-Korrelation mit SPSS auch dann berechnen, wenn keine Normalverteilung vorliegt.

Inhalte von Powr.io werden aufgrund deiner aktuellen Cookie-Einstellungen nicht angezeigt. Klicke auf die Cookie-Richtlinie (Funktionell und Marketing), um den Cookie-Richtlinien von Powr.io zuzustimmen und den Inhalt anzusehen. Mehr dazu erfährst du in der Powr.io-Datenschutzerklärung.

Kommentar schreiben

Kommentare: 12

#1
Ewa Kaluza (Dienstag, 18 Dezember 2018 00:04)

Die Erklärung gefällt mir sehr gut einfach erklärt, verständlich . Bei der Interpretation des T Test bitte korrigieren zwei Mal kommt das Wort grösser vor
Wenn Werte grösser als 0,05 dann...……
wenn Werte kleiner als 0,05, dann. Vielen Dank
MFG
#2
Klara Schmidt (Donnerstag, 28 März 2019 08:53)

Hallo,

woher beziehen Sie die Informationen, dass bei einer Stichprobe N > 30 die Pearson Korrelation robust genug gegen Verletzungen der Normalverteilung ist? Ich würde gern auf die Literaturquelle zurückgreifen.

Danke LG
#3
Wolfgang (Dienstag, 31 März 2020 17:31)

Der Korrelationskoeffizient gibt den Zusammenhang zwischen zwei Variablen an. Dabei kann der Zusammenhang positiv (z. B. je grösser a, desto grösser b) oder negativ (z. B. je grösser a, desto kleiner b) sein. Eine Richtung wird dabei niemals angegeben in dem Sinne, dass a in Richtung b wirkt.
Wenn man sagt, der Korrelationskoeffizient gibt auch die Richtung an, wird Kausalität impliziert, die man auf diese Weise nicht nachweisen kann.
#4
Valerija (Montag, 20 April 2020 17:03)

Vielen Dank für diesen lehrreichen und gut erklärten Beitrag. Mich würde auch die Quelle zur Aussage interessieren, dass bei Stichproben über 30 keine Normalverteilung bestehen muss.
Wäre super wenn Sie diese Frage beantworten könnten!
Mit freundlichen Grüßen
#5
Werner (Mittwoch, 29 April 2020 21:37)

Klasse!
#6
Tina (Montag, 04 Mai 2020 19:57)

Was macht man mit Variablen die als Messniveau "Nominal" angegeben wurden?
#7
Anna (Freitag, 04 September 2020 20:00)

Hallo,
ich wollte nach der Quelle fragen, von der Sie die Aussage mit N > 30 haben.

LG Anna
#8
Michele (Donnerstag, 05 November 2020 07:57)

Hallo, auch ich hätte gerne die Quelle zu der Aussage, dass bei einer Stichprobe N > 30 die Pearson Korrelation robust genug gegen Verletzungen der Normalverteilung ist. Können Sie mir diese nennen?
Danke, LG Michele
#9
John (Donnerstag, 13 Mai 2021 02:27)

Die gesuchte Quelle zum zentralen Grenzwertsatz (N > 30) findet man z.B. bei

Kubinger, und Moder (2009) (2013) - "Zur Legende der Voraussetzungen des t-Tests für unabhängige Stichproben" - https://doi.org/10.1026/0033-3042.60.1.26
#10
Susanne (Freitag, 29 April 2022 08:29)

Sehr hilfreich und genau erklärt, super zur Wiederholung. Besten Dank!
#11
Judith (Samstag, 16 Dezember 2023 05:27)

Warum werden nur 2 Sternchen (**) beim SPSS- Output zur Signifikanz angegeben, obwohl ein p-Wert von < 0,001 normalerweise doch mit 3 Sternchen (***) angegeben wird?
#12
J. Smigierski (Samstag, 16 Dezember 2023 05:40)

@Judith:
Das ist eine Eigenheit von SPSS. In diesem Output wird ein p-Wert von p < 0.001 nur mit 2 Sternen und nicht wie normalerweise üblich mit 3 Sternen markiert.