In diesem Artikel finden Sie eine Anleitung zur Durchführung des Chi-Quadrat-Unabhängigkeitstests in Stata. Mit diesem Test wird überprüft, ob ein Zusammenhang zwischen zwei kategoriellen Variablen besteht. Kategorielle Variablen werden manchmal auch als nominal oder qualitativ bezeichnet.
Nehmen wir also an, wir untersuchen die beiden Variablen "Geschlecht" und "Parteipräferenz" und möchten sehen ob ein es einen Zusammenhang zwischen diesen zwei Variablen gibt. Da beide Variablen kategoriell sind, ist der Chi-Quadrat-Test geeignet.
Wir haben nun je 50 Männer und Frauen befragt, welche der 3 Parteien CDU, SPD und Grüne am meisten ihrer politischen Präferenz entspricht. Das Ergebnis der Befragung haben wir in in einen Datensatz im .dta-Format eingetragen. Sie können den Datensatz hier herunterladen:
Nach dem Herunterladen befindet sich der Datensatz in Ihrem Downloads-Ordner. Öffnen Sie den Datensatz, indem Sie mit einem Doppelklick darauf klicken.
Sie haben den Datensatz nun in Stata geöffnet. Um den Datensatz in Stata anzusehen, geben Sie in das Stata-Command-Fenster den folgenden Befehl ein:
edit
Mit diesem Befehl öffnen Sie die Stata-Datenansicht. Sie sehen nun den Datensatz, der folgendermaßen aussieht:
Man erkennt, dass der Datensatz 2 Variablen enthält, nämlich die bevorzugte Partei mit den Ausprägungen SPD, CDU und Gruene und das Geschlecht mit den Ausprägungen M und W.
Wir erstellen nun zunächst eine Kreuztabelle der beiden Variablen Geschlecht und Partei. Hierzu verwenden wir den folgenden Befehl:
tabulate geschlecht partei
Der Befehl bewirkt im Stata-Output-Fenster das folgende Ergebnis:
In der Kreuztabelle ist ersichtlich, dass 23 Männer die CDU bevorzugt haben, aber nur 11 Frauen. Ebenso sieht man, dass die SPD von Frauen bevorzugt wird: 25 Frauen gegenüber 15 Männern bevorzugen diese Partei. Dieses Ergebnis deutet also darauf hin, dass ein Zusammenhang zwischen Geschlecht und Parteipräferenz besteht.
Um zu untersuchen, ob der Zusammenhang statistisch signifikant ist, wenden wir den Chi-Quadrat-Test an. Hierzu geben wir den folgenden Befehl ein:
tabulate geschlecht partei, chi
Dies resultiert in folgendem Stata-Output:
Der Output enthält als wichtigste Kennzahl rechts unten den p-Wert bzw. p-Value. Dieser beträgt 0.032 und ist damit kleiner als 0.05. Da der p-Wert kleiner als 0.05 ist, haben wir nachgewiesen, dass zwischen Geschlecht und Parteipräferenz ein statistisch signifikanter Zusammenhang besteht.
Sie möchten weitere Artikel zum Thema Stata oder Statistik lesen? Hier geht es zurück zur Artikel-Übersicht Stata.
Informationen über unser Angebot der Stata-Nachhilfe finden Sie hier: Stata-Nachhilfe.