Hier lernen Sie, mit welchen Tests eine Normalverteilung in R geprüft werden kann und wie man dies in R vornimmt. Aus Grund der großen Bedeutung der Normalverteilung wurden im Laufe der Zeit zahlreiche Tests entwickelt, um das Vorliegen dieser Verteilung überprüfen zu können. Die bekanntesten in R verfügbaren Tests auf Normalverteilung sind die folgenden:
Im Folgenden zeigen wir Ihnen, wie man den Shapiro-Wilk-Test und den Kolmogorov-Smirnov-Test in R durchführt.
Um die Normalverteilungstests in R zu demonstieren, benötigen wir zunächst ein paar Daten. Wir nutzen hierzu die Möglichkeit zur Erzeugung von Zufallszahlen in R, und erstellen uns zwei Stichproben:
Wir wählen hier als Beispiel die t-Verteilung, da diese Verteilung ein gutes Beispiel für eine Verteilung ist, die sich zwar von der Normalverteilung unterscheidet, jedoch manchmal fälschlicherweise als Normalverteilung erkannt wird.
Betrachten Sie das folgende Schaubild, in dem die Dichtefunktionen der Normalverteilung sowie der t-Verteilung mit 3 Freiheitsgraden dargestellt ist:
Es ist zu sehen, dass die beiden Verteilungen einige Gemeinsamkeiten aufweisen: Beide sind symmetrisch und haben nur einen Hochpunkt. Ein wesentlicher Unterschied besteht jedoch darin, dass die t-Verteilung an den Rändern links uns rechts jeweils deutlich über der Normalverteilung liegt. Dies bewirkt, dass bei einer t-Verteilung sehr viel häufiger Ausreißer auftreten als bei einer Normalverteilung.
Kommen wir nun zurück zu unseren zuvor erstellten Stichproben X1 und X2. Wir wenden auf beide Stichproben jeweils den Shapiro-Wilk-Test und den Kolmogorov-Smirnov-Test mit R an. Hierzu werden wir die folgenden 4 Befehle verwendet.
shapiro.test(X1)
ks.test(X1,"pnorm")
shapiro.test(X2)
ks.test(X2,"pnorm")
Nach Eingabe aller Befehle erhalten Sie in R den folgenden Output:
Achten Sie in jedem der einzelnen Outputs auf die Zahl p-value. Dies ist der p-Wert des Tests, und anhand des p-Werts wird die Entscheidung getroffen, ob eine Normalverteilung vorliegt.
Als Fazit dieser Analyse können Sie somit mitnehmen, dass der Shapiro-Wilk-Test eine höhere Teststärke aufweist, d.h. dass er besser darin ist, Abweichungen von der Normalverteilung zu erkennen als der Kolmogorov-Smirnov-Test.