Gepaarter t-Test – Berechnung

Nachdem wir im letzten Kapitel die Theorie und Voraussetzungen für den t-Test erklärt wurde, zeigt dieses Kapitel wie der t-Test und die Effektstärke berechnet werden. Bevor wir mit dem t-Anfangen, überprüfen wir zunächst unseren Datensatz auf Ausreißer und Normalverteilung.

 

Ausreiser untersuchen

Ausreißer sind Werte, die im ungewöhnlich klein oder groß sind und einen negativen Einfluss auf die Analyse haben, weil sie die Ergebnisse verfälschen. Um Ausreißer zu entfernen führen wir eine Explorative Datenanalyse durchführen und interpretieren die Ausgabe mit einem Box-Plot-Diagramm. Jeder Datenpunkt der um ein 1,5 faches vom Mittelwert entfernt ist wird mit einem Kreis markiert und zählt als einfacher Ausreißer. Datenpunkte, die mehr als das dreifache vom Mittelwert entfernt sind, gelten als extremer Ausreißer und werden mit einem Stern markiert. Häufig werden nur extreme Ausreißer entfernt. In der Regel werden beispielsweise extreme Ausreißer aus dem Datensatz entfernt. Lies dir das Tutorial für statistische Ausreißer durch, falls du nicht weißt, wie du Ausreißer identifizierst und mit ihnen umgehst.

Zum Tutorial statistische Ausreißer

 

Überprüfung auf Normalverteilung

Normalverteilte Streuungen der abhängigen Variable sind wünschenswert, jedoch nicht zwangsläufig notwendig. Als Faustregel gilt: Achte darauf, dass dein Stichprobe größer als N=50 ist. Wen das Signifikanzniveau des Shapiro-Wilk-Tests über .05 ist, liegt eine Normalverteilung vor.  Lies dir das Tutorial zur Überprüfung auf Normalverteilung durch, um den Datensatz zu überprüfen.

Zum Tutorial Überprüfung auf Normalverteilung

 

Berechnung gepaarter t-Test

1. Wir Navigieren auf Analysieren > Mittelwerte vergleichen > T-Test bei verbundenen Stichproben

2. Es öffnet sich die eine Dialogbox. In dem linken Feld werden uns alle verfügbaren Variablen angezeigt. Wir klicken auf eine Variable, halten die Maustaste gedrückt und ziehen die Maus über die passende Zelle in der Tabelle Gepaarte Variablen. Nachdem wir die Maustaste los lassen, haben wir die Variable in der Zelle platziert. Da wir den Unterschied zwischen den beiden Variablen messen wollen, platzieren wir die beiden Messwerte so, dass diese von SPSS als Variable1 und Variable2 erkannt werden.

Anschließend klicken wir auf die Schaltfläche Optionen.

Hinweis: Alternativ können wir eine Variable mit einem Klick mit der Maus markieren und diese mit diesem Symbol  bewegen.

3. Listenweiser Fallausschluss bedeutet, dass bei einem fehlenden Wert bei einer Messung das gesamte Paar aus der Analyse ausgeschlossen wird, was die zu untersuchenden Einheiten deutlich reduzieren kann. Falls mehr als zwei Paare untersucht werden, wird mit der Vorgehensweise Fallausschluss Test für Test lediglich das Paar aus der Berechnung ausgeschlossen, welches keinen Wert enthält. Dies ist weniger streng, weshalb wir in der Regel diese Option auswählen. Den Prozentsatz Konfidenzintervall belassen wir auf 95%.

Wir bestätigen mit einem Klick auf Weiter und klicken anschließend auf , um die Analyse zu starten.

Ergebnisse analysieren

1. SPSS zeigt uns in der Ausgabe mehrerer Tabellen. Die erste Tabelle zeigt deskriptive Gruppenstatistiken.

Gewicht 1 ist der erste Messzeitpunkt. In der Spalte Mittelwert (Mean) sehen wir, dass die Versuchspersonen durchschnittlich 102,79 kg gewogen haben. N zählt die Anzahl der Teilnehmer. Die beiden anderen Spalten sind Standardabweichung (Std. Deviation) und der Standardfehler des Mittelwertes (Std. Error Mean).

Wir sehen bereits in dieser Tabelle, dass sich in der zweiten Messung (Gewicht 2) das durchschnittliche Gewicht von 102,79 kg auf 85,33 kg reduzierte. In den nächsten Schritten finden wir heraus, ob diese Differenz auch signifikant ist.

 

2. Als nächstes interessieren wir uns für die Tabelle: Test bei gepaarten Stichproben (Paired Samples Test)

Unser Augenmerk wandert auf die letzten drei Spalten mit dem T-Wert, df-Wert und den Signifikanzniveau (Sig.)

2. In der Wissenschaft gibt es eine Vorgabe, wie der t-Test zu nennen ist. In unserem Beispiel schreiben wir t(93) = 8.668, p < .001.

Exkurs: Was bedeuten die Werte?
Der Buchstabe T vor der Klammer gibt an, dass die Berechnung auf einer t-Verteilung basiert (t-Statistik). Die Zahl in der Klammer gibt die Freiheitsgrade (degree of freedom = df) an. Wenn sich eure Stichprobengröße ändert, so verändern sich auch die Freiheitsgrade. Der T-Wert nach dem Gleichheitszeichen bestimmt den Wert in einem statistischen Nachschlagewerk zur Bestimmung der Signifikanz (eher unwichtig). Nach dem Komma steht der p-Wert und gibt uns an, ob die Unterschiede zwischen den Messungen und Gruppen signifikant ist, oder nicht. Häufig wird von einem Signifikanzniveau von p = .05 ausgegangen. Das heißt, wenn der p-Wert .05 oder niedriger ist, wird von einer Signifikanz ausgegangen und nicht von einem Zufall ausgegangen.

Die Ergebnisse sind signifikant:

  • BDI-Werte waren signifikant niedriger nach der Präsentation der Katzenvideos, t(99) = -2.23, p = .028.
  • BDI-scores were significantly lower after presentation of the cat videos, t(99) = -2.23, p = .028.

Die Ergebnisse sind nicht signifikant:

  • Es gab keinen signifikanten Unterschied zwischen den BDI-Werte vor und nach Präsentation der Katzenvideos, t(99) = -2.23, p = .241.
  • There was no difference in BDI-scores before and after presentation of the cat videos, t(99) = -2.23, p = .241.

 

Berechnung der Effektstärke

Effektstärken sind neben der Signifikanz die wichtigsten Werte …

Die Effektstärke berechnen wir nach Cohen’s d mit einem einfachen Quotienten. Wir teilen den Mittelwert durch die Standardabweichung.

Die beiden Werte befinden sich in der Tabelle: Test bei gepaarten Stichproben (wie oben)

Der Mittelwert (Mean) geteilt durch die Standardabweichung (Std. Deviation).

 

Intervalle zur Interpretation von Cohen’s d:

|d| steht in Betrag, dass heißt, dass bei der Interpretation des Ergebnisses das Vorzeichen ignoriert wird. Ein negatives Vorzeichen wird wie ein positives interpretiert.

|d| ≤ 0.2kleiner Effekt
0.2 < |d| ≤ 0.5mittlerer Effekt
|d| < 0.8großer Effekt

Darstellung der Ergebnisse mit Effektstärke

  • BDI-Werte waren signifikant niedriger nach der Präsentation der Katzenvideos, t(99) = -2.23, p = .028, d = 0.22.
  • BDI-scores were significantly lower after presentation of the cat videos, t(99) = -2.23, p = .028, d = 0.22.