Einfaktorielle ANOVA – Einführung

Die ANOVA (analysis of variance) ist ein strukturprüfendes Verfahren und gleich dem t-Test, indem sie Gruppenunterschiede (oder Bedingungsunterschiede) vergleicht. Der Vorteil der ANOVA liegt darin, mehr als zwei Gruppen vergleichen zu können.

Ein Beispiel: Anhand eines Experimentes soll untersucht werden, welche Diät am wirkungsvollsten das Körpergewicht reduziert. Hierzu teilen wir die Versuchspersonen in drei Gruppen ein. Die erste Gruppe verzichtet auf Kohlenhydrate, die zweite Gruppe versucht es mit der Ananas-Diät des Fachmagazins „Brigitte“ , während Gruppe Nummer drei die steinzeitliche Paleo Diät anwendet. Die abhängige Variable (AV) ist das Körpergewicht, das an zwei Messzeitpunkten (vor und nach der Diät) gemessen wird. Die Diätform ist die unabhängige Variable  (UV) mit drei Ausprägungen. In diesem Versuch ließe sich noch eine vierte Kontrollgruppe einbauen. Eine mögliches Ergebnis könnte sein, das sie Wahl der Diät einen signifikanten Einfluss auf die Gewichtsabnahme hat und ein verzicht auf Kohlenhydrate (Gruppe 1) signifikant mehr Gewichtsverlust zur Folge hat, als die anderen Diätformen.

Der Versuchsaufbau, der die Mittelwerte von abhängigen Variablen mehrere Gruppen unterscheidet, wird als Between-Subjects-Design bezeichnet. Die ANOVA selbst gibt uns nur einen p-Wert, der statistisch signifikant sein kann – oder nicht. Signifikanz bedeutet, dass sich der Mittelwert mindestens einer Gruppe nicht nur zufällig von den anderen Gruppen unterscheidet. Welche Gruppe oder Gruppen das genau sind, kann nur mit weiteren Test, den sogenannten post-hoc Analysen, festgestellt werden. Eine Schritt für Schritt Anleitung  gibt es in den folgenden Tutorials.

Hinweis: Weil eine ANOVA nur einen Signifikanzwert (p-Wert) für alle Gruppen ausgibt, wird sie auch als Omnibus-Verfahren betitelt.

Vorraussetzungen

  • Unabhängige Messungen: die Varianzanalyse vergleicht unterschiedliche Messobjekte, in unserem Fall Versuchspersonen, zu unterschiedlichen Zeitpunkten. Die Gruppen oder Bedingungen (UV) dürfen sich nicht gegenseitig beeinflussen, dass heißt eine Versuchsperson darf sich unter keinen Umständen in mehreren Gruppen zu befinden.
  • Skalenniveaus: die unabhängige Variable (Zeitpunkt der Messung) ist nominalskaliert, während die abhängige Variable (Gewicht) mindestens intervallskaliert ist.
  • Ausreißer: Die ANOVA ist empfindlich gegenüber Ausreißern, weshalb der Datensatz auf Ausreißer hin überprüft werden sollte.
  • Normalverteilung: die abhängige Variable (Gewicht) in jeder Gruppe sollte so weit wie möglich normalverteilt sein – jedoch nicht zwangsläufig. Die Berechnung in SPSS wird später Schritt für Schritt erklärt.
  • Homoskedastizität: die Varianzen aller Gruppen sollte ungefähr gleich groß sein, um zu vermeiden eine Nullhypothese zurückzuweisen, die eigentlich war ist. Die Berechnung der Homoskedastizität wird später Schritt für Schritt erklärt.

Beispieldatensatz

Falls keine eigenen Daten vorhanden sind, kann das Tutorial mit diesem Beispieldatensatz nachgerechnet werden. Zum Herunterladen wird ein kostenloses Konto benötigt.

Hier geht es weiter mit Berechnung einer einfaktoriellen ANOVA in SPSS