Dieser Artikel erklärt, wann eine Kovarianzanalyse (ANCOVA) zum Einsatz kommt. Mit einer Varianzanalyse kannst Du den Einfluss von ein oder mehreren nicht metrisch-skalierten unabhängigen Variablen auf eine abhängige metrisch-skalierte Variable auf Signifikanz untersuchen. Dazu teilst Du die Beobachtungen der abhängigen Variablen nach ihrer Gruppenzugehörigkeit zu den Ausprägungen der unabhängigen Variablen ein. Du vergleichst dann die Varianz der Beobachtungswerte innerhalb einer Gruppe mit der zwischen den Gruppen und schließt auf Signifikanz, wenn die Varianz zwischen den Gruppen deutlich größer als die innerhalb der Gruppen ist.
Variablen werden aber häufig durch einen Mix von metrisch und nicht-metrisch skalierten unabhängigen Variablen beeinflusst. Das Ergebnis Deiner Varianzanalyse kann daher durch eine bestehende lineare Abhängigkeit von einer metrischen Variablen beeinflusst werden.
Idee der ANCOVA
Dem trägt die Kovarianzanalyse Rechnung: Sie geht vom allgemeinen linearen Modell aus. Einerseits wird eine abhängige Variable Y durch die Effekte verschiedener Kategorien der nicht metrischen Einflussgrößen bestimmt. Andererseits wird sie durch eine lineare Abhängigkeit von der unabhängigen metrischen Variablen X, der Kovariablen, bestimmt.
Im einfachsten Fall mit einer nicht-metrischen unabhängigen Variablen
darstellen. Dabei ist
Ziel der ANCOVA
Ziel der Kovarianzanalyse ist es, den Einfluss der unabhängigen nicht-metrischen Variablen auf Signifikanz zu untersuchen, nachdem die Beobachtungen um den linearen Einfluss der Kovariablen (wie bei der Regressionsananalyse) bereinigt sind.
Stell Dir beispielsweise vor, Du als Regionalleiter einer Supermarktkette möchtest eine neuen Produktserie „Schneller Mittagstisch“ einführen. Dir stehen verschiedene Werbemittel zur Verfügung und Du möchtest wissen, ob deren Einsatz Deinen Umsatz signifikant beeinflussen kann. Außerdem weißt Du, dass neben dem Einfluss Deiner Werbung eine lineare Abhängigkeit vom Preis besteht.
Du entscheidest Dich, Deine Handlungsvarianten eine Woche lang an zehn Testmärkten auszuprobieren und zu dokumentieren, so dass Du je 20 Beobachtungen von Preis und abgesetzter Menge für jedes Werbemittel erhältst. Auf die erhaltenen Daten möchtest Du dann eine Kovarianzanalyse anwenden.
So könnte Deine Dokumentation aufgebaut sein:
1 | 27 | Sonderpräsentation | 4,50 € |
2 | 23 | Aktionstisch | 4,50 € |
3 | 24 | Zeitungsbeilage | 5,00 € |
4 | 16 | Aktionstisch | 4,70 € |
5 | 19 | Zeitungsbeilage | 4,30 € |
… | … | … | … |
60 | 21 | Sonderpräsentation | 4,30 € |
Vorgehen bei einer ANCOVA
Bei der Kovarianzanalyse berechnest Du zuerst eine Regression der umgesetzten Menge Y auf die unabhängige metrische Variable Verkaufspreis und schätzt eine lineare Beziehung: Y = f(X).
Setzt Du in diese lineare Beziehung jeweils den Verkaufspreis
Auf diese
Wie sieht die Prüfgröße aus?
Dieser Quotient aus zwei
Für Dein Beispiel mit n = 3 Werbemitteln und m = 20 Beobachtungen pro Werbemittel habe sich ein Prüfwert von
und schließt auf signifikanten Einfluss der Werbemittel bei einer Irrtumswahrscheinlichkeit von
Wann verwirfst Du die Nullhypothese?
Im Falle, dass Dein Programm den p-Wert ausgibt, kannst Du Deine Testentscheidung noch einfacher treffen. Du verwirfst dann die Nullhypothese, falls der ausgegebene p-Wert kleiner ist als Dein Niveau
Die Kovarianzanalyse ist damit ein vielseitiges Analyseelement, das aber nur unter relativ engen Voraussetzungen angewandt werden darf, die im Vorfeld zu prüfen sind:
Die abhängige Variable und die Kovariable sind in der Grundgesamtheit normalverteilt. | z. B. Anderson-Darling-Test |
Es gibt einen linearen Zusammenhang zwischen der abhängigen Variablen und der Kovariablen. | F-Test auf Signifikanz der Regressionskoeffizienten |
Die Varianz der Grundgesamtheit ist homogen | z. B. F-Test oder Bartlett-Test auf Homoskedastizität |
Die lineare Regression ist in den verschiedenen Ausprägungen der unabhängigen nicht-metrischen Variablen homogen. | Dayton-Test |