Tutorial

Zweck dieses Tutorials

Dieses Tutorial erklärt anhand eines Beispiels einen typischen Analyse-Vorgang mit StatiBot.

Courtesy of Joanna Porankiewicz Asplund

Daten und Fragestellung

Igel fressen bekanntlich Schnecken. In einer Studie ermitteln Sie nun die Häufigkeit von Igeln und Schnecken in zehn Bezirken Ihrer Stadt. Weil die Bezirke nicht gleich gross sind, rechnen Sie die Häufigkeiten auf Flächeneinheiten um: Igel pro Quadratkilometer, Schnecken pro Quadratmeter:

Bezirk

Igel pro qkm

Schnecken pro qm

Stadtzentrum

15.0

4.9

Obertor

16.5

2.9

Untertor

38.5

5.2

Westring

37.0

6.1

Südring

32.0

8.3

Ostring

26.5

7.0

Sonnenberg

54.0

7.2

Himmeltal

57.5

15.3

Entenholz

71.0

13.8

Zellerwald

83.0

12.0

Es bestehen grundsätzlich zwei Möglichkeiten:

Variante 1: Hohe Schneckendichten kommen mit hohen Igeldichten zusammen vor und niedrigen Schneckendichten mit niedrigen Igeldichten. Möglicher Grund: Ein grosses Angebot an Schnecken zieht die Igel an:

Variante 2: Hohe Schneckendichten kommen mit niedrigen Igeldichten zusammen vor und umgekehrt. Möglicher Grund: Die Igel dezimieren die ursprünglich vorhandenen Schnecken:

Vermutung

Aufgrund der Tabelle scheint Variante 1 zuzutreffen: Je mehr Igel vorhanden sind, desto mehr Schnecken sind im allgemeinen vorhanden. Allerdings ist der Zusammenhang nicht sehr strikt. So wird die höchste Schneckendichte (15.3) im Himmeltal und nicht im Zellerwald beobachtet, wo es am meisten Igel gibt (83.0). Dasselbe gilt für die kleinsten Dichten (15.0 und 2.9). Der vermutete Zusammenhang könnte also eher ein Zufallsergebnis sein. Oder aber er könnte auf einem wirklichen Zusammenhang beruht. Dies abzuklären, ist Ihr Ziel.

Daten-Eingabe

Der StatiBot wird gestartet. Die Werte werden so wie oben in die Tabelle eingetragen, die der StatiBot anbietet. Das Programm erkennt, dass die Tabelle aus 11 mal 3 Feldern besteht. Es verlangt Bestätigungen dafür, dass die erste Zeile Spalten-überschriften enthält. Dass StatiBot auch offen ist für andere Eingabeformen, wird am Ende dieses Tutorials gezeigt.

Ermittlung der Fragestellung

Danach wird die Analyse-Methode Schritt für Schritt eingegrenzt. Bei jeder Frage helfen Ihnen Beispiele, die richtige Antwort zu finden:

Frage Antwort
Sind die Masseinheiten der beiden Spalten "Igel pro qkm" und "Schnecken pro qm" gleich? Nein.
Die Werte der einen Spalte wurden im Verlaufe der Untersuchung gewonnen. Wie ergaben sich die Werte der anderen Spalte? Ebenfalls erst im Verlaufe der Untersuchung.
Sind Sie sicher, dass die Werte in der einen Spalte wenigstens teilweise verantwortlich sind für die Werte in der anderen Spalte? Dass also die eine Grösse die Ursache bedeutet und die andere die Wirkung? Nein, die Ursächlichkeit ist offen.
Interessiert Sie, ob die Werte der beiden Grössen sich gemeinsam ändern? Ja.
Wie sind die Zahlenwerte gewonnen worden? Durch Messen oder Zählen.
Sind die Werte in beiden Spalten normalverteilt? Unbekannt.
StatiBot hat einen D'Agostini-Test durchgeführt. Demgemäss sind die Daten in der Spalte "Igel pro qkm" normalverteilt. Möchten Sie diese Entscheidung bestätigen? Ja.
StatiBot hat einen D'Agostini-Test durchgeführt. Demgemäss sind die Daten in der Spalte "Schnecken pro qm" auch normalverteilt. Möchten Sie diese Entscheidung bestätigen? Ja.

Ergebnisse

Das Besondere an StatiBot ist, dass er Sie unterstützt bei der Findung des richtigen Tests. Weiter versetzen reichhaltige Verweise (ähnliche Tests, Synonyme, Literaturangaben) Sie in die Lage, sich zusätzliche Informationen zur Analyse zu beschaffen. Und schliesslich liefert StatiBot, wie andere Statistikprogramme auch, die verschiedenen Kennzahlen des Tests.

Hier die konkreten Ergebnisse zum Igel-Schnecken-Beispiel:

Name des passenden Tests Korrelationsanalyse nach Pearson
Hauptaussage des Tests in Wort und Bild

Je grösser die Werte der Spalte "Igel pro qkm" sind, desto grösser sind die Werte der Spalte "Schnecken pro qm".

Hinter diesem Ergebnis steckt fast sicher ein sachlicher Zusammenhang. Die Wahrscheinlichkeit, dass das Ergebnis zufällig entstanden ist, ist äusserst gering.

überprüfung von Vorbedingungen StatiBot hat einen D'Agostini-Test durchgeführt. Demgemäss sind die Daten in der Spalte "Igel pro qkm" normalverteilt. Wenn Sie den Test zitieren möchten, wählen Sie die folgenden Angaben: n = 10, T = 608, D = 0.2819, p > 0.2.

StatiBot hat einen D'Agostini-Test durchgeführt. Demgemäss sind die Daten in der Spalte "Schnecken pro qm" auch normalverteilt. Wenn Sie den Test zitieren möchten, wählen Sie die folgenden Angaben: n = 10, T = 107, D = 0.2763, p > 0.2.

Angaben zum p-Wert Der p-Wert ist 0.00455. Ein tiefer p-Wert bedeutet, dass das Resultat statistisch gesehen bedeutungsvoll (signifikant) ist. Ein hoher p-Wert bedeutet, dass die gefundenen Unterschiede zufälliger Natur sind.

In vielen Situationen ist es sinnvoll, die Grenze von 0.05 als Entscheidungskriterium zu verwenden. Doch ist diese Grenze letztlich willkürlich.
Vorschlag für ein wissenschaftliches Zitat Zitieren Sie das Resultat wie folgt: n = 10, r = 0.809, t = 3.90, p(zweiseitig) = 0.00455.
Erläuterung der Kennwerte Der Wert r heisst Korrelationskoeffizient. Er liegt zwischen -1 und +1.

Korrelationskoeffizienten über Null bedeuten, dass sich die Werte der beiden Spalten in die gleiche Richtung bewegen; solche unter Null bedeuten, dass kleine Werte der einen Spalte mit grossen Werten der anderen Spalte auftreten (und umgekehrt).

Korrelationskoeffizienten nahe bei Null deuten auf einen schwachen Zusammenhang. Solche nahe bei -1 oder +1 deuten auf einen starken Zusammenhang.
Unterstützung bei der Interpretation Aufgrund einer gefundenen Korrelation kann nicht auf die Richtung der Ursächlichkeit geschlossen werden. Es gibt drei Möglichkeiten:

1. "Igel pro qkm" beeinflusst "Schnecken pro qm".
2. "Schnecken pro qm" beeinflusst "Igel pro qkm".
3. Ein dritter, unbekannter Faktor beeinflusst sowohl "Igel pro qkm" als auch "Schnecken pro qm".

Ein Studie, in der "Igel pro qkm" oder "Schnecken pro qm" experimentell festgelegt wird, stellt die Richtung der Ursächlichkeit klar (falls eine solche Studie möglich ist).
Synonyme

Andere Bezeichnungen für diese Analyse sind: "Einfache lineare Korrelationsanalyse", "Produktmoment-Korrelation" oder "Parametrische Korrelationsanalyse".

Literaturangaben

G. Clauss et al. (1994) Statistik für Soziologen, Pädagogen, Psychologen und Mediziner, Verlag Harri Deutsch, Thun/Frankfurt am Main, p. 299ff.

J. Zar (1984) Biostatistical Analysis, Prentice Hall, Englewood Cliffs, p. 306ff.

R. Sokal & F. Rohlf (1987). Introduction to Biostatistics, W. H Freeman and Company, New York, p. 267ff.

Offene Eingabe-Strukturen

StatiBot besitzt offene Eingabe-Strukturen. Daten können in einfacher Weise aus Tabellenblättern oder Textverarbeitungsprogrammen kopiert werden. Dies geschieht mit normalen Kopier- und Einfügemethoden.

Natürlich ist StatiBot offen für andere Tabellen-Varianten zu ein und demselben Studien-Design. So können im Igel-Schnecken-Beispiel die Bezeichnungen der Bezirke weggelassen werden:

Igel pro qkm

Schnecken pro qm

15.0

4.9

16.5

2.9

38.5

5.2

37.0

6.1

32.0

8.3

26.5

7.0

54.0

7.2

57.5

15.3

71.0

13.8

83.0

12.0

Oder die Daten können z. B. ohne Titel, waagrecht und mit Kommata anstelle der Dezimalpunkte dargestellt werden:

15

16,5

38,5

37

32

26,5

54

57,5

71

83

4,9

2,9

5,2

6,1

8,3

7

7,2

15,3

13,8

12