Methoden Einführung: Statistik mit Löwen – Teil 2

Nick Bornschein Blog, Statistik

Nach der deskriptiven Betrachtung der historischen Daten gehen unsere Archäologen einen Schritt weiter und stellen sich folgende Forschungsfrage: H1: Je länger die Löwen bei den Zirkusspielen im Einsatz sind, desto höher ist ihr Gewicht. Für die Beantwortung dieser Frage bedienen sich die Forscher zunächst einer einfachen Korrelationsanalyse. pwcorr gewicht monate, sig obs Diese fördert zu Tage, dass das Gewicht und …

Der p-Wert und die False Discovery Rate

Jakob Gepp Blog, Statistik

Zum Überprüfen von Hypothesen werden meist p-Werte verwendet. Doch häufig werden diese falsch interpretiert oder gar so lange bearbeitet, bis etwas „signifikant“ ist. Letzteres wird auch p-Hacking genannt. Die Frage ist nun, was genau sagen p-Werte aus? Definition Der p-Wert ist die Wahrscheinlichkeit, dass ein beobachtetes Ergebnis, unter der Annahme die Nullhypothese ist korrekt, mindestens so extrem ausfällt wie es …

Herausforderungen der nicht-parametrischen Statistik: der Wilcoxon-Rangsummen-Test

Alexander Niltop Blog, Statistik

Bei der Reise durch das nicht-parametrische Universum begegnet man auch Phänomenen, denen man lieber nicht begegnen möchte: schwarzen Löchern. Diese können zu Beginn sehr klein sein, doch wenn man sie nicht beachtet und versucht, sich (heimlich) an ihnen vorbeizuschleichen, stürzen sie alles ins Chaos. Auch in der Nähe der Welt des Wilcoxon-Rangsummen-Tests gibt es eines davon. Die Welt des Wilcoxon-Rangsummen-Tests …

Gut in Form – So klappts mit der Datenaufbereitung in R, Stata und SPSS

Jessica Aust Blog, Statistik

In der “Gut in Form”-Serie werden in den nächsten Wochen verschiedene Möglichkeiten gezeigt, um die Daten optimal für die Analyse vorzubereiten. Die Durchführung wird dabei jeweils in R, Stata und SPSS vorgestellt. So werden auch Vor- oder Nachteile der verschiedenen Programme sichtbar. Datenimport und -export Egal wie gut die Methodenkenntnisse sind, haben die Daten nicht die gewünschte Form, lässt sich …

Stolperfalle logistische Regressionskoeffizienten und Odds Ratios

Lea Waniek Blog, Statistik

Logistische Regressionsmodelle, sind mit gängiger Statistiksoftware meist genauso leicht zu schätzen wie lineare Regressionen. Doch die Interpretation solcher Modelle, also der Part der statistischen Analyse der nicht von der Software übernommen wird, birgt eine Tücke: die Bezugsgröße der Regressionskoeffizienten. Ausgehend von den unabhängigen Merkmalen der Beobachtungen, modellieren logistische Regressionsmodelle die Wahrscheinlichkeit mit der eine bestimmte Ausprägung eines kategorialen abhängigen Merkmals …

Methoden Einführung: Statistik mit Löwen – Teil 1

Nick Bornschein Blog, Statistik

Der folgende Blog und seine Fortsetzungen behandeln ein fiktives Projekt anhand konstruierter Daten und begleiten es von der ersten deskriptiven Betrachtung (Teil 1) bis hin zur Auswertung mit Hilfe verschiedener analytischer Möglichkeiten und graphischer Darstellungen. Das Verständnis der Daten steht dabei im ersten Teil im Vordergrund, denn ohne die Kenntnis der eigenen Daten kann auch keine gute Analyse stattfinden. Mehr …

Methoden Einführung: der t-Test

Jakob Gepp Blog, Statistik

Einer der am häufigsten verwendeten statistischen Tests ist der t-Test. Er kann unter anderem dazu genutzt werden, zu prüfen, ob der Mittelwert einer Zufallsvariable einem bestimmten Wert entspricht. Auch kann er für den Vergleich zweier Mittelwerte herangezogen werden. Wie bei jedem anderen statistischen Test auch, müssen gewisse Voraussetzungen erfüllt sein, damit der t-Test sicher eingesetzt werden kann: Normalverteilung der Zufallsvariablen …

Einführung in die nicht-parametrische Statistik: der Wilcoxon-Rangsummen-Test

Alexander Niltop Blog, Statistik

Niederländer lieben Käse, Holzschuhe und am liebsten sitzen sie hinter dem Steuer ihres Wohnwagens! Oder? Will man solche Vorurteile (seriös) untersuchen, muss man dazu Daten erheben. So könnte man die jährliche Fahrzeit im Wohnwagen bei Niederländern und beispielsweise Deutschen erfassen und im Anschluss überprüfen, ob sich beide Nationen im Mittel bei der Fahrzeit unterscheiden. Dafür bietet sich als erstes der …

Faktorenanalyse mit binären Items in SPSS

Sebastian Heinz Blog, Statistik

Die Annahme multivariat normalverteilter Items bei der Durchführung einer exploratorischen Faktorenanalyse (EFA) verhindert, streng genommen, die Verwendung von binär skalierten Items (0/1-Codierung). Zwar entspricht der Pearson-Korrelationskoeffizient zwischen zwei binären Items dem Phi-Koeffizienten, der Stärke und Richtung des Zusammenhangs zwischen zwei binären Items misst, jedoch ist aufgrund des limitierten Wertebereichs eines binären Items die geforderte Verteilungsannahme einer multivariaten Normalverteilung klar verletzt. …

Korrelierte Zufallszahlen in R

Sebastian Heinz Blog, Statistik

Das Erzeugen von korrelierten Zufallsvariablen ist einer der Kernpunkte bei der Programmierung von Simulationen. Aktienrenditen, Zeitreihen, MCMC-Algorithmen und viele weitere Verfahren verwenden können durch das Erstellen korrelierter Zufallszahlen verwendet werden. Zerlegen der Korrelationsmatrix Korrelierte Zufallszahlen können durch Multiplikation der n x p Matrix der Zufallswerte mit der gewünschten Cholesky-zerlegten Korrelationsmatrix C der Zufallswerte erzeugt werden. Eine Cholesky-Zerlegung lässt sich in …