de
                    array(1) {
  ["de"]=>
  array(13) {
    ["code"]=>
    string(2) "de"
    ["id"]=>
    string(1) "3"
    ["native_name"]=>
    string(7) "Deutsch"
    ["major"]=>
    string(1) "1"
    ["active"]=>
    string(1) "1"
    ["default_locale"]=>
    string(5) "de_DE"
    ["encode_url"]=>
    string(1) "0"
    ["tag"]=>
    string(2) "de"
    ["missing"]=>
    int(0)
    ["translated_name"]=>
    string(7) "Deutsch"
    ["url"]=>
    string(91) "https://www.statworx.com/content-hub/blog/methoden-einfuehrung-statistik-mit-loewen-teil-1/"
    ["country_flag_url"]=>
    string(87) "https://www.statworx.com/wp-content/plugins/sitepress-multilingual-cms/res/flags/de.png"
    ["language_code"]=>
    string(2) "de"
  }
}
                    
Kontakt
Content Hub
Blog Post

Methoden Einführung: Statistik mit Löwen – Teil 1

  • Expert:innen Nick Bornschein
  • Datum 20. Oktober 2017
  • Thema Statistics & Methods
  • Format Blog
  • Kategorie Technology
Methoden Einführung: Statistik mit Löwen – Teil 1

Der folgende Blog und seine Fortsetzungen behandeln ein fiktives Projekt anhand konstruierter Daten und begleiten es von der ersten deskriptiven Betrachtung (Teil 1) bis hin zur Auswertung mit Hilfe verschiedener analytischer Möglichkeiten und graphischer Darstellungen. Das Verständnis der Daten steht dabei im ersten Teil im Vordergrund, denn ohne die Kenntnis der eigenen Daten kann auch keine gute Analyse stattfinden. Mehr noch, viel zu oft erleben wir, dass einfach „drauf los“ gerechnet wird. Kein einfacher Blick auf deskriptive Statistiken, der vor allem mit einer gewissen Erfahrung auch für die später folgenden Analysen bereits einiges an Bedeutung hat, keine Betrachtung von Ausreißern etc. Für alle Teile dieses Blogs gilt, dass hauptsächlich bei Grafiken auf die detaillierte Beschreibung der commands in Stata verzichtet wird, da dies für einen Blog deutlich zu weit führen würde. Blogeinträge zum Thema Grafiken werden aber in Zukunft ebenfalls folgen. Wie in jeder guten statistischen Analyse steht am Anfang eine kurze Einführung in die Daten.

Einführung in die Daten

Bei den Zirkusspielen (ludi circenses) im Alten Rom handelte es sich um eine außerordentlich populäre Attraktion für die damalige Stadtbevölkerung. Zeitgleich waren die Spiele eine Möglichkeit, politische Störenfriede und Gefangene loszuwerden. Diese Methode war allerdings nicht nur todsicher und überaus beliebt, sondern hatte eine missliche Nebenwirkung: fette Löwen. Während einer archäologischen Ausgrabung im Kolosseum in Rom wurden auf Tontafeln Strichlisten und Einträge zu den dort für die Spiele gehaltenen Löwen gefunden. Diese beinhalteten Informationen zum Geschlecht, Alter, Gewicht und Art der Löwen, sowie Angaben darüber, wie lange die Löwen bereits für die Spiele eingesetzt wurden. Nach dem mühsamen Zusammensetzen der Scherben wurden die Daten in eine Excel-Datei übertragen und stehen somit für die Auswertung bereit.

Deskriptive Auswertung

Die ausführenden Archäologen des Projekts, begannen den überraschenden Fund zunächst deskriptiv auszuwerten.

tab geschlecht
tab art
su gewicht monate

Insgesamt finden sich N=517 Angaben über Löwen, von denen 53,19% (N=275) männlich und 46,81% (N=242) weiblich sind. Anscheinend war es für das Entertainment egal, welches Geschlecht ein Löwe hatte. Hinsichtlich der Arten gab es zum Zeitpunkt der Zählung 156 Berberlöwen (30,17%), 167 Massai-Löwen (32,30%) und 194 Senegal-Löwen (37,52%). Das durchschnittliche Gewicht aller Löwen beträgt M=150,57 mit einer Standardabweichung von SD=32,709, wobei das Gewicht zwischen 75kg und 209kg schwankt. Durchschnittliche 12,74 Monate (knapp 1 Jahr) waren die Löwen bereits im Einsatz (SD=6,948), minimal einen Monat und maximal 33 Monate, immerhin fast 3 Jahre.

Grafische Betrachtung

Um ohne tiefergehende Statistik schnell zu erfassen, wie sich Alter, Gewicht und Geschlecht zueinander verhalten, erstellten die Forscher ein Streudiagramm (siehe unten). Wenig überraschend steigt das Gewicht der Löwen mit zunehmender Alter an, wobei zwischen dem Geschlecht rein optisch kein größerer Unterschied zu existieren scheint. Zwei markante Ausreißer wurden in den Daten zudem markiert, die vielleicht später noch von Interesse sein könnten.

Scatterplot Alter Gewicht und Geschlecht von Loewen

Eine Forschungsfrage entsteht

Bezüglich der Daten muss folgende Anmerkung gemacht werden: Das Gewicht der Löwen bei ihrer Ankunft in Rom wurde anscheinend nicht erfasst. Somit wissen wir aus obiger Grafik lediglich, dass Löwen mit einem höheren Alter auch mehr wiegen, nicht aber welchen Gewichtszuwachs ein einzelner Löwe während seines Aufenthalts im Zirkus zu verzeichnen hat. Die hiesigen Forscher hoffen, durch neue Ausgrabungen weitere Tontafeln mit zusätzlichen Daten zu finden (wir werden hier darüber berichten), doch aktuell muss die vorhandene Datenlage als ausreichend hingenommen werden. Somit kann nicht mit Gewissheit gesagt werden, dass die Löwen aufgrund ihrer Dauer im Zirkus dicker geworden sind, es ist jedoch mit Blick auf die Umstände anzunehmen. Wir gehen an dieser Stelle einfach davon aus.

Die erste naheliegende Frage der Forscher war im Anschluss, ob die Löwen – nunmehr nicht in ihrer natürlichen Umgebung beheimatet und gut gefüttert – aufgrund der Zeit im Zirkus schwerer wurden.

Boxplots Gewicht Dauer und Alter von Loewen

Graphisch zeigt sich, dass Löwen, die erst seit kurzem im Zirkus sind, noch um die 100kg wiegen und das Gewicht bis zu einer Dauer von 16 bzw. 17 Monaten ansteigt, um dann nach einer gewissen Zeit (18-24 Monate) ihr Gewicht zunächst zu halten. Erst ab dem 25. Monat scheinen sie dann wieder an Gewicht zu verlieren.

Scatterplot Gewicht Dauer und Alter von Loewen

Auch wenn das Ausgangsgewicht der Tiere nicht vorlag, so wollte man nun zumindest feststellen, ob es ggf. auch ältere Tiere gab, die nur kurze Zeit im Zirkus waren und umgekehrt. Die obenstehende Grafik macht deutlich, dass sich Löwen unter 9 Jahren auch nur bis zu ca. 13 Monate im Zirkus befinden und Löwen mittleren und höheren Alters breiter streuen. Konkreter wollte man an dieser Stelle jedoch ohne tiefergehende statistische Analysen nicht werden. Dennoch spricht die Grafik dafür, dass die Löwen ausschließlich im jungen Alter gefangen wurden, womöglich da sie in diesem Alter besser erziehbar waren.

Abgerundet wird die Betrachtung durch eine Tabelle, welche die Mittelwerte, Standardabweichungen, Mediane und Minimal- sowie Maximalwerte auflistet, welche den Forschern rein deskriptiv in ihrer Vermutung recht gibt.

tabstat gewicht, statistics(count mean sd median min max) by(monate_kat)

Stata Ausgabe deskriptiver Statistik

Ausblick

Ob die Archäologen auch aus statistischer Sicht Recht behalten sollen und die Löwen wirklich schwerer wurden, je länger sie im Zirkus waren, zeigen wir im 2. Teil des Blogs. Nick Bornschein Nick Bornschein

Mehr erfahren!

Als eines der führenden Beratungs- und Entwicklungs­unternehmen für Data Science und KI begleiten wir Unternehmen in die datengetriebene Zukunft. Erfahre mehr über statworx und darüber, was uns antreibt.
Über uns