Fehlerbehandlung in R: Debugging mit RStudio

Markus Berroth Blog, Data Science, Statistik

In der Blog-Reihe „Fehlerbehandlung in R“ geht es um effizientes und systematisches Überprüfen von R-Code. Den Beginn macht das Finden von Fehlern durch Debugging, weiter geht es mit der Handhabung von Fehlern und endet mit Unit-Testing, das zum Überprüfen von korrekter Funktionalität von R-Code dient. Die Reihe startet mit Debugging in R, wobei Debugging ein breitgefächertes Thema ist. Dieser Artikel …

Data Science mit R

Sebastian Heinz Blog, Data Science

Data Science, Big Data, Machine Learning – die rasante Entwicklung von Computern, Massenspeichern und korrespondierenden Technologien wirft seit geraumer Zeit ein neues Licht auf die Speicherung und Auswertung von Daten strukturierter und unstrukturierter Art. Insbesondere der Begriff „Big Data“, der mittlerweile eher inflationär verwendet wird, war ein Buzzword ganzer Industrien. Im gleichen Atemzug zu Begriffen wie Data Science, Machine Learning und …

Web-Applikationen mit R und R Shiny

Tobias Krabel Blog, Data Science

Seit einiger Zeit ist mit Shiny ein Paket für die Statistiksoftware R verfügbar, mit dessen Hilfe man ansprechende, interaktive Webapplikationen erstellen und hierbei auf den kompletten Funktionsumfang von R zugreifen kann. Mit Hilfe des R Paketes Shiny lassen sich schnell HTML/JavaScript-basierte, interaktive Webapplikationen erstellen. Die möglichen Anwendungsszenarien sind vielfältig: Reporting, Deployment von statistischen Analysen, interaktive Visualisierungen von Datenbeständen. Bei der …

Reporting mit R und R Markdown: A Whisky Guide

Fabian Müller Blog, Data Science

Wir bei STATWORX lieben Daten. Und wir genießen von Zeit zu Zeit gerne ein Gläschen guten schottischen Single Malt Whisky unter Kollegen. Vor einiger Zeit hatten die Kollegen von Revolution Analytics einen interessanten Blog-Beitrag zum Thema k-Means Clustering von Single Malt Whiskies veröffentlicht, den wir aufmerksam studiert haben. Ebenfalls wurde kürzlich eine aktualisierte Version von RStudio veröffentlicht, die ein umfangreiches …

Faktorenanalyse mit binären Items in SPSS

Sebastian Heinz Blog, Statistik

Die Annahme multivariat normalverteilter Items bei der Durchführung einer exploratorischen Faktorenanalyse (EFA) verhindert, streng genommen, die Verwendung von binär skalierten Items (0/1-Codierung). Zwar entspricht der Pearson-Korrelationskoeffizient zwischen zwei binären Items dem Phi-Koeffizienten, der Stärke und Richtung des Zusammenhangs zwischen zwei binären Items misst, jedoch ist aufgrund des limitierten Wertebereichs eines binären Items die geforderte Verteilungsannahme einer multivariaten Normalverteilung klar verletzt. …

Korrelierte Zufallszahlen in R

Sebastian Heinz Blog, Statistik

Das Erzeugen von korrelierten Zufallsvariablen ist einer der Kernpunkte bei der Programmierung von Simulationen. Aktienrenditen, Zeitreihen, MCMC-Algorithmen und viele weitere Verfahren verwenden können durch das Erstellen korrelierter Zufallszahlen verwendet werden. Zerlegen der Korrelationsmatrix Korrelierte Zufallszahlen können durch Multiplikation der n x p Matrix der Zufallswerte mit der gewünschten Cholesky-zerlegten Korrelationsmatrix C der Zufallswerte erzeugt werden. Eine Cholesky-Zerlegung lässt sich in …

APA Formatierung von Tabellen

Alexander Niltop Blog, Statistik

Standards für die Formatierung von Tabellen oder die einheitliche Verwendung von Abkürzungen setzen sich immer mehr durch. Egal, ob für die Hausarbeit, die Promotion oder für die Veröffentlichung in einem wissenschaftlichen Journal – Stil und Format einer Arbeit müssen einer bestimmten Anforderung genügen. Die Standards von der American Psychological Association (APA) sind dabei nicht nur in der Psychologie weit verbreitet. …

Titanic-Survival-Calculator mit R Shiny

Tobias Krabel Blog, Data Science

Mit R Shiny lassen sich in R schnell interaktive Web-Applikationen erstellen. Immer wieder gibt es umfangreiche Updates, die dem R User neue Funktionen zur Verfügung stellen, um die Funktionen seiner Dashboards zu erweitern. Grund genug für uns eine kleine App zu entwerfen: der Titanic-Survival-Calculator! Auf Basis der historischen Passagieraufzeichnungen der Titanic ist es möglich, statistisches Modell zu entwickeln, das basierend …