Twitter Mining mit R – Teil 1

Lukas Strömsdörfer Blog, Data Science

Spätestens durch den US-Präsidentschaftswahlkampf rückte der Microblogging Dienst Twitter stärker in den öffentlichen Fokus. Wem es allerdings nicht reicht, einfach nur durch das Soziale Netzwerk zu stöbern, der kann mit ein paar wenigen Tricks vom Datenreichtum Twitters profitieren. Datenzugang Twitter, so wie viele andere Online-Dienste, bietet sog. APIs („Application Programming Interface“) an. Durch diese können Interessierte ganz einfach einen Link …

Snack Wars – XML-Logfiles und Prozessdaten analysieren mit R und tidyverse

David Schlepps Blog, Data Science, Statistik

Neuen Mitarbeitern bei STATWORX fällt unweigerlich das großzügige Angebot und die ebenbürtig große Nachfrage nach Snacks von der Banane bis zum Schokoriegel auf. Da liegt es für Datenliebhaber sehr nah, (anonymisierte) Daten über den Snack-Konsum in der Firma zu sammeln. Im Folgenden soll es um eine beliebte Form des Sammelns und der Analyse von Prozessdaten gehen: XML-Logfiles. Für die Erstellung …

Rcpp Doping für den R Code

André Bleier Blog, Data Science

Wie viel Zeit ich schon damit verbracht habe rote Stoppschilder zu beobachten? Sehr, sehr viel! Effizientes Programmieren kann helfen diese Zeit zu minimieren, aber oft hat man gar keinen Einfluss auf die Laufzeit seines Programms, da Spezifikationen im Unterbau von das eigentliche Bottleneck sind. R ist eine sehr flexible Programmiersprache. Als Benutzer muss man weder Speicherplatz auf dem Arbeitsspeicher allokieren …

Deep Learning – Teil 2: Programmierung

Christian Moreau Blog, Data Science

Aufbauend auf der theoretischen Einführung in neuronale Netze und Deep Learning im Rahmen des letzten Blogbeitrags, soll in Teil 2 der Reihe „Deep Learning“ die Implementierung eines einfachen neuronalen Netzes (Feedforward Netz) in Python anschaulich dargestellt werden. Hierzu stehen dem Anwender viele verschiedene Frameworks zur Verfügung. In diesem Beitrag verwenden wir Keras, eine der wichtigsten Python Libraries, zur Programmierung von …

Fehlerbehandlung in R: Debugging mit RStudio

Markus Berroth Blog, Data Science, Statistik

In der Blog-Reihe „Fehlerbehandlung in R“ geht es um effizientes und systematisches Überprüfen von R-Code. Den Beginn macht das Finden von Fehlern durch Debugging, weiter geht es mit der Handhabung von Fehlern und endet mit Unit-Testing, das zum Überprüfen von korrekter Funktionalität von R-Code dient. Die Reihe startet mit Debugging in R, wobei Debugging ein breitgefächertes Thema ist. Dieser Artikel …

Deep Learning – Teil 1: Einführung

Sebastian Heinz Blog, Data Science

Deep Learning ist aktuell einer der spannendsten Forschungsbereiche im Machine Learning. Für eine Vielzahl von Fragestellungen liefern Deep Learning Modelle State-of-the-Art Ergebnisse, vor allem im Bereich der Bild-, Sequenz- und Spracherkennung. Weiterhin findet Deep Learning erfolgreich Anwendung in der Fahrzeugkonstruktion (selbstfahrende Autos), in der Finanzwelt (Aktienkursvorhersage, Risikoprognose, automatische Handelssysteme), in der Medizin (maschinelle Bilderkennung von Karzinomen) und Biologie (Genomik), im e-Commerce (Recommendation Systeme) und …

Schlüsselkennzahl: Preiselastizität der Nachfrage

Daniel Lüttgau Blog, Data Science

Preismanagement ist in den vergangenen Jahren zunehmend in den Fokus von Geschäftsführungen gerückt(1). Verbunden ist diese Entwicklung mit der Hoffnung, mit gezielter Preisgestaltung einen zentralen, aber vernachlässigten Profittreiber identifiziert zu haben. Tatsächlich bestätigen Experten, dass Preismanagement in der Vergangenheit häufig unter unzureichender Aufmerksamkeit gelitten hat (2,4). Unterentwickelte Preissetzungsexpertise und ausbaufähige Preisstrategien sind die Folge. Die Bedeutung vom richtigen Preismanagement Preise …

Data Science mit R

Sebastian Heinz Blog, Data Science

Data Science, Big Data, Machine Learning – die rasante Entwicklung von Computern, Massenspeichern und korrespondierenden Technologien wirft seit geraumer Zeit ein neues Licht auf die Speicherung und Auswertung von Daten strukturierter und unstrukturierter Art. Insbesondere der Begriff „Big Data“, der mittlerweile eher inflationär verwendet wird, war ein Buzzword ganzer Industrien. Im gleichen Atemzug zu Begriffen wie Data Science, Machine Learning und …

Web-Applikationen mit R und R Shiny

Tobias Krabel Blog, Data Science

Seit einiger Zeit ist mit Shiny ein Paket für die Statistiksoftware R verfügbar, mit dessen Hilfe man ansprechende, interaktive Webapplikationen erstellen und hierbei auf den kompletten Funktionsumfang von R zugreifen kann. Mit Hilfe des R Paketes Shiny lassen sich schnell HTML/JavaScript-basierte, interaktive Webapplikationen erstellen. Die möglichen Anwendungsszenarien sind vielfältig: Reporting, Deployment von statistischen Analysen, interaktive Visualisierungen von Datenbeständen. Bei der …

Reporting mit R und R Markdown: A Whisky Guide

Fabian Müller Blog, Data Science

Wir bei STATWORX lieben Daten. Und wir genießen von Zeit zu Zeit gerne ein Gläschen guten schottischen Single Malt Whisky unter Kollegen. Vor einiger Zeit hatten die Kollegen von Revolution Analytics einen interessanten Blog-Beitrag zum Thema k-Means Clustering von Single Malt Whiskies veröffentlicht, den wir aufmerksam studiert haben. Ebenfalls wurde kürzlich eine aktualisierte Version von RStudio veröffentlicht, die ein umfangreiches …