Einführung TensorFlow

Sebastian Heinz Blog, Data Science

TensorFlow ist aktuell eines der wichtigsten Frameworks zur Programmierung von neuronalen Netzen, Deep Learning Modellen und anderen Machine Learning Algorithmen. Es basiert auf einem C++ Low Level Backend, das jedoch über eine Python Library gesteuert wird. TensorFlow lässt sich sowohl auf CPU als auch GPU (Clustern) ausführen. Seit kurzem existiert auch ein R Package, mit dem TensorFlow genutzt werden kann. …

Mit Feather verleihen Sie Ihren Daten Flügel

Tobias Krabel Blog, Data Science, Statistik

Das Lesen und Schreiben von großen Datenmengen ist schon seit Entwicklung der Datenbanken das Sorgenkind eines jeden Informatikers. Da in der heutigen Zeit die Datenmengen unweigerlich größer werden, ist dieses Thema auch bei Data Scientists angekommen, die in Großprojekten große Objekte auf der Festplatte zwischenspeichern möchten. Seit einiger Zeit jedoch kursiert in der R Community das Paket feather, das mit …

Wie Deep muss MLP Deep Learning sein?

Christian Moreau Blog, Data Science

Wie bereits im ersten Teil unserer Einführungsreihe zu Deep Learning erwähnt, sind neuronale Netze und Deep Learning aktuell ein aktiver Bereich der Machine Learning Forschung. Während die zugrundeliegenden Idee und Konzepte bereits mehrere Jahrzehnte alt sind, ist die Komplexität der Modelle und Architekturen in den letzten Jahren stetig angewachsen. In diesem Blogbeitrag gehen wir der Frage nach, ob durch die …

Von den Sozialwissenschaften zu Data Science

Fabian Müller Blog, Data Science

Der Smalltalk mit einem Data Scientist endet früher oder später immer bei der Frage des Studienbackgrounds. Die Frage ist insofern naheliegend, als dass reine Data Science Studiengänge in Deutschland gerade erst am Anlaufen sind. Die bereits am Markt aktiven Data Scientists stammen daher fast ausschließlich aus fachfremden Studiengängen. Das Unbegreifen ist zumeist groß, wenn die Antwort auf die Frage des …

Twitter Mining mit R – Teil 1

Lukas Strömsdörfer Blog, Data Science

Spätestens durch den US-Präsidentschaftswahlkampf rückte der Microblogging Dienst Twitter stärker in den öffentlichen Fokus. Wem es allerdings nicht reicht, einfach nur durch das Soziale Netzwerk zu stöbern, der kann mit ein paar wenigen Tricks vom Datenreichtum Twitters profitieren. Datenzugang Twitter, so wie viele andere Online-Dienste, bietet sog. APIs („Application Programming Interface“) an. Durch diese können Interessierte ganz einfach einen Link …

Rcpp Doping für den R Code

André Bleier Blog, Data Science

Wie viel Zeit ich schon damit verbracht habe rote Stoppschilder zu beobachten? Sehr, sehr viel! Effizientes Programmieren kann helfen diese Zeit zu minimieren, aber oft hat man gar keinen Einfluss auf die Laufzeit seines Programms, da Spezifikationen im Unterbau von das eigentliche Bottleneck sind. R ist eine sehr flexible Programmiersprache. Als Benutzer muss man weder Speicherplatz auf dem Arbeitsspeicher allokieren …

Deep Learning – Teil 2: Programmierung

Christian Moreau Blog, Data Science

Aufbauend auf der theoretischen Einführung in neuronale Netze und Deep Learning im Rahmen des letzten Blogbeitrags, soll in Teil 2 der Reihe “Deep Learning” die Implementierung eines einfachen neuronalen Netzes (Feedforward Netz) in Python anschaulich dargestellt werden. Hierzu stehen dem Anwender viele verschiedene Frameworks zur Verfügung. In diesem Beitrag verwenden wir Keras, eine der wichtigsten Python Libraries, zur Programmierung von …

Deep Learning – Teil 1: Einführung

Sebastian Heinz Blog, Data Science

Deep Learning ist aktuell einer der spannendsten Forschungsbereiche im Machine Learning. Für eine Vielzahl von Fragestellungen liefern Deep Learning Modelle State-of-the-Art Ergebnisse, vor allem im Bereich der Bild-, Sequenz- und Spracherkennung. Weiterhin findet Deep Learning erfolgreich Anwendung in der Fahrzeugkonstruktion (selbstfahrende Autos), in der Finanzwelt (Aktienkursvorhersage, Risikoprognose, automatische Handelssysteme), in der Medizin (maschinelle Bilderkennung von Karzinomen) und Biologie (Genomik), im e-Commerce (Recommendation Systeme) und …

Schlüsselkennzahl: Preiselastizität der Nachfrage

Daniel Lüttgau Blog, Data Science

Preismanagement ist in den vergangenen Jahren zunehmend in den Fokus von Geschäftsführungen gerückt(1). Verbunden ist diese Entwicklung mit der Hoffnung, mit gezielter Preisgestaltung einen zentralen, aber vernachlässigten Profittreiber identifiziert zu haben. Tatsächlich bestätigen Experten, dass Preismanagement in der Vergangenheit häufig unter unzureichender Aufmerksamkeit gelitten hat (2,4). Unterentwickelte Preissetzungsexpertise und ausbaufähige Preisstrategien sind die Folge. Die Bedeutung vom richtigen Preismanagement Preise …

Data Science mit R

Sebastian Heinz Blog, Data Science

Data Science, Big Data, Machine Learning – die rasante Entwicklung von Computern, Massenspeichern und korrespondierenden Technologien wirft seit geraumer Zeit ein neues Licht auf die Speicherung und Auswertung von Daten strukturierter und unstrukturierter Art. Insbesondere der Begriff „Big Data“, der mittlerweile eher inflationär verwendet wird, war ein Buzzword ganzer Industrien. Im gleichen Atemzug zu Begriffen wie Data Science, Machine Learning und …