Datenwissenschaft

If you translate the term „Data Science“ literally into German language it means „Datenwissenschaft“ – and this sounds very much like some stuff from the 1960s where computer filled halls with only a few MB.

„Datenwissenschaft“ sounds like nothing is left of the fancy analytical stuff, the AI, Deep Learning and all the other things you do having the sexiest job of the 21st century.

„Datenwissenschaft“ weiterlesen

Aggregationen mehrer Variablen in R

Viele Variablen mit gleichen Namensprefixen aggregieren

Es ist immer sinnvoll, sich über die Nomenklatur von Variablennamen Gedanken zu machen. Die Variablen eines Data Frames nach dem Einlesen in R nochmal umzubenennen kann langfristig Arbeit ersparen. Hier ein Beispiel: die Aggregation von Tagesdaten auf Wochendaten in mehreren Variablen gleichzeitig.

„Aggregationen mehrer Variablen in R“ weiterlesen

Binärdaten mit Python 3 auslesen

Eigentlich sollte es dank Protobuf heute nicht mehr vorkommen, dass binäre Daten manuell serialisiert werden. „Eigentlich“. Ich musste im folgenden Beispiel Binärdaten dekodieren, die von Fahrzeugsensoren in Dateien geschrieben wurden. Zum Glück lag eine Beschreibung der Kodierung vor. Die Herausforderung war, dass die Daten aus verschiedenen Sensoren übermittelt wurden und alle im Moment ihres Eintreffens in eine Binärdatei geschrieben wurden. Welcher Sensor nun gerade einen Eintrag schrieb, musste anhand des führenden Bytes ermittelt werden. „Binärdaten mit Python 3 auslesen“ weiterlesen

Farbanteile eines Bildes mit Python auswerten

Wenn man die Menge der Farbanteile in einem Bild zählen kann, lassen sich viele spannende Auswertungen erstellen. In folgendem kleinen Projekt habe ich Python und OpenCV genutzt, um die Farbanteile von Bildern auszuwerten und die Ergebnisse weiter zu verwenden.

Um die Verkehrssituation einer bestimmten Region auswerten zu können, wäre es prima, auf Google Maps Verkehrsinformationen zurückgreifen zu können. Dies ist per API leider nicht möglich, daher habe ich den Weg gewählt, in regelmäßigen Abständen einen Screenshot der gewünschten Region anzufertigen. Diese Aufgabe übernimmt natürlich ein kleines Python Programm. Mit Hilfe des Moduls selenium lässt sich Screenscraping leicht automatisieren. „Farbanteile eines Bildes mit Python auswerten“ weiterlesen

Digitalisierung in Deutschland

Von der Entscheidung für ein Buch bis zum Lesen auf einem Gerät:

Anzahl der notwendigen Klicks vom Buch bis zum Lesegerät bei amazon.de (Kindle) und thalia.de (tolino) im Vergleich

Vergleich Anzahl Klicks bis zum Kauf bei amazon.de und thalia.de

Ich habe oft das Gefühl, hierzulande stehen wir uns bei der Digitalisierung selbst im Weg. Zwar habe ich meine Vorbehalte gegenüber einem Konzern wie amazon, aber dort schaffen sie es, einfach zu denken. Und „keep it simple“ ist eines der großen Paradigmen der Digitalisierung. Thalia jedenfalls kennt dieses Paradigma nicht.