Uber Pricing Heatmap

Uber - der durchaus umstrittene Fahrdienst - hat eine Developer Schnittstelle geschaffen, womit man auf verschiedene Parameter des Softwaresystems zugreifen kann. Wir haben den geschätzten Fahrpreis für viele hundert Ziele in Berlin abgefragt, als ob wir vormittags am HU Campus Berlin Adlershof ein Uber ordern wollen. Die aggregierten und interpolierten Daten werden dann georeferenziert und über OpenStreetmap gelegt, sodass eine Heatmap heraus kommt, welche die durchschnittliche Fahrpreise (ohne Surge Pricing) mit Uber übersichtlich visualisiert. Was kostet eine Uber Fahrt ab HU Campus Adlershof In ein blaues Gebiet durchschnittliche 2€, in ein grünes durchschnittlich 4€ usw... bishin zu 16€ oder mehr in ein rotes Gebiet. Durchschnittlicher Fahrpreis mit Uber ab HU Berlin Campus Adlershof, Lizenz: CC-BY2.0 Tools used: Python (requests, [...]

By |2018-12-06T16:36:06+00:0004/2015|Categories: DataLab|Tags: , , , , |0 Comments

Vorhersage der Parkhausbelegung mit Offenen Daten

Wir engagieren uns seit geraumer Zeit in der Open Knowledge Foundation, welche das Ziel verfolgt, ohnehin schon öffentliche Daten auch noch standardisiert und maschinenlesbar verfügbar zu machen, damit Mehrwert daraus generiert werden kann. Ein schönes Beispiel für den Nutzen von Offenen Daten (Open Data) möchten wir am Beispiel der freien Parkplätze in Dresden zeigen. Die Stadt Dresden hat ein intelligentes Verkehrsleitsystem und -konzept (VAMOS), welches auch die freien Parkplätze in den jeweiligen Parkhäusern und -plätzen erfasst und bereitstellt. Freie Parkplätze Dresden Leider stehen diese Daten nicht offen - heißt: über eine Schnittstelle für jedermann - zur Verfügung. Die Open Data Aktivisten vom OKLab Dresden haben deshalb einen Scraper geschrieben, der die Zahlen von der Webseite holt und in eine Datenbank speichert [...]

By |2018-12-06T16:36:06+00:0003/2015|Categories: DataLab|Tags: , , , |0 Comments

Wie man große Dateien auch auf einem kleinen Notebook bearbeitet

Wer sich mit Data Analytics beschäftigt, hat hin und wieder mit sehr großen Dateien zu kämpfen. Diese entstehen schlichtweg heutzutage in vielen Wirtschaftszweigen. Ob Industrie 4.0 oder M2M Kommunikation, überall werden Zahlenkolonnen gespeichert und dann auch hoffentlich irgendwann ausgewertet. Dabei überschlagen sich die Consultants im Jahrestakt mit neuen Buzzworts zum Thema. Vor einigen Jahren hieß es  noch 'Cloud', aktuell wird über 'Big Data' geschrieben und bald kann man von 'Smart Data' lesen. Dabei gilt: [tweet "Nur weil es Excel nicht öffnen kann, ist es noch nicht Big Data!"] Vielleicht liegt es ja daran, dass viele PowerPoint Profis nur Excel auf dem Laptop installiert haben und das ein oder andere mal die nachfolgende Meldung gelesen haben: Reaktion von Excel auf eine 1GB .csv Datei [...]

By |2018-12-06T16:36:06+00:0001/2015|Categories: DataLab|Tags: , , , , , , |0 Comments

Zwischenauswertung: Naturalistische Fahrverhaltensbeobachtung und Nutzung des KFZ im städtischen Umfeld

Unser Low Budget Car PC befindet sich nun seit mehreren Monaten im realen Praxiseinsatz und loggt unermütlich Kilometer um Kilometer mit. Dabei ist vor allem die “Beobachtung” des natürlichen Fahrverhaltens interessant. Nicht nur Wissenschaft und Forschung interessieren sich für das Fahr- und Nutzungsverhalten, auch maßgeschneiderte Versicherungstarife oder die optimale Planung der Flottenauslastung (Business Intelligence) sind ein interessanter Anwendungsfall. Im Folgenden soll beispielhaft das natürliche Fahr- und Nutzungsverhalten eines PKW in einem Zeitraum von 9 Wochen ausgewertet werden. […]

GNTM Finale 2014 – Stimmungsanalyse auf Twitter

Wie sieht es aus, wenn eine Maschine den Twitter Stream zu einem Thema mit ließt und Informationen aus diesem generiert? Am Beispiel des “Germany’s Next Topmodel Finale 2014” möchten wir das mal im Schnelldurchlauf präsentieren. Die Technik ist die Gleiche, wie am Beispiel des Tatort vorgestellt. Es erfolgt ein Mitschreiben des gesamten Twitter Traffic zu den Hashtags #GNTM, #GNTMFinale und #GNTM2014. Anschließend wird mit dem Natural Language Toolkit eine Analyse der Inhalte der Tweets vorgenommen. Dabei gilt vor allem eines: Umso mehr Tweets, umso besser! […]

By |2018-12-06T16:36:07+00:0005/2014|Categories: DataLab|Tags: , , , , |0 Comments