Das Data Science Projekt
Um deine Entscheidung für welchen Track du dich bei TechAcademy bewerben solltest zu vereinfachen, möchten wir dir einen kleinen Einblick in das Projekt eines vergangenen Semesters geben. Dabei ist es egal, ob das Projekt mit Python oder R durchgeführt wurde, beides führt zu identischen Ergebnissen!
Projektinhalt
1.
Im ersten Teil wirst du dich erst einmal mit den vorliegenden Daten auseinandersetzen und diese so aufbereiten, dass du in den nächsten Schritten mit diesen Daten weiterarbeiten kannst. Aufbereiten klingt zu abstrakt? Keine Sorge! Wir führen dich in einzelnen Schritten zu dem Ziel, so legst du beispielsweise fest, dass ein Datum nicht nur ein Text ist, sondern dass es tatsächlich ein Datums-Format ist. Um einfachste Muster nach der Datenaufbereitung zu erkennen, können Graphiken wie diese angefertigt werden.
2.
Im zweiten Teil, nachdem man bereits vertraut mit den Daten ist, haben wir Analysen über die am meisten bewerteten Airbnb Listings durchgeführt. Dabei beobachteten wir zum Teil große Unterschiede bei der Verteilung der am meisten Bewerteten Listings: während in manchen Städten die Anzahl der häufig bewerteten Listings verstreut im ganzen Stadtgebiet lag, so wie zum Beispiel in Berlin (links), waren die Listings mit vielen Bewertungen in Boston meist in einem kleinen Gebiet gebündelt. Lust auf Reisen bekommen? Die Karte mit den einzelnen Airbnb Listings kann mit zusätzlichen Informationen, wie zum Beispiel dem Preis pro Nacht, gefüllt werde – fast wie bei Airbnb selbst!
3.
Im dritten Teil, welcher nur von den Fortgeschrittenen durchgeführt werden musste, wurde nach statistischen Modellen gesucht, die den Preis für Airbnb Listings. Mit einfacher, linearer Regression wurde festgestellt, dass der Preis unter anderem auch mit der Anzahl der Schlafzimmer variiert, sowie auch mit versteckten Reinigungsgebühren, aber auch die Anzahl der Betten, oder auch die Anzahl der Betten pro Zimmer und die Durchschnittliche Bewertung des Hosts spielen eine signifikante Rolle! Diese Zusammenhänge wurden noch präziser von verschiedenen Machine-Learning Algorithmen gefunden, was zu einer genaueren Vorhersage der Preise durch unsere Modelle geführt hat.
Lust bekommen dabei zu sein?
Wir bieten jedes Semester bis zu 60 motivierten Interessenten die Möglichkeit mit uns Data Science in Python oder R zu lernen. Wenn du dabei sein willst, dann bewirb dich jetzt für das kommende Semester und lege somit den Grundstein für Deine digitale Zukunft!