Differences
This shows you the differences between two versions of the page.
| Both sides previous revision Previous revision Next revision | Previous revision | ||
| lehrkraefte:blc:informatik:glf4-20:regex-start [2021/02/15 12:21] – Ivo Blöchliger | lehrkraefte:blc:informatik:glf4-20:regex-start [2021/02/16 10:24] (current) – [Daten nach Wochentagen oder Tageszeit aggregieren] Ivo Blöchliger | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| + | ====== Analyse der YouTube-Daten ====== | ||
| + | Dieses Beispiel soll zeigen, wohin die Reise führt. Die nötigen Tools und Grundlagen werden wir in den kommenden Wochen erarbeiten. | ||
| + | ===== Erste Daten-Extraktion ===== | ||
| + | * Laden Sie folgendes Python-Programm herunter {{ : | ||
| + | * Kopieren Sie Ihre Datei watch-history.html in den selben Ordner. | ||
| + | * Wenn Sie keine eigene YouTube-Daten haben, können Sie die Datei {{ : | ||
| + | * Starten Sie TigerJython und öffnen Sie in Tigerjython die Datei youtube-date-extractor.py. | ||
| + | * Passen Sie nötigenfalls den Dateinamen in Zeile 12 an. | ||
| + | * Führen Sie das Python-Programm aus. Dabei wir im selben Ordner eine Datei '' | ||
| + | * Öffnen Sie diese mit Excel und testen Sie, ob diese Datumsangaben auch als Datumsangaben interpretiert werden. | ||
| + | * Schauen Sie sich das Video mit den Erklärungen zum Code an (siehe Zeilen 4 bis 7 im Python-Programm). Auf [[https:// | ||
| + | * Falls Excel die Datumsangaben nicht korrekt interpretieren kann, passen andernfalls das Ausgabeformat im Python-Programm in der Zeile 62 so an, dass Excel die Datumsangabe korrekt interpretiert. | ||
| + | |||
| + | ===== Daten nach Wochentagen oder Tageszeit aggregieren ===== | ||
| + | Die Frage ist: Wie viele Videos wurden pro Wochentag geschaut? Können Sie das mit Excel ermitteln? | ||
| + | |||
| + | Gehen sollte es schon, in Python ist es aber schneller, flexibler und auch mit neuen Daten sofort anwendbar. | ||
| + | |||
| + | * Schauen Sie sich dazu folgendes Video an und modifizieren Sie den Python-Code entsprechend (pausieren Sie wenn nötig): [[https:// | ||
| + | * Stellen Sie das Resultat dann grafisch in Excel dar. | ||
| + | * Ändern Sie dann das Python-Programm so ab, dass Sie nach der Tageszeit (auf Stunden genau) aggregieren. Die Stunde einer Datumzeit-Angabe erhalten Sie mit '' | ||
| + | * Hier ist ein {{ : | ||
| + | * Stellen Sie wiederum das Resultat grafisch in Excel dar. | ||
| + | |||
| + | ===== Daten nach Datum aggregieren ===== | ||
| + | Wir können annehmen, die Daten seien chronologisch sortiert. D.h. immer, wenn ein neues Datum angetroffen wird, wird das letzte Datum mit der Anzahl Aufrufen ausgegeben. So erhält man eine Timeline. | ||
| + | |||
| + | Wie man das programmiert, | ||
| + | |||
| + | Stellen Sie diese Timeline in Excel dar. Ein mögliche Lösung mit LibreOffice ist in [[https:// | ||
| + | |||