lehrkraefte:blc:informatik:glf19:magicnumbers

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
lehrkraefte:blc:informatik:glf19:magicnumbers [2019/09/02 08:30] – [Aufbau von Office-Dokumenten] Ivo Blöchligerlehrkraefte:blc:informatik:glf19:magicnumbers [2019/09/10 13:05] (current) – [Magic numbers] Ivo Blöchliger
Line 1: Line 1:
 +==== Magic numbers ====
 +Unter Windows wird der Typ einer Datei (fast?) ausschliesslich über die Dateiendung festgelegt. D.h. jede Datei, die mit .pdf endet, wird als PDF-Dokument behandelt und so dargestellt.
 +
 +Die meisten Datei-Formate haben aber sogenannte "Magic Numbers" oder "file signatures" , d.h. die ersten Bytes sind für jede Datei eines bestimmten Typs gleich. Dieses Merkmal ist zuverlässiger und nicht veränderbar und wird z.T. von anderen System so verwendet.
 +
 +Öffnet man diverse Dateien mit einem Hex-Editor, z.B. mit frhed.exe (zu finden auf Ihrem Stick im Ordner 'software') stellt man fest, dass die ersten Bytes von .zip, .docx und .xlsx immer gleich sind (nämlich PK in ASCII).
 +
 +Vergleichen Sie mit https://en.wikipedia.org/wiki/List_of_file_signatures
 +
 +==== Aufbau von Office-Dokumenten ====
 +Moderne Office-Dokumente sind zip-Archive, die mehrere xml-Dokumente enthalten. Dies sind streng strukturierte Text-Dateien und können mit einem Text-Editor gelesen und manipuliert werden.
 +
 +<WRAP todo>
 +**Aufgabe**  
 +
 +Hinweis: Zu dieser Aufgabe gibt es kleine Screencasts, wenn Sie nicht wissen, wie gewisse Manipulationen unter Windows auszuführen sind: https://fginfo.ksbg.ch/~ivo/videos/informatik/w4/
 +
 +  - Laden Sie die Daten <wrap download>{{ :lehrkraefte:blc:informatik:glf19:winner.docx |winner.docx}}</wrap> herunter und speichern Sie diese auf Ihrem Stick im Ordner 'aufgaben/W4'.
 +  - Öffnen Sie das Dokument, um es anzuschauen, **verändern Sie es aber auf keinen Fall**. Schliessen Sie Word wieder.
 +  - Das Dokument ist effektiv ein zip-Archiv. Entpacken Sie dieses in ein neues Unterverzeichnis. <wrap tip>Z.b. starten Sie ein Entpackungsprogramm wie z.B. 7zip und öffenen Sie Datei damit (im Menü Datei -> Öffnen, bzw. File -> Open). Oder Sie ändern die Dateiendung von .docx auf .zip</wrap>
 +  - Suchen Sie unter den entpackten Dateien jene, die den Text 'Hans Muster' enthält und ersetzen Sie den Namen durch Ihren eigenen. <wrap tip>Setzen Sie im Datei-Manager die Such-Option "Inhalt durchsuchen".</wrap>
 +  - Erstellen Sie dann aus den entpackten Dateien wieder ein zip-Archiv und ändern Sie den Namen auf 'resultat.docx' (ebenfalls auf dem Stick im Verzeichniss 'aufgaben/W4'). Das Dokument sollten Sie jetzt wieder mit Word öffnen können (**aber auf keinen Fall darüber speichern**).
 +  - Laden Sie dann das Python-Programm <wrap download>{{ :lehrkraefte:blc:informatik:glf19:verify.py |veryify.py}}</wrap> herunter und speichern Sie es ebenfalls im Ordner 'aufgaben/W4'.
 +  - Starten Sie 'TigerJython' (zu finden auf Ihrem Stick, 'software/glf/tigerjython.jar').
 +  - Öffnen Sie mit TigerJython die Datei 'verify.py'
 +  - Passen Sie eventuell den Dateiname und gegebenfalls den Pfad an (falls sich die Dateien nicht im gleichen Verzeichnis befinden würden).
 +  - Starten Sie das Program. Es überprüft Ihre Worddatei und liest den Gewinner aus. 
 +  - Speichern Sie das Dokument 'resultat.docx' auf SharePoint in Ihrem Abgabe Ordner im Unterverzeichnis 'Informatik/W4'.
 +  - Melden Sie sich bei mir, wenn Sie damit erfolgreich waren.
 +</WRAP>
 +<WRAP todo>
 +**Aufgabe**  
 +  - Untersuchen Sie auf gleiche Art und Weise (Entzippen, Öffnen im Text-Editor) ein kleines Excel-Dokument im .xlsx-Format. Erstellen Sie dazu ein Dokument, das einige Zellen mit Text, Zahlen und mindestens eine Formel enthält.
 +</WRAP>