Von: daily-business-request@computerwissen.de im Auftrag von Business-PC Daily [newsletter@computerwissen.de]
Gesendet: Mittwoch, 14. September 2005 02:01
An: Business-PC Daily Abonnenten
Betreff: Dateien und ihre Formate (1)

Der E-Mail-Dienst für PC-Profis, Ausgabe vom 14. September 2005

Dateien und ihre Formate (1)
Vorsicht vor gefälschen E-Bay-Rechnungen!
Speicher satt: Demnächst passen 32 GByte auf eine Karte
Firefox hat Sicherheitsprobleme mit "Umlautdomains"
Zu guter Letzt ...
Über den Fachverlag für Computerwissen
"Business-PC Daily" abbestellen

Dateien und ihre Formate (1)

von Dr. Giesbert Damaschke, München

Liebe Leser,

immer wieder stolpert man in Support-Foren über Fragen wie diese:

"Hallo, ich habe da von einem Kunden eine Datei bekommen, mit der ich nicht weiter komme. Die Datei hat die Endung 'gz' und keines meiner Programme kann damit etwas anfangen. Wer weiß Rat?"

Denn durch das Internet ist zwar der Datenaustausch zwischen weit entfernten Computern deutlich einfacher geworden, aber dafür hat sich auch die Zahl der eingesetzten Programme und Computersysteme drastisch erhöht. Das führt dazu, dass man es immer wieder mit Dateien zu tun bekommt, die dem eigenen System unbekannt sind und von denen man nicht weiß, um was es sich da handelt oder wie man die Datei öffnet.

Daher widmet sich diese und die folgende Ausgabe von "Business-PC Daily" einmal den Grundlagen von Dateien und Dateiformaten.

Was ist eigentlich ein Dateiformat?

Beginnen wir ganz am Anfang: Was ist eine Datei und was ist ein Dateiformat?

Eine Datei ist eine Ansammlung von Daten bzw. von Bytes auf einem Datenträger oder im Arbeitsspeicher des Computers. Damit das Betriebssystem mit den Daten etwas anfangen kann, muss die Datei einen klar definierten Anfang und ein klar definiertes Ende haben, d. h. das Betriebssystem muss wissen, an welcher Speicherstelle die Datei beginnt und an welcher Speicherstelle sie endet. Alle Daten dazwischen werden vom System als zusammenhängende Datei betrachtet.

Damit die Datei nicht einfach nur ein unbrauchbarer, zufällig zusammengewürfelter Datenhaufen ist, müssen die Bytes in einer ganz bestimmten Struktur angeordnet sein. Diese Struktur ist das Dateiformat.

Dazu ein Beispiel: Bei einer Textverarbeitung wie Word muss nicht nur der reine Text, sondern auch sein Erscheinungsbild gespeichert werden, also etwa die Schrift, die Schriftgröße, Farben, Grafiken, Spaltensatz und so weiter und so fort. Diese Informationen müssen nach einem bestimmten Muster in der Datei abgelegt sein, damit die Textverarbeitung die Datei zum einen speichern, zum anderen auch wieder öffnen kann.

Das Muster kann zum Beispiel so aussehen, dass die ersten acht Bytes Informationen zur Schrift, die nächsten vier Angaben zur Größe und die anschließenden vier Bytes die Farbwerte enthalten. Der erste Buchstabe des gespeicherten Dokumentes stünde dann an 17. Stelle in der Datei. Das ist natürlich ein extrem simples Beispiel, Sie können sich sicher vorstellen, dass das Format eine Word-Datei ungleich komplexer ist.

Proprietäre vs. Offene Formate

Um beim Beispiel Word zu bleiben: Das Word-Format ist ein klassisches Beispiel für ein proprietäres Format. Proprietär bedeutet, dass das Format gewissermaßen das Eigentum (engl: property) des Programms ist, das die Datei erzeugt hat. Nur dieses Programm kennt die genaue Struktur der gespeicherten Daten und nur dieses Programm kann die Datei auch wieder korrekt öffnen. Will man eine proprietäre Datei mit einem anderen Programm öffnen, dann benötigt man spezielle Import-Filter. Im umgekehrten Fall, also wenn man eine Datei im proprietären Format eines fremden Programms speichern will, benötigt man einen entsprechenden Export-Filter.

Im- und Export von Daten sind eines der zentralen Probleme aller Arbeiten an Computer. Wer schon einmal versucht hat, Dateien zu öffnen, die vor 10 oder 20 Jahren mit einem Programm erzeugt wurden, das heute vom Markt verschwunden ist und zu dem auch keine Filter existieren, der weiß, dass einen die Aufgabe, auf alte Datenbestände zugreifen zu müssen, mitunter einige Nerven kosten kann – wenn das Unterfangen nicht gleich fehl schlägt.

Doch selbst wenn ein Programm einen passenden Im- bzw. Export-Filter bereit hält, so ist man nicht vor unangenehmen Überraschungen gefeit. So ist es etwa heute immer noch so, dass einzig und allein Word echte Word-Dokumente lesen und schreiben kann. Alle anderen Programme haben damit mehr oder weniger große Schwierigkeiten. Ein proprietäres Format sorgt also für die Abhängigkeit des Anwenders von einem ganz speziellen Programm.

Das Gegenstück zu proprietären Formaten sind offene Formate. Bei einem offenen Format wird die Struktur, in der die Daten gespeichert sind, in einem öffentlich zugänglichen Dokument genau beschrieben. So kann jeder Hersteller dieses Format in sein Programm implementieren oder einen Filter schreiben, der es seinem Programm erlaubt, das offene Format zu schreiben und zu lesen. Bei einem offenen Dateiformat hat der Anwender die Wahl zwischen verschiedenen Programmen und ist nicht darauf angewiesen, eine bestimmte Datei mit einem ganz bestimmten Programm zu öffnen.

Eigentlich gibt es nur einen Aspekt, unter dem der Einsatz proprietärer Formate sinnvoll ist und das ist die Datensicherheit. Wer sicher sein will, dass nur er und einige Eingeweihte eine Datei öffnen und lesen kann, der muss diese Datei in einem so kryptischen Format abspeichern, dass nur er es wieder zu öffnen versteht. Genau das leisten übrigens die Verschlüsselungsroutinen und -programme.

Programme und Daten

Bislang war nur die Rede von Datendateien, aber das ist nur der eine Teil der Dateien, die auf dem Computer abgelegt sind. Neben den Daten- gibt es noch die Programmdateien.

Eine Programmdatei enthält keinen Daten (Texte, Bilder, Töne, Videos ...), die am Bildschirm angezeigt, auf dem Drucker ausgegeben oder über die Lautsprecher wiedergegeben werden, sondern ausführbare Anweisungen im Maschinencode des Prozessors. Eine solche Datei sorgt dafür, dass der Prozessor oder ein bestimmter Baustein des Computers eine bestimmte Aktion ausführt (genauer: eine ganze Menge Aktionen, aber so genau nehmen wir's in dieser grundlegenden Betrachtung nun auch wieder nicht).

Die klare Trennung zwischen Programmen und Daten wurde durch die wachsende Funktionsvielfalt moderner Systeme verwischt. Ein typisches Beispiel sind Script- und Makrodateien, die einerseits einfache Daten sind, andererseits aber innerhalb einer Applikation wie ein Programm ausgeführt werden. Dieser Umstand hat sich inzwischen als Sicherheitsproblem erwiesen, da Viren und Würmer nun nicht mehr nur – wie früher – reine Programmdateien befallen, sondern sich auch in den Mischformen der Makrodateien einnisten können. Die bewährte Faustregel "Eine Datendatei kann keinen Virus enthalten" ist also nicht nur hinfällig, sondern regelrecht gefährlich geworden.

Damit ist der erste Teil dieses kleinen Dateikurses zuende, morgen werde ich mich den verschiedenen Formaten und Datei-Endungen widmen und auch die eingangs gestellte Frage beantworten, um was es sich bei einer GZ-Datei handelt.

Ihr

Dr. Giesbert Damaschke

Vorsicht vor gefälschen E-Bay-Rechnungen!

Ein neuer Trojaner ist im Internet unterwegs. Wie schon in früheren Fällen tarnt sich auch dieses Schadensprogramm als Rechnung, dieses Mal ist eine angebliche E-Bay-Rechnung. Die gefälschte Rechnung hat als Absenderadresse "kundensupport@ebay.de" (der Absender ist natürlich ebenfalls gefälscht) und kommt mit der Betreffzeile "7 Tage bis zur Kontosperrung". Die angebliche Rechnung hängt als scheinbare PDF-Datei an. Dabei handelt es sich allerdings nicht um ein reines Dokument, sondern um eine ausführbare EXE-Datei. Öffnet der Empfänger der Mail diesen Anhang, wird der Trojaner gestartet und infiziert den Computer. Zur Schadensroutine der Malware gehört unter anderem, dass ein weiterer Wurm aus dem Internet nachgeladen werden soll. Dieser Wurm wird derzeit noch von den Virenexperten analysiert.

Anzeige

Schützen Sie Ihr System vor Viren, Würmern und anderen Eindringlingen!

Unser Experten-Team hat alle wichtigen Tipps, Tricks und Schnell-Anleitungen zusammengestellt, mit denen Sie Ihren PC zu einer sicheren Festung machen können – u.a. mit folgenden wichtigen Themen:

  • Anti-Spam-Arsenal: Die besten Tools und Tipps gegen die Plagegeister. Zeigen Sie Spammern die Rote Karte, erstellen Sie Blacklists. Dazu die vier besten Anti-Spam-Tools!
  • Anonym im Internet: Wie Sie Ihre Spuren erfolgreich verwischen: Diese Daten können ausspioniert werden – testen Sie Ihren PC. Machen Sie hartnäckigen Schnüffeldateien den Garaus.
  • Die Firewall von Windows XP – Praxis-Tipps und optimale Einstellung: Eingebaute Sicherheit? Irrtum! Das bringt Ihnen die Firewall von XP in der Praxis. Entlarven Sie Spione von Hand. So optimieren Sie die Firewall, damit wirklich nichts mehr schief läuft.
  • Hacker-Angriff: Wie Sie sich vor dem MSBLAST-Wurm schützen. Lovsan/Blaster & Co. leben noch – so finden Sie heraus, ob auch Ihr System infiziert ist. So schützen Sie sich in Zukunft vor den lästigen Störenfrieden.

Klicken Sie einfach hier!

Speicher satt: Demnächst passen 32 GByte auf eine Karte

Auch große Speichermengen werden immer mobiler. So hat Samsung jetzt bekannt gegeben, dass man einen Flash-Speicherchip entwickelt hat, der eine Kapazität von 16 GBit besitzt. Damit ist es möglich, Speicherkarten mit bis 32 GByte Speicherplatz zu konstruieren. Mit der Serienproduktion soll im zweiten Halbjahr 2006 begonnen werden.

Als Einsatzgebiet sieht man tragbare MP3-Player, Digicams und ähnliche mobile Elektronik. Bei einer Kapazität von 32 GByte ist es problemlos möglich, komplette Musik- und Filmsammlungen auf einem Gerät mitzunehmen, das im Gegensatz zu den heute üblichen Mini-Festplatten keine beweglichen Teile enthält. Ein solches Gerät ist nicht nur robuster, sondern auch leichter als die bisherigen Endgeräte.

Firefox hat Sicherheitsprobleme mit "Umlautdomains"

Vor einigen Monaten wurden die so genannten "Internationalen Domain Namen" (IDN) eingeführt. Damit ist es möglich, auch nationale Sonderzeichen wie etwas Umlaute in einer Domain zu benutzen (etwa: "müller.de"). Wie jetzt bekannt wurde kann es bei der Anzeige solcher Domain-Namen mit Firefox zu einem so genannten "Buffer Overflow" kommen, der sich unter Umständen missbrauchen lässt, um Schadensprogramme auf den Computer zu schmuggeln.

Derzeit lässt sich die Lücke nur schließen, in dem man die IDN-Unterstützung deaktiviert. Da sie im Alltag normalerweise nicht benötigt wird, sollte das nicht zu Problemen führen.

Zu diesem Zweck haben die Firefox-Entwickler einen kleinen Patch bereit gestellt. Man kann die IDN-Unterstützung aber auch sehr schnell manuell ausschalten. Und zwar so:

  • Rufen Sie die Konfigurationseinstellungen von Firefox auf, in dem Sie in der Adresszeile "about:config" eingeben und auf die Eingabetaste drücken.
  • Geben Sie in der Eingabezeile "Filter" die drei Buchstaben "idn" ein.
  • Firefox zeig Ihnen nun 2 Einträge. Doppelklicken Sie auf den Eintrage "network.enableIDN", so dass in der Spalte "Wert" der Eintrag von "true" auf "false" wechselt.

Information zum IDN-Problem und Patch zu Behebung

Zu guter Letzt ...

Der Newsletter "Business-PC Daily" wird heute gesponsert von dem kompakten und praxisnahen Informationsdienst "Excel aktuell".

"Excel aktuell" ist Ihre direkte Hilfe bei der Arbeit mit Excel. Hier finden Sie viele Tipps, Formulare, Matrixformeln, VBA-Tricks, Funktionen, Fertiglösungen und noch vieles mehr – für Ihre tägliche Arbeit mit Microsoft Excel. So sparen Sie sich jede Menge Zeit und viel Ärger.

Detaillierte Informationen zu "Excel aktuell" sowie die Möglichkeit, den Informationsdienst kostenlos zum Test anzufordern, finden Sie hier:

Excel aktuell jetzt kennenlernen!

Über den Fachverlag für Computerwissen

Der Newsletter "Business-PC Daily" ist ein kostenloser E-Mail-Service des Fachverlags für Computerwissen. Informationen zu unserem Verlagsprogramm sowie zu weiteren kostenlosen Services finden Sie auf unseren Internetseiten unter der folgenden Adresse:

http://www.computerwissen.de/

"Business-PC Daily" abbestellen

Sollten Sie an "Business-PC Daily" einmal nicht mehr interessiert sein, können Sie den Newsletter jederzeit abbestellen. Ein Formular für Ihre Abbestellung finden Sie auf unseren Internetseiten unter der folgenden Adresse:

http://www.computerwissen.de/newsletter/

Impressum

"Business-PC Daily" wird herausgegeben von:

Verlag für die Deutsche Wirtschaft AG
Fachverlag für Computerwissen
Theodor-Heuss-Strasse 2-4
53095 Bonn

Telefon: 02 28 / 9 55 01 90
Fax: 02 28 / 35 97 10

Internet: http://www.computerwissen.de/
E-Mail: info@computerwissen.de

Haftungsausschluss: Sämtliche Beiträge und Inhalte des Newsletters sind sorgfältig recherchiert. Dennoch ist eine Haftung ausgeschlossen.

Alle Rechte liegen beim Fachverlag für Computerwissen. Nachdruck und Veröffentlichung, auch auszugsweise, sind nicht gestattet.

Copyright © 2005 Fachverlag für Computerwissen