PDF-KungFoo mit Ghostscript & Co.

Beginn: 
22.11.2014 - 16:00
Raumnummer: 
3
Referent*in: 
Kurt Pfeifle
Zielgruppe: 
Fortgeschrittene

Die Unix-Welt kennt einige "einfache" Open Source Kommandozeilen-Tools, die beim Erzeugen, Analysieren, Reparieren oder Umgang mit PDF-Dateien nützlicher und schneller sind, als teure, proprietäre Payware mit einer GUI. Andererseits ist PDF jedoch auch ein ziemlich komplexes Datei-Format. Zwar ist PDF-1.7 seit über 5 Jahren ein offizieller ISO-Standard. Trotzdem kann die Open Source-Welt noch längst nicht mit allen Features umgehen, die in PDFs drin-stecken, die Windows-Payware-Nutzer erstellen (Apple und Mac OSX-Nutzer können das übrigens auch nicht — außer sie kaufen teure Software dazu...).

Der Vortrag demonstriert einige der Top-10-Probleme (Reihung nach der subjektiven Erfahrung des Vortragenden), die bei der Verarbeitung oder Erstellung von PDF-Dateien in der Praxis auftreten können. Dazu gehören u.a. Darstellung von Schriften auf dem Bildschirm oder im Druckbild, Darstellung von transparenten Grafik-Elementen im Druckbild, Extraktion von Text-Stellen oder ganzen Texten, Extraktion von Bildern, Reduzierung der Dateigröße und vieles mehr. Neben Ghostscript werden noch viele andere frei verfügbare PDF-Werkzeuge vorgestellt, insbesondere solche, die sich auf der Kommandozeile nutzen lassen.

Erkenntnisse aus dem Vortrag und den darin gezeigten Tools kann man auf allen wichtigen Betriebssystem-Plattformen einsetzen: Linux, OS X, Windows, Solaris, *BSD,...

Ein Drittel der Zeit gelten einer ersten Einführung in die Sprach- und Syntax-Elemente von PDF. Man lernt auch, wie man PDFs so vorbereitet, dass man sie nicht im Hex- sondern im ASCII-Editor analysieren und bearbeiten kann.

Im abschließenden Bonus-Track (Umfang je nach vorhandener Rest-Zeit) kann man eine Ahnung davon erhalten, wie — absichtlich oder versehentlich! — nicht direkt erkennbare Informationen in einer PDF versteckt, hinterlassen, "durchgesickert" oder unzugänglich gemacht sein könnten ... und ebenso, wie man solche Informationen wieder aus einer PDF herausholt.

Teilnehmer erhalten Zugriff auf ein Archiv mit Links zu allen verwendeten Beispiel- und Test-Dateien, ebenso wie auf ein Dokument mit allen vorgeführten Befehlen samt zugehöriger Erläuterungen. 

Kurt Pfeifle

Kurt kommt aus Stuttgart und hat sich als Freiberufler in der IT selbständig gemacht.

Einer seiner Kunden nennt ihn "den PDF-Debugger auf zwei Beinen".

Er verdient einen Teil seines Lebensunterhalts dadurch, dass er sich bei IT-Projekten um die Themen Netzwerkdrucken, Datenkonvertierungen und PDF-Debugging kümmert.

Derzeit führt er die Liste der "All-time Top-Scorer" derjenigen Stackoverflow-Mitglieder an, die bei den Themen PDF, Ghostscript und ImageMagick aktiv sind.

Kurt war in den letzten Jahren mehrmals als Besucher und 2003 Vortragender zu den Themen "CUPS" und "NoMachine NX" beim LinuxDay.