• Happy Coding

RDF/XML und PDF

Eigentlich wollte ich nur mal ueberpruefen, wie man schnell und einfach, die in PDF-Dokumenten gespeicherten Metadaten (keywords, author, subject, title) extrahieren kann. Das JPedal Framework bot sich dazu an und lieferte mir auch prompt eine Antwort – in RDF/XML!
Dieses lag aber nicht an JPedal, sondern am PDF-Dokument, welches seine Metadaten in RDF/XML speichert.
Die RDF/XML Serialisierung ist zwar oft nicht auf den neuesten Stand, da z.B. unqualifizierte about Attribute genutzt werden, aber immerhin.
Nach einer kurzen Ueberarbeitung fuer den RDF Validator, sieht ein typisches PDF/RDF Modell beispielsweise folgendermassen aus: Grafik anzeigen.
Hier der 3-Zeiler, um mit JPedal auf die Metadaten zuzugreifen:

PdfDecoder decoder = new PdfDecoder( true );
decoder.openPdfFile("Dokument1.pdf");
String rdfxmlMetadata = decoder.getMetadata();
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Ma.gnolia
  • MisterWong
  • Reddit
  • SphereIt
  • StumbleUpon
  • Technorati
  • TwitThis
  • Yigg
  • LinkedIn
  • Print this article!
  • Tumblr
  • Pownce
Share your opinion! Post your thoughts.