Bärbart dokumentformat

Från Wikipedia, den fria encyklopedin
Hoppa till navigation Hoppa till sökning
Bärbart dokumentformat (PDF)
Ikon för PDF -fil
Adobe PDF -logotyp
Filtillägg : .pdf
MIME -typ : ansökan / pdf
Magiskt nummer : % PDF
Utvecklad av: PDF -förening
Första utgåvan: 1993 av Adobe Inc.
Aktuell version: 2.0 (från och med juli 2017)
Standard (er) : ISO 32000 , Adobe: PDF -referens (för 1.7 och äldre)
Webbplats : https://www.pdfa.org/


Portable Document Format (engelska; kort för PDF ; tyska: (transport) portabelt dokumentformat ) är ett plattformsoberoende filformat som utvecklades och publicerades 1993 av Adobe Inc. och för närvarande vidareutvecklas av PDF Association .

Målet var att skapa ett filformat för elektroniska dokument så att de kan reproduceras i originalformat oberoende av det ursprungliga applikationsprogrammet, operativsystemet eller hårdvaruplattformen. Målet uppnåddes och återspeglas i ISO 32000 -serien (ISO 15930 för PDF / X ). För detta ändamål användes PostScript -formatets funktionalitet i huvudsak. En läsare av en PDF -fil ska alltid kunna visa och skriva ut dokumentet i det formulär som författaren har angett. De typiska konverteringsproblemen (t.ex. ändrade sidbrytningar eller felaktiga teckensnitt) vid utbyte av ett dokument mellan olika program elimineras därmed.

Förutom text, bilder och grafik kan en PDF -fil också innehålla hjälpmedel som underlättar navigering i dokumentet. Detta inkluderar till exempel klickbara innehållsförteckningar och miniatyriserade sidförhandsgranskningar.

Översikt

Grunder och programvara

PDF -dokument och filer kan skapas från texter , bilder och grafik - blandade eller individuellt - med lämpliga program (t.ex. med gratisprogram som PDFCreator och kontorspaket LibreOffice / OpenOffice.org , avgiftsbaserade program som Adobe Acrobat eller helt enkelt via dialogrutan Skriv ut) och visa den med lämpliga läsprogram ( t.ex.Evince , Ghostscript , Okular , Adobe Reader , Foxit , Preview ). Skaparen av en PDF -fil kan skydda den från oönskad användning på olika sätt genom att aktivera PDF -säkerhetsmekanismerna. Kryptering används för att förhindra obehörig åtkomst. Beroende på dina behov kan det redan krävas ett lösenord för att öppna filen, eller så är det inte tillåtet att kopiera innehåll från filen eller skriva ut. De skyddsmekanismer som implementeras i PDF för detta är dock inte tillförlitliga. i synnerhet enklare former av kryptering är lätta att övervinna.

I startfasen debiterades Adobe Reader. Endast den fria distributionen av programvaran gjorde det möjligt att distribuera formatet i den utsträckning det är idag. PDF har länge varit ett kommersiellt ( proprietärt ) men öppet filformat som dokumenterats i Adobes PDF -referenshandbok. Adobe introducerade det till ISO-standardiseringsprocessen i början av 2007 och med publiceringen den 1 juli 2008 är PDF-version 1.7 som ISO 32000-1: 2008 en öppen standard .

Vissa metoder för att hantera PDF har standardiserats av ISO i förväg för att underlätta datautbyte i prepress (som PDF / X ) och för långsiktig arkivering av PDF-filer (som PDF / A -1 i ISO 19005-1: 2005).

Generation och transformation

PDF är ett vektorbaserat sidbeskrivningsspråk som gör att skärmen kan fritt skalas. PDF -filer beskriver layouten som skapades med skapandeprogrammet i en form som är oberoende av skrivaren och standardinställningarna, proportionellt och därmed så trogen originalet som möjligt i princip. Det är här PDF -filen skiljer sig väsentligt från avancerade beskrivnings- och markeringsspråk som SGML eller HTML när det gäller kravet på optimal layouttrohet. För att optimera en bildskärm på utdataenheter med ett litet visningsområde - t.ex. PDA eller mobiltelefoner - kan markeringar (liknande HTML -taggar) lagras i en PDF -fil, vilket gör att sidinnehållet kan brytas upp - sedan oundvikligen med begränsade layout trohet. Sådana markeringar gör det också möjligt för ett läsarprogram att läsa dokumentet för synskadade användare och göra det lättare att konvertera innehållet till andra format.

Ett populärt program för att skapa PDF -filer är Adobe Acrobat Distiller , som skapar PDF -filer från PostScript -filer. Acrobat Distiller finns som en skrivbordsprodukt för Windows och macOS . Serverversioner och gratis Adobe Reader finns också för andra plattformar. Med hjälp av den fria mjukvaran Wine körs Acrobat Distiller också under Linux. Olika kontors- och DTP -program från andra tillverkare erbjuder direkt PDF -export och finns på ett antal plattformar . Nu med många verktyg och programmeringsbibliotek kan PDF -filer skapas på olika sätt med olika inriktningar. PDF -filer kan skapas på nästan vilken plattform som helst.

Adobe ger delvis utvecklare rätten att utveckla egna applikationer för att skapa och redigera PDF -dokument, men förbehåller sig upphovsrätten för specifikationerna. [1] PDF som ett sidbeskrivningsspråk kan ses som en vidareutveckling av PostScript -grafikmodellen, som också avslöjas. I slutet av februari 2007 meddelade Adobe att det skulle införliva version 1.7 av PDF -specifikationen i ISO -standardiseringen och samarbetar med den amerikanska branschorganisationen AIIM , som innehar sekretariatet för ISO -kommittén TC 171. Adobe hotade Microsoft med antitrustmål om den öppna PDF -standarden integrerades.

Ytterligare generationsmetoder behandlas under Konvertera andra format till PDF .

Användning och egenskaper

Generella egenskaper

En PDF -fil kan exakt återge dokument inklusive alla färger, raster- och vektorgrafik och teckensnitt . En av styrkorna med PDF är att det finns visningsprogram för alla vanliga plattformar , så att innehållet kan visas oavsett plattform.

Efterföljande redigering av PDF -filer är svårt. Det finns dock olika program med vilka du kan klippa ut enskilda sidor och ändra visst innehåll. Från och med Microsoft Word version 2013 kan PDF -filer konverteras till Word -filer direkt i programmet. [2]

Dokumentens omfattning

Storleksjämförelse: karta över Europa och en PDF -dokumentsida med den teoretiskt högsta möjliga sidstorleken på 381 km × 381 km

PDF -dokument kan innehålla flera hundra tusen sidor. Sidstorleken är inte begränsad av själva formatet. I Adobe Acrobat finns det dock implementeringsbegränsningar:

  • upp till version 3 till 45 tum × 45 tum (1.143 m × 1.143 m)
  • upp till version 6 till 200 tum × 200 tum (5,08 m × 5,08 m)
  • från version 7 till 15.000.000 tum × 15.000.000 tum (381 km × 381 km)

Lagring av information i dokumentet

All information sparas som numrerade objekt i PDF -filer. Objekt är till exempel teckensnittsinformation, teckenbredder, teckenkodningar som används (Mac / PC ...), sidbeskrivningar, parametrar för avkodare, beskärningsrutor, enskilda bokmärken, färgdefinitioner, sidorder, bitmappar, formulär, hoppmärken och allt annat som sparas i PDF -filer kan vara. En hundra sidor lång PDF-fil kan enkelt innehålla 10 000 objekt.

PDF är baserad på samma grafiska modell som PostScript -sidbeskrivningsspråket, men tillåter några ytterligare funktioner jämfört med detta - särskilt interaktiva element som bokmärken, kommentarer, formulärfält och deras programmering med JavaScript är möjliga. Jämfört med PostScript har den grafiska modellen för sidinnehållet också utökats till att inkludera funktioner som transparens eller valfritt eller bytbart innehåll (kallas lager i Acrobat -användargränssnittet) eller stöd för ICC -profiler och OpenType -teckensnitt.

Teckensnitt (med undantag för pixelteckensnitt) och vektorgrafik kan förstoras efter önskemål utan att kvaliteten försämras. Under dessa förhållanden kan stora nätverksplaner och datamodeller lagras på en PDF -sida utan förlust.

Textpassager, tabeller och grafik (inklusive utdrag därav) från PDF -dokument kan enkelt bearbetas i andra applikationsprogram genom att kopiera och klistra in respektive element, om skaparen av dokumentet har gett tillstånd. Text kan extraheras inte bara för vidare bearbetning i andra applikationer, utan också för surfning eller för användning med andra utmatningsmedier som skärmläsare . Detaljerat innehåll kan lätt hittas med hjälp av textsökning i enskilda dokument eller fulltextforskning i en PDF-dokumentsamling. Detta fungerar till och med om texten är grafiskt förvrängd, till exempel i form av en cirkel eller kurva.

Dokumentsäkerhet

Kryptering av PDF -dokument

En särskild egenskap hos PDF är tillvalet dokumentskydd med 40 eller 128 bitars kryptering . Genom att tilldela ett användarlösenord är det möjligt att göra dokumentet endast tillgängligt för en begränsad grupp människor. Författaren kan också använda ett separat ägarlösenord för att specifikt tilldela rättigheter till det relevanta dokumentet. Detta förhindrar att användare ändrar, skriver ut eller kopierar delar av dokumentet. Men även utan att känna till ägarens lösenord kan dessa rättighetsbegränsningar enkelt tas bort med hjälp av olika verktyg, särskilt om ett ägarlösenord används, men att öppna dokumentet kräver inget lösenord (det betyder att inget användarlösenord är inställt) . Användningsbegränsningarna i samband med kryptering kan enkelt kringgås genom att spara skärmdumpar som bitmappar och sedan använda optisk textigenkänning .

Lämpliga verktyg kan också användas för att tilldela rättigheter som gör det möjligt att lägga till anteckningar, kommentarer och bilagor till PDF -dokument eller för att spara formulärposter. Ursprungligen kunde dessa funktioner endast användas med Adobe Acrobat, men från version 7 är det också möjligt med gratis Adobe Reader att lägga till anteckningar och kommentarer och fylla i interaktiva formulärfält, förutsatt att relevant dokument har fått nödvändiga behörigheter av författare.

DRM -skyddade PDF -filer finns nu också. Dessa kan bland annat läsas med Adobe Digital Editions .

Sårbarheter orsakade av mänskliga misstag

PDF -filer kan oavsiktligt innehålla konfidentiell information som, även om den inte syns omedelbart, kan hittas med hjälp av textsökningar. Å ena sidan kan information döljas av objekt eller placeras utanför sidvisningsområdet, å andra sidan kan en PDF -fil innehålla metadata som bara visas när motsvarande dialogrutor öppnas och ibland går obemärkt förbi. I synnerhet är det inte tillräckligt att täcka den relevanta textpassagen när du "mörker" textpassager, den måste tas bort helt från PDF -filen. Det är inte alltid lätt att undvika oönskad information i en PDF -fil, särskilt inte om du inte bara har skapat och redigerat PDF -filen själv (och dokumentet från vilket den genererades). Det är viktigt att vid redigering av textstycken används ett verktyg som helt tar bort relevant innehåll. Det är lika viktigt att kontrollera metadata (finns i Acrobat via File / Properties). Acrobat Professional 8 erbjuder omfattande support här, särskilt genom en speciell funktion för att ta bort dold information.

Fallstudier:

Hacka enkelt krypterade eller signerade PDF -dokument

I december 2019 publicerade forskare från Ruhr -universitetet Bochum och IT -säkerhetsföretaget Hackmanit att det var enkelt att göra ändringar i signerade PDF -dokument utan att 21 av 22 PDF -läsare märkte det. Även Adobe Acrobat Reader markerade inte efterföljande ändringar. Bevisen presenterades på Chaos Communication Congress i Leipzig 27–30 december 2019. Forskarna visade att det var möjligt (a) att lägga till sidor och anteckningar i signerade dokument utan att ogiltigförklara signaturen, (b) att flytta ursprungligt signerat innehåll till en annan position i dokumentet och att skriva något annat på den ursprungliga platsen, och ( c) att ändra ("manipulera") metadata för signaturen. De berörda PDF -läsarna kände inte igen ändringen och angav fortfarande att signaturen var giltig. Forskarna kunde göra ändringarna med en enkel textredigerare. [3]

Forskarna kunde också enkelt göra ändringar i krypterade PDF -dokument. Även utan att veta lösenordet kunde de införliva dolda kommandon i rollen som en angripare. Om angriparen vidarebefordrar det till den faktiska mottagaren och han skriver in lösenordet, har angriparen automatiserad åtkomst till det fullständiga dekrypterade PDF -innehållet. Detta var möjligt med två metoder. Den första metoden utnyttjar funktionen som delvis kan kryptera PDF -filer. Bland annat kan PDF-strukturen ändras och icke-krypterat innehåll läggas till. Så snart dokumentet öppnas av en auktoriserad person kan angriparen extrahera text och därmed få åtkomst till innehållet. Den andra metoden är baserad på en sårbarhet i PDF -krypteringens specifikationer. Detta gör att krypterat innehåll kan ändras. 27 PDF -läsare undersöktes med avseende på kryptering. Alla testade PDF -läsare var mottagliga för en av dessa manipulationer. ISO -standarden innehåller inga tydliga riktlinjer för utvecklare om hur de ska implementera digitala signaturer och kryptering (från och med januari 2020). För att uppnå en tillförlitlig signatur och kryptering av PDF -filer med alla PDF -läsare i framtiden är det nödvändigt för ISO att vidareutveckla standarden. [3]

Redigering av dokument

PDF utformades som ett utbytesformat för färdiga dokument. Det finns nu ett antal program och tillägg för Adobe Acrobat som kan användas för att redigera PDF -filer. Emellertid kan formatet inte jämföras med filformaten för ordbehandlingsprogram eller grafikprogram och är förutom antecknings- och kommentarfunktionen endast lämplig för vidare behandling av dokument i begränsad omfattning. Det är dock möjligt att inom vissa gränser ta bort skrivfel , till exempel. Fördelarna med desktoppublicering för grafiker och designers är integrationen av alla element för utskrift.

Beroende på det enskilda fallet kan PDF -dokument vara antingen större eller mindre än filerna i den ursprungliga applikationen. Storleken på ett dokument beror på vilken typ av data det innehåller, effektivitetsprogrammet och om teckensnitt har bäddats in. Teckensnitt kan antingen bäddas in helt, som en delmängd av de tecken som faktiskt används i dokumentet, eller inte alls. Om ett dokument ska visas på ett tillförlitligt sätt, oavsett om de teckensnitt som används är installerade på målplattformen, måste åtminstone de tecken som faktiskt används vara inbäddade.

Skriva ut i batch -läge från kommandoraden

Utskrift görs vanligtvis inom det grafiska användargränssnittet för en tittare med Arkiv ▸ Skriv ut .... Acrobat Reader och Foxit Reader har delvis tagit bort kommandoradsalternativet / t <fil> <skrivarnamn> i de nyare versionerna (september 2015). I Acrobat kan du bara skriva ut på standardskrivaren, medan med Foxit kan skrivaren väljas, men Foxit öppnar applikationsfönstret och stänger inte det efter utskrift (användaren måste stänga det manuellt).

Linux

Om CUPS :

 lpr -P <skrivarnamn> "file.pdf"

Windows

Buntutskrift är möjlig med Ghostscript . [4] Ghostscript installerar sig själv med hjälp av ett installationsprogram under c: \ Program Files \ gs \ gs <Version> \ . Det finns körbara filer i bin \ underkatalogen. Exempel med DOS -fönstret i Windows 7:

 C: \ Program Files \ gs \ gs9.16 \ bin> gswin64c.exe \
  -dNOPAGEPROMPT \
  -dNOPROMPT \
  -dNOPAUSE \
  -dBATCH \
  [-dDEVICEWIDTHPOINTS = <Antal amerikanska punkter för pappersstorleken>] \
  [-dDEVICEHEIGHTPOINTS = <Antal amerikanska punkter för pappersstorleken>] \
  -sOutputFile = "% printer% \\ <server> \ <skrivarnamn>" \
  -sDEVICE = mswinpr2 \
  <myfile.pdf>

gswin64c.exe är 64-bitarsversionen utan ett separat fönster med interaktivt läge på kommandoraden.

dNO -alternativen dNO av det interaktiva läget. -dDEVICE kan användas om skrivaren använder ett ovanligt pappersformat. -sOutputFile anger skrivarens namn. -sDEVICE hänvisar till en intern modul i Ghostscript, där mswinpr2 en standardinställning. I slutet förväntar sig kommandoraden att filen ska skrivas ut (kan misslyckas om ordningen är annorlunda). Under utskriften visas en avbokningsdialogruta som stänger sig (kan -dNoCancel med -dNoCancel ).

Ghostscript för Windows visar också PDF -filen i sitt eget grafiska fönster om det inte finns några kommandoradsparametrar. Denna display visar pixlar och trappeffekter. Å andra sidan är kvaliteten på de utskrivna dokumenten betydligt bättre.

Serialisering och komprimering

Under utvecklingen anpassades PDF flera gånger till särskilda krav för användning på Internet . Ursprungligen måste ett dokument vara helt tillgängligt för att det skulle kunna visas. Det är nu möjligt att serialisera PDF -dokument så att delar av dem kan visas medan de laddas. Från version 1.5 av PDF -specifikationen kan flera objekt kombineras i en PDF och sedan komprimeras, vilket leder till betydligt bättre komprimering, särskilt med de många små objekt som krävs för dokumentstrukturen (bilddata eller den faktiska beskrivningen av en sida har alltid komprimerats).

Vid arkivering av utskrivna dokument som PDF -filer föredras en blandad metod för att både bevara originaldokumentet så mycket som möjligt och för att säkerställa sökbarhet. Genom att smart kombinera de bildkomprimeringsmetoder som stöds av PDF uppnås en mycket stark komprimering (vanligtvis 1: 200) genom att komprimera bakgrunden (vanligtvis plana strukturer och färggradienter) och text (skarpa kanter, men bara några färger) med olika, speciellt lämpliga metoder och placeras sedan ovanpå varandra. Den faktiska texten extraheras med OCR -processen och inbäddas osynligt.

Navigering på skärmen

Till skillnad från tidigare sidbeskrivningsspråk som PostScript, är "förhandsvisningen" på skärmen inte längre bara ett hjälpmedel för att undvika testutskrifter, utan erbjuder praktiska funktioner som inte är möjliga i utskriften: med korsreferenser och litteraturreferenser kan du behöver inte rulla till målet, men kan hoppa direkt till målsidan genom att klicka på länken. Navigering i dokumentet underlättas också med hjälp av sidikoner eller visning av strukturträd (enligt innehållsförteckningen). Om du klickar på externa länkar visas måldokumentet i webbläsaren . Dessa funktioner måste emellertid "byggas in" av författaren (till exempel med LaTeX och LaTeX -expansionspaketet hyperref, [5] se # TeX / DVI ) av redigeringsprogramvaran och implementeras av betraktaren .

Standardteckensnitt

14 teckensnitt ( standard 14 teckensnitt ) finns som standard i PDF -läsare och behöver därför inte bäddas in separat i PDF -dokumentet (förutom PDF / A- och PDF / X -dokument): [6]

PDF i operativsystem

Med macOS -operativsystemet från Apple användes PDF som standardformat för både skärm och utskrift för första gången. PDF -generationen kan göras från alla program som har en utskriftsdialog. Eftersom PDF också används för att generera utskriftsdata är det möjligt att mata ut PostScript på icke-Postscript-skrivare. Nästan alla typer av dokument som kan skrivas ut kan konverteras till PDF. Denna möjlighet finns också under GNU / Linux. B. i skrivardialogrutan för skrivbordsmiljön Gnome erbjuds alternativet PDF -generering inbyggt.

Den kostnadsfria Adobe Reader / Acrobat Reader är tillgänglig som PDF -läsare under Windows , klassiskt Mac OS och macOS, GNU / Linux och Unix -operativsystemen Solaris , HP / UX och AIX. Den integrerade Lucide viewer är tillgänglig under eComStation . Sedan Windows 8 har Windows nu också en integrerad PDF -visning. [7] Windows 10 var också utrustad med en PDF -skrivare från Microsoft. [Åttonde]

För Unix-baserade system finns också Xpdf- programmet, som reduceras till de mest grundläggande funktionerna (visning på skärmen, sökning i dokumentet, utskrift), samt några andra program ( Okular och Evince ) som är anpassade till din skrivbordsmiljö. Dessa program med öppen källkod är också lämpliga för att kringgå de förmodade "säkerhetsfunktionerna" i PDF -dokument - det är ibland möjligt att skriva ut dokument även om författaren faktiskt ville neka betraktaren av dokumentet detta alternativ.

Detaljer om sidgeometrin

De olika rutorna i PDF -filen

Information om sidgeometri i ett PDF -dokument är särskilt viktigt i tryckindustrin . De beskriver i vilket område på en sida innehållet är beläget som motsvarar det trimmade slutliga formatet och där ett ytterligare bearbetningsprogram (t.ex. för påläggning , dvs montering av sidor på ett utskriftsark) kan förvänta sig ett trimningsbidrag . Moderna DTP -program lagrar denna information i PDF när de exporteras direkt till PDF. Om PDF -filer matas ut med PostScript, ingår vanligtvis inte motsvarande information. För PostScript -utmatning från vissa program kan Adobe Acrobat Distiller härleda nätets sidområde från beskärningsmärkena, förutsatt att dessa också matas ut.

MediaBox (mediaram)

Den definierar storleken på utmatningsmediet för PDF -dokumentet. Dokumentet har ännu inte trimmats och innehåller vanligtvis PostScript -sidstorleken i PDF -generatorn. MediaBox måste alltid vara den största av alla rutor, eftersom den måste innehålla alla andra rutor, och det är den enda rutan som alltid måste inkluderas i en PDF -fil.

CropBox (trimbox)

CropBox (kallas ibland maskramen) beskriver området på en PDF -sida som ska matas ut på skärmen eller på skrivaren. Värdena för MediaBox är förinställda.

BleedBox (blödningsram)

En blödningsruta innehåller information om blödningsramen , som definierar storleken på det slutliga formatet plus den avsedda trimmen (överfyllning). I tryckindustrin krävs i allmänhet en blödning på 3 till 5 mm per sida. Ett applikationsexempel är bilder som är i blödningen (dvs. direkt på sidans kant) eller bilder som faller av och trimmas vid sidans kant. För en A4 -sida som ska levereras till en skrivare, resulterar en avluftningsbox på 3 mm i en bredd på 210 mm + 6 mm och en längd på 297 mm + 6 mm, dvs. 216 mm × 303 mm. CropBox -värdena är förinställda.

TrimBox (trimbox)

TrimBox är dokumentets slutliga format utan någon trimning.

ArtBox (objektram)

ArtBox (även kallad begränsningsruta ) beskriver sidavsnittet som ska användas när PDF -sidan placeras i ett annat program; jämförbar med storleksspecifikationen för import av en EPS -fil.

Formprocesser

Förutom text och grafiska element kan PDF -dokument innehålla interaktiva formelement för formulärprocesser. Fullständiga formulär kan därmed samlas i ett PDF -dokument; Data som finns registrerade i dokumentet kan skickas tillbaka till utgivaren av formuläret på olika sätt.

  • Skriv ut och fyll i: Det handfyllda formuläret kan skickas på vanligt sätt via post eller fax.
  • Slutförande och utskrift: Det elektroniskt ifyllda dokumentet kan skrivas ut och skickas på konventionellt sätt.
  • Fyll i och skicka via en HTTP -anslutning: Det elektroniskt ifyllda formuläret kan skickas elektroniskt via webbläsaren eller från Adobe Acrobat.
  • Fyll i och skicka det elektroniskt ifyllda formuläret via e -post.

Konvertering av andra format till PDF

XML

PDF -dokument kan skapas från XML -data i två steg:

  • Transformation med XSLT- formatmall till XSL-FO- format
  • Ein PDF-Prozessor (zum Beispiel Apache FOP , Altsoft Xml2PDF ) erzeugt daraus das fertige PDF-Dokument.

Ein leicht nachzuvollziehendes Beispiel ist die Transformation/Formatierung von invitation.xml [9] in PDF (das Beispiel zeigt auch die Transformation in XHTML und WordML ).

HTML

Aus einer HTML -Datei können PDF-Dokumente mit dem Programm HTMLDOC [10] erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolenschnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z. B. zur On-the-fly-Generierung von PDF-Dokumenten, geeignet.

Ein Perl -Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur Kommandozeile .

Das Programm wkhtmltopdf [11] ermöglicht die Generierung von mehreren PDF-Dokumenten gleichzeitig, ggf. inklusive Inhaltsverzeichnis. Durch die Verwendung des Webkit-Browser-Pakets [12] werden qualitativ sehr hochwertige Dokumente, z. B. zur Dokumentation kompletter Websites, erzeugt. [13] wkhtmltopdf ist ein Konsolenprogramm und kann ggf. auch über das Perl -Modul WKHTMLTOPDF bedient werden.

Auch PDF.js wandelt PDF-Dateien (temporär) in HTML-Code um, um die Anzeige dieser im Browser zu ermöglichen.

TeX/DVI

  • Aus DVI -Dateien (das Format wurde 1979 entworfen), die von den Satzprogrammen TeX und groff (ua) erzeugt werden, können auf verschiedene Weisen PDF-Dateien erzeugt werden:
    1. Man erzeugt aus der .dvi -Datei mithilfe des Gerätetreibers dvips eine PostScript-Datei ( .ps ) und aus dieser mit dem Adobe Distiller oder dem Ghostscript -Teilprogramm ps2pdf [14] [15] ein .pdf – kurz dvi→ps→pdf .
    2. Eine „partielle Abkürzung“ dieser Methode stellen Programme wie dvipdfm oder dvipdfmx dar, die DVI „direkt“ in PDF umwandeln.
  • pdfTeX und LuaTeX sind Weiterentwicklungen von TeX , die „direkt“, ohne das Zwischenformat DVI, PDF-Dateien erzeugen. Diese Erweiterungen von TeX erlangten zu Beginn des 21. Jahrhunderts Bedeutung.

Vielen TeX-Nutzern genügen die angegebenen Alternativen zur zuerst genannten Methode dvi→ps→pdf . Andere TeX-Nutzer betten jedoch PostScript in einem Maße in den Quellcode ein, dass diese Methoden versagen. Dies trifft vor allem zu, wenn das TeX-Paket PSTricks verwendet wird. Die Zusatzpakete pst-pdf, auto-pst-pdf und pdftricks bieten in diesem Fall Erleichterungen. Insgesamt verbleiben jedoch Fälle, in denen die „traditionelle“ Methode dvi→ps→pdf unersetzbar ist. Eine weitere Alternative bietet aber

  • XeTeX , das nach pdfTeX und etwas früher als LuaTeX erschien. Es erzeugt ein Zwischenformat XDV und daraus (vom Anwender kaum bemerkt) mit dem Treiber xdvipdfmx PDF. [16] Dadurch soll PostScript im Dokumentquellcode vollständig verarbeitet werden. [17] [18] Für die Verwendung von PStricks wird noch ein Paket xetex-pstricks angeboten.

3D-Daten

Beispiel für eine 3D-PDF-Datei

3D-PDF-Dokumente sind PDF-Dokumente, die entweder ein U3D -Flächenmodell oder ein BREP/Flächenmodell PRC [19] enthalten. Sie dienen vorwiegend der Visualisierung von CAD -Daten, kommen aber auch zunehmend in wissenschaftlichen Veröffentlichungen zur Anwendung. [20]

Der kostenlose Adobe Reader kann ab der Version 8.1 beide Formate anzeigen, animieren, schneiden und messen. Mit Acrobat 3D V7 ließen sich 3D-Daten aus 40 CAD-Formaten in 3D-PDF-Dateien konvertieren; jedoch hat 2010 Adobe Entwicklung, Vertrieb und Support der 3D-PDF-Konverter-Technologie an Tech Soft 3D [21] und die PROSTEP AG [22] übergeben. Ab Acrobat X [23] ist die Konvertierung nur noch als kostenpflichtiges 3D-PDF-Converter-Plugin [24] des Unternehmens Tetra 4D verfügbar.

Einige CAD-Programme wie Allplan oder SolidWorks [25] haben einen 3D-PDF-Export; Allplan bietet auch einen 3D-PDF-Import. [26] Auch Werkzeuge wie Deep Exploration von SAP, [27] Pages3D von QuadriSpace [28] und 3DVIA Composer von Dassault Systèmes [29] können 3D-CAD-Modelle als 3D-PDF abspeichern.

Neben den 3D-Daten als Visualisierung können auch andere relevanten Informationen zu einem CAD-Modell in ein PDF eingefügt werden. So können beispielsweise für die Herstellung eines Blechteils [30] die Daten des fertigen Modells als 3D-Visualisierung gezeigt werden.

Videoformate

Kombination von SWF- und 3D-Daten in einer 3D-PDF

Ab Acrobat 9 lassen sich diverse in Shockwave Flash (SWF) konvertierte Videoformate in Adobe PDF einbetten. Dadurch können Videos, Animationen und Anwendungen auf vielen Plattformen genutzt werden. Aufgrund der Adobe-Flash-Unterstützung in Adobe Reader ab Version 9 ist kein zusätzlicher Player für die Wiedergabe erforderlich. Seit dem letzten Patch von Adobe Acrobat und Adobe Reader 9 hat Adobe bei 3D-PDF das Standardverhalten geändert, unter anderem wurde der Flashplayer aus Adobe Acrobat 9 und Adobe Reader 9 entfernt – Flashinhalte greifen auf den Flashplayer im Betriebssystem zu. Adobe Acrobat X und Adobe Reader X sind nicht betroffen, da dort fast keine Angriffe erfolgen. 3D-Daten, SWF-Funktionen und SWF-Videoformate können auch kombiniert werden; so ist es möglich, Teilflächen des Modells mit SWF-Videos und Funktionen zu belegen.

Dateien aus Büroanwendungen

Viele aktuelle Programmpakete wie Apple iWork , Microsoft Office , LibreOffice , OpenOffice.org und Softmaker Office bieten einen PDF-Export an.

Versionen von PDF

Jahr PDF-Version Adobe-Version Charakteristika
1993 1.0/PDF 1 optisch attraktive Textdarstellung, Einbettung von Lesezeichen und dateiinternen Querverweisen, Reader heißt Carousel
1994 1.1 2 externe Querverweise, Einbettung von Multimedia-Dateien in mittlerweile obsoleten Sound- und Video-Formaten, Dokumente können durchsucht werden, 40-Bit-Verschlüsselung
1996 1.2 3 Möglichkeit der Verwendung des CMYK-Farbmodells , direktes Öffnen im Browserfenster durch Implementierung von Browser-Erweiterungen (sog. Plugins), Zugänglichkeits-Plugin für Blinde für den Acrobat Reader 3, interaktive Elemente wie Checkboxen und Radiobuttons sind möglich
1999 1.3 4 Unterstützung asiatischer Schriften, verbessertes Accessibility Plugin für den Acrobat Reader, weiterhin 40-Bit-Verschlüsselung, digitale Signaturen, JavaScript -Elemente möglich
2001 1.4 5 Wegfall des Zugänglichkeits-Plugin, dafür Unterstützung von MSAA (Microsoft Active Accessibility) durch den Acrobat Reader, RC4 -Verschlüsselung mit 40–128 Bit, Beschreibung des logischen Dokumentaufbaus mit Tags
2003 1.5 6 Einbettung von Bildern im Format JPEG 2000 , Filmen im Format MPEG und Audiodateien im Format MP3 möglich, Public Key-Verschlüsselung PKCS#7 ; Leseprogramm heißt ab jetzt Adobe Reader, keine Unterstützung mehr für DOS-basierte Windows-Versionen ( Windows 9x )
2004 1.6 7 Unterstützung für das Universal-3D -Dateiformat, Einbettung von OpenType -Fonts, Unterstützung für XFA-2.2-Rich-Text-Elemente und -Attribute, AES -Verschlüsselung, PKCS#7-Verschlüsselung mit SHA256 , DSA bis zu 4096 Bit, unzugängliche PDF-Dokumente können mit Tags versehen werden, bessere Unterstützung für mehrspaltige Dokumente, Formularfelder können mit Hilfe der Sprachausgabefunktionen vorgelesen werden, PDF-Creator mit Ausgabehilfeassistent: unterstützt beim Optimieren für Screenreader und Bildschirmvergrößerungsprogramme
2006 1.7 8 weitere Verbesserung der 3D-Darstellungsoptionen, stärkere Verschlüsselungsalgorithmen (PKCS#7 mit SHA384, SHA512 und RIPEMD-160 , 256-Bit AES)
2008 1.7 9 weitere Verbesserung
2010 1.7 X weitere Verbesserung
2012 1.7 XI weitere Verbesserung
2017 2.0 DC Unterstützung für das PRC -Dateiformat, 3D-Messwerkzeuge, verbesserte Sicherheitsfunktionen [31]

Normen und Standards

In verschiedenen Gremien der ISO werden seit dem Jahr 1997 Normen auf der Grundlage von PDF erarbeitet und verabschiedet. Dabei werden, basierend auf bestimmten PDF-Versionen, Mindestanforderungen sowie Einschränkungen definiert. Adobe Systems hat in diesem Zusammenhang den betreffenden Gremien der ISO das Recht übertragen, die jeweils nötigen Spezifikationen zeitlich unbegrenzt zum Herunterladen bereitzustellen.

Diese Normen entsprechen in grober Näherung als Basis den unterschiedlichen Versionen von PDF:

ISO Jahr Typ Version Bezeichnung / Bemerkung
15930 2001 PDF/X 1.3 Format für die Übermittlung von Druckvorlagen
15930-1 2001 PDF/X-1a 1.3 siehe PDF/X
15930-5 2003 PDF/X-2 1.4 siehe PDF/X
15930-4 2003 PDF/X-1a 1.4 siehe PDF/X
15930-3 2002 PDF/X-3 1.3 siehe PDF/X
15930-6 2003 PDF/X-3 1.4 siehe PDF/X
15930-7 2008 PDF/X-4 1.6 siehe PDF/X
15930-8 2008 PDF/X-5 1.6 siehe PDF/X
19005-1 2005 PDF/A-1 1.4 Format für die elektronische Archivierung
19005-1 2007 PDF/A-1 1.4 Korrektur PDF/A-1
19005-2 2011 PDF/A-2 1.7 siehe PDF/A-1
19005-3 2012 PDF/A-3 1.7 siehe PDF/A-1
24517 2008 PDF/E 1.6 Format für technische Dokumente aus den Bereichen Ingenieurwesen, Architektur und Geo-Informationssysteme (PDF Engineering)
2008 PDF/H Format für Dokumente im Gesundheitswesen (PDF Healthcare)
14289 2008 PDF/UA 1.7 Richtlinien zum Aufbau eines barrierefreien Dokuments im Format PDF (Universal Accessability)
16612-2 2010 PDF/VT 1.6 Format für den Einsatz im hochvolumigen und Transaktionsdruck (PDF Variable and Transactional Printing)
32000-1 2008 PDF 1.7 1.7
32000-2 2017 PDF 2.0 2.0[32]

Literatur

Weblinks

Commons : Portable Document Format – Sammlung von Bildern, Videos und Audiodateien
Wiktionary: PDF – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

  1. Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr: PDF Reference, fifth Edition, Section 1.5 Intellectual Property. (PDF; 8,1 MB) (Nicht mehr online verfügbar.) Adobe Systems, November 2004, S. 7 , archiviert vom Original am 16. Juni 2015 ; abgerufen am 3. November 2010 (englisch).
  2. PDF . Wiki von Ubuntuusers.de
  3. a b Chaos Communication Congress: Glauben Sie nicht alles, was in einem PDF-Dokument steht . Zeit Online , Dezember 2019; abgerufen am 4. Januar 2020.
  4. ghostscript.com ( Memento vom 13. September 2015 im Internet Archive )
  5. Paket hyperref. Comprehensive TeX Archive Network ; abgerufen am 2. Januar 2018.
  6. PDF Reference (Sixth Edition, version 1.7) – 5.5.1 Standard Type 1 Fonts ( Memento vom 6. Juli 2015 im Internet Archive ) (PDF, 31 MB, 1.310 S.)
  7. netzwelt.de
  8. giga.de
  9. Stefan Mintert: invitation.xml – Transform a single source XML file to several output formats. In: Website der Linkwerk GmbH. Abgerufen am 3. November 2010 (englisch).
  10. HTMLDOC Open Source Home Page. (Nicht mehr online verfügbar.) Michael R Sweet, 16. Januar 2017, archiviert vom Original am 21. Februar 2016 ; abgerufen am 16. Januar 2017 (englisch).
  11. wkhtmltopdf. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
  12. Webkit Open Source Projekt. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
  13. Website als PDF mit Inhaltsverzeichnis. Innovate Webdoc Services, abgerufen am 30. Dezember 2011 .
  14. ps2pdf: PostScript-to-PDF converter auf ghostscript .com
  15. PStricks-Seite über PDF-Export. tug.org.
  16. xetex auf CTAN.
  17. Am höchsten bewertete Antwort von Herbert Voß zu Frage 8413 auf tex.stackexchange.com.
  18. Antwort von „egreg“ (Enrico Gregorio) zu Frage 19966 auf tex.stackexchange.com.
  19. PRC Format Specification ( Memento vom 2. Dezember 2008 im Internet Archive ) bei Adobe
  20. Axel Newe: Enriching scientific publications with interactive 3D PDF: an integrated toolbox for creating ready-to-publish figures . In: PeerJ Computer Science . Band   2 , 20. Juni 2016, ISSN 2376-5992 , doi : 10.7717/peerj-cs.64 ( peerj.com [abgerufen am 28. Juni 2016]).
  21. Acrobat Pro Bundle ( Memento vom 11. Mai 2012 im Internet Archive ) bei Tech Soft 3D
  22. PDF Generator 3D der PROSTEP AG
  23. Acrobat X Pro bei Adobe
  24. 3D PDF Converter-Plug-in bei Tetra 4D
  25. official help-documentation. DassaultSystemes Solidworks, abgerufen am 27. Juni 2019 (englisch).
  26. Datenaustauschformate . allplan.com
  27. Deep Exploration ( Memento vom 7. September 2012 im Webarchiv archive.today ) von Right Hemisphere, seit 2012 SAP
  28. Pages3D, QuadriSpace
  29. 3DVIA Composer ( Memento vom 25. Mai 2013 im Webarchiv archive.today ) bei Dassault Systèmes
  30. 3D-PDF Beispiel bei UNITEC Informationssysteme
  31. Taking Documents to the Next Level with PDF 2.0. (PDF) Adobe, abgerufen am 11. September 2017 (englisch).
  32. ISO 32000-2:2017. ISO Org, abgerufen am 11. September 2017 (englisch).