Bärbart dokumentformat
Bärbart dokumentformat (PDF) | |
---|---|
![]() | |
![]() | |
Filtillägg : | .pdf |
MIME -typ : | ansökan / pdf |
Magiskt nummer : | |
Utvecklad av: | PDF -förening |
Första utgåvan: | 1993 av Adobe Inc. |
Aktuell version: | 2.0 (från och med juli 2017) |
Standard (er) : | ISO 32000 , Adobe: PDF -referens (för 1.7 och äldre) |
Webbplats : | https://www.pdfa.org/ |
Portable Document Format (engelska; kort för PDF ; tyska: (transport) portabelt dokumentformat ) är ett plattformsoberoende filformat som utvecklades och publicerades 1993 av Adobe Inc. och för närvarande vidareutvecklas av PDF Association .
Målet var att skapa ett filformat för elektroniska dokument så att de kan reproduceras i originalformat oberoende av det ursprungliga applikationsprogrammet, operativsystemet eller hårdvaruplattformen. Målet uppnåddes och återspeglas i ISO 32000 -serien (ISO 15930 för PDF / X ). För detta ändamål användes PostScript -formatets funktionalitet i huvudsak. En läsare av en PDF -fil ska alltid kunna visa och skriva ut dokumentet i det formulär som författaren har angett. De typiska konverteringsproblemen (t.ex. ändrade sidbrytningar eller felaktiga teckensnitt) vid utbyte av ett dokument mellan olika program elimineras därmed.
Förutom text, bilder och grafik kan en PDF -fil också innehålla hjälpmedel som underlättar navigering i dokumentet. Detta inkluderar till exempel klickbara innehållsförteckningar och miniatyriserade sidförhandsgranskningar.
Översikt
Grunder och programvara
PDF -dokument och filer kan skapas från texter , bilder och grafik - blandade eller individuellt - med lämpliga program (t.ex. med gratisprogram som PDFCreator och kontorspaket LibreOffice / OpenOffice.org , avgiftsbaserade program som Adobe Acrobat eller helt enkelt via dialogrutan Skriv ut) och visa den med lämpliga läsprogram ( t.ex.Evince , Ghostscript , Okular , Adobe Reader , Foxit , Preview ). Skaparen av en PDF -fil kan skydda den från oönskad användning på olika sätt genom att aktivera PDF -säkerhetsmekanismerna. Kryptering används för att förhindra obehörig åtkomst. Beroende på dina behov kan det redan krävas ett lösenord för att öppna filen, eller så är det inte tillåtet att kopiera innehåll från filen eller skriva ut. De skyddsmekanismer som implementeras i PDF för detta är dock inte tillförlitliga. i synnerhet enklare former av kryptering är lätta att övervinna.
I startfasen debiterades Adobe Reader. Endast den fria distributionen av programvaran gjorde det möjligt att distribuera formatet i den utsträckning det är idag. PDF har länge varit ett kommersiellt ( proprietärt ) men öppet filformat som dokumenterats i Adobes PDF -referenshandbok. Adobe introducerade det till ISO-standardiseringsprocessen i början av 2007 och med publiceringen den 1 juli 2008 är PDF-version 1.7 som ISO 32000-1: 2008 en öppen standard .
Vissa metoder för att hantera PDF har standardiserats av ISO i förväg för att underlätta datautbyte i prepress (som PDF / X ) och för långsiktig arkivering av PDF-filer (som PDF / A -1 i ISO 19005-1: 2005).
Generation och transformation
PDF är ett vektorbaserat sidbeskrivningsspråk som gör att skärmen kan fritt skalas. PDF -filer beskriver layouten som skapades med skapandeprogrammet i en form som är oberoende av skrivaren och standardinställningarna, proportionellt och därmed så trogen originalet som möjligt i princip. Det är här PDF -filen skiljer sig väsentligt från avancerade beskrivnings- och markeringsspråk som SGML eller HTML när det gäller kravet på optimal layouttrohet. För att optimera en bildskärm på utdataenheter med ett litet visningsområde - t.ex. PDA eller mobiltelefoner - kan markeringar (liknande HTML -taggar) lagras i en PDF -fil, vilket gör att sidinnehållet kan brytas upp - sedan oundvikligen med begränsade layout trohet. Sådana markeringar gör det också möjligt för ett läsarprogram att läsa dokumentet för synskadade användare och göra det lättare att konvertera innehållet till andra format.
Ett populärt program för att skapa PDF -filer är Adobe Acrobat Distiller , som skapar PDF -filer från PostScript -filer. Acrobat Distiller finns som en skrivbordsprodukt för Windows och macOS . Serverversioner och gratis Adobe Reader finns också för andra plattformar. Med hjälp av den fria mjukvaran Wine körs Acrobat Distiller också under Linux. Olika kontors- och DTP -program från andra tillverkare erbjuder direkt PDF -export och finns på ett antal plattformar . Nu med många verktyg och programmeringsbibliotek kan PDF -filer skapas på olika sätt med olika inriktningar. PDF -filer kan skapas på nästan vilken plattform som helst.
Adobe ger delvis utvecklare rätten att utveckla egna applikationer för att skapa och redigera PDF -dokument, men förbehåller sig upphovsrätten för specifikationerna. [1] PDF som ett sidbeskrivningsspråk kan ses som en vidareutveckling av PostScript -grafikmodellen, som också avslöjas. I slutet av februari 2007 meddelade Adobe att det skulle införliva version 1.7 av PDF -specifikationen i ISO -standardiseringen och samarbetar med den amerikanska branschorganisationen AIIM , som innehar sekretariatet för ISO -kommittén TC 171. Adobe hotade Microsoft med antitrustmål om den öppna PDF -standarden integrerades.
Ytterligare generationsmetoder behandlas under Konvertera andra format till PDF .
Användning och egenskaper
Generella egenskaper
En PDF -fil kan exakt återge dokument inklusive alla färger, raster- och vektorgrafik och teckensnitt . En av styrkorna med PDF är att det finns visningsprogram för alla vanliga plattformar , så att innehållet kan visas oavsett plattform.
Efterföljande redigering av PDF -filer är svårt. Det finns dock olika program med vilka du kan klippa ut enskilda sidor och ändra visst innehåll. Från och med Microsoft Word version 2013 kan PDF -filer konverteras till Word -filer direkt i programmet. [2]
Dokumentens omfattning
PDF -dokument kan innehålla flera hundra tusen sidor. Sidstorleken är inte begränsad av själva formatet. I Adobe Acrobat finns det dock implementeringsbegränsningar:
- upp till version 3 till 45 tum × 45 tum (1.143 m × 1.143 m)
- upp till version 6 till 200 tum × 200 tum (5,08 m × 5,08 m)
- från version 7 till 15.000.000 tum × 15.000.000 tum (381 km × 381 km)
Lagring av information i dokumentet
All information sparas som numrerade objekt i PDF -filer. Objekt är till exempel teckensnittsinformation, teckenbredder, teckenkodningar som används (Mac / PC ...), sidbeskrivningar, parametrar för avkodare, beskärningsrutor, enskilda bokmärken, färgdefinitioner, sidorder, bitmappar, formulär, hoppmärken och allt annat som sparas i PDF -filer kan vara. En hundra sidor lång PDF-fil kan enkelt innehålla 10 000 objekt.
PDF är baserad på samma grafiska modell som PostScript -sidbeskrivningsspråket, men tillåter några ytterligare funktioner jämfört med detta - särskilt interaktiva element som bokmärken, kommentarer, formulärfält och deras programmering med JavaScript är möjliga. Jämfört med PostScript har den grafiska modellen för sidinnehållet också utökats till att inkludera funktioner som transparens eller valfritt eller bytbart innehåll (kallas lager i Acrobat -användargränssnittet) eller stöd för ICC -profiler och OpenType -teckensnitt.
Teckensnitt (med undantag för pixelteckensnitt) och vektorgrafik kan förstoras efter önskemål utan att kvaliteten försämras. Under dessa förhållanden kan stora nätverksplaner och datamodeller lagras på en PDF -sida utan förlust.
Textpassager, tabeller och grafik (inklusive utdrag därav) från PDF -dokument kan enkelt bearbetas i andra applikationsprogram genom att kopiera och klistra in respektive element, om skaparen av dokumentet har gett tillstånd. Text kan extraheras inte bara för vidare bearbetning i andra applikationer, utan också för surfning eller för användning med andra utmatningsmedier som skärmläsare . Detaljerat innehåll kan lätt hittas med hjälp av textsökning i enskilda dokument eller fulltextforskning i en PDF-dokumentsamling. Detta fungerar till och med om texten är grafiskt förvrängd, till exempel i form av en cirkel eller kurva.
Dokumentsäkerhet
Kryptering av PDF -dokument
En särskild egenskap hos PDF är tillvalet dokumentskydd med 40 eller 128 bitars kryptering . Genom att tilldela ett användarlösenord är det möjligt att göra dokumentet endast tillgängligt för en begränsad grupp människor. Författaren kan också använda ett separat ägarlösenord för att specifikt tilldela rättigheter till det relevanta dokumentet. Detta förhindrar att användare ändrar, skriver ut eller kopierar delar av dokumentet. Men även utan att känna till ägarens lösenord kan dessa rättighetsbegränsningar enkelt tas bort med hjälp av olika verktyg, särskilt om ett ägarlösenord används, men att öppna dokumentet kräver inget lösenord (det betyder att inget användarlösenord är inställt) . Användningsbegränsningarna i samband med kryptering kan enkelt kringgås genom att spara skärmdumpar som bitmappar och sedan använda optisk textigenkänning .
Lämpliga verktyg kan också användas för att tilldela rättigheter som gör det möjligt att lägga till anteckningar, kommentarer och bilagor till PDF -dokument eller för att spara formulärposter. Ursprungligen kunde dessa funktioner endast användas med Adobe Acrobat, men från version 7 är det också möjligt med gratis Adobe Reader att lägga till anteckningar och kommentarer och fylla i interaktiva formulärfält, förutsatt att relevant dokument har fått nödvändiga behörigheter av författare.
DRM -skyddade PDF -filer finns nu också. Dessa kan bland annat läsas med Adobe Digital Editions .
Sårbarheter orsakade av mänskliga misstag
PDF -filer kan oavsiktligt innehålla konfidentiell information som, även om den inte syns omedelbart, kan hittas med hjälp av textsökningar. Å ena sidan kan information döljas av objekt eller placeras utanför sidvisningsområdet, å andra sidan kan en PDF -fil innehålla metadata som bara visas när motsvarande dialogrutor öppnas och ibland går obemärkt förbi. I synnerhet är det inte tillräckligt att täcka den relevanta textpassagen när du "mörker" textpassager, den måste tas bort helt från PDF -filen. Det är inte alltid lätt att undvika oönskad information i en PDF -fil, särskilt inte om du inte bara har skapat och redigerat PDF -filen själv (och dokumentet från vilket den genererades). Det är viktigt att vid redigering av textstycken används ett verktyg som helt tar bort relevant innehåll. Det är lika viktigt att kontrollera metadata (finns i Acrobat via File / Properties). Acrobat Professional 8 erbjuder omfattande support här, särskilt genom en speciell funktion för att ta bort dold information.
Fallstudier:
- En fil som handlar om den italienska agenten Nicola Calipari död , som befriade journalisten Giuliana Sgrena från irakisk gisslan i mars 2005. Amerikanska soldater sköt honom strax efter denna aktion. Den publicerade rapporten censurerades. De redaktionella revideringarna hittades dock i den publicerade filen genom att kopiera texten och spara den i en ny fil.
- Washington White House publicerade George W. Bushs "Plan för seger i Irak" -tal. Filinformationen avslöjade spökskrivaren , nämligen Peter Feaver , professor i statsvetenskap vid Duke University i North Carolina , som har rådgivit National Security Council sedan juni 2005.
- Efter attacken mot fordonskonvojen för den libanesiska politikern Rafiq Hariri hittades de tidigare raderade referenserna till namnen på syriska tjänstemän som misstänktes vara ansvariga för attacken i en offentligt publicerad PDF av FN (se Mehlis -rapport ).
- År 2007, som en del av spionageaffären i Formel 1 , kom konfidentiella uppgifter om Scuderia Ferrari -bilen till allmänheten efter att dess centrala tekniska värden bara var markerade med en svart stapel i ett PDF -dokument som fungerade som bevis, men texten var var fortfarande närvarande och extraherbar.
Hacka enkelt krypterade eller signerade PDF -dokument
I december 2019 publicerade forskare från Ruhr -universitetet Bochum och IT -säkerhetsföretaget Hackmanit att det var enkelt att göra ändringar i signerade PDF -dokument utan att 21 av 22 PDF -läsare märkte det. Även Adobe Acrobat Reader markerade inte efterföljande ändringar. Bevisen presenterades på Chaos Communication Congress i Leipzig 27–30 december 2019. Forskarna visade att det var möjligt (a) att lägga till sidor och anteckningar i signerade dokument utan att ogiltigförklara signaturen, (b) att flytta ursprungligt signerat innehåll till en annan position i dokumentet och att skriva något annat på den ursprungliga platsen, och ( c) att ändra ("manipulera") metadata för signaturen. De berörda PDF -läsarna kände inte igen ändringen och angav fortfarande att signaturen var giltig. Forskarna kunde göra ändringarna med en enkel textredigerare. [3]
Forskarna kunde också enkelt göra ändringar i krypterade PDF -dokument. Även utan att veta lösenordet kunde de införliva dolda kommandon i rollen som en angripare. Om angriparen vidarebefordrar det till den faktiska mottagaren och han skriver in lösenordet, har angriparen automatiserad åtkomst till det fullständiga dekrypterade PDF -innehållet. Detta var möjligt med två metoder. Den första metoden utnyttjar funktionen som delvis kan kryptera PDF -filer. Bland annat kan PDF-strukturen ändras och icke-krypterat innehåll läggas till. Så snart dokumentet öppnas av en auktoriserad person kan angriparen extrahera text och därmed få åtkomst till innehållet. Den andra metoden är baserad på en sårbarhet i PDF -krypteringens specifikationer. Detta gör att krypterat innehåll kan ändras. 27 PDF -läsare undersöktes med avseende på kryptering. Alla testade PDF -läsare var mottagliga för en av dessa manipulationer. ISO -standarden innehåller inga tydliga riktlinjer för utvecklare om hur de ska implementera digitala signaturer och kryptering (från och med januari 2020). För att uppnå en tillförlitlig signatur och kryptering av PDF -filer med alla PDF -läsare i framtiden är det nödvändigt för ISO att vidareutveckla standarden. [3]
Redigering av dokument
PDF utformades som ett utbytesformat för färdiga dokument. Det finns nu ett antal program och tillägg för Adobe Acrobat som kan användas för att redigera PDF -filer. Emellertid kan formatet inte jämföras med filformaten för ordbehandlingsprogram eller grafikprogram och är förutom antecknings- och kommentarfunktionen endast lämplig för vidare behandling av dokument i begränsad omfattning. Det är dock möjligt att inom vissa gränser ta bort skrivfel , till exempel. Fördelarna med desktoppublicering för grafiker och designers är integrationen av alla element för utskrift.
Beroende på det enskilda fallet kan PDF -dokument vara antingen större eller mindre än filerna i den ursprungliga applikationen. Storleken på ett dokument beror på vilken typ av data det innehåller, effektivitetsprogrammet och om teckensnitt har bäddats in. Teckensnitt kan antingen bäddas in helt, som en delmängd av de tecken som faktiskt används i dokumentet, eller inte alls. Om ett dokument ska visas på ett tillförlitligt sätt, oavsett om de teckensnitt som används är installerade på målplattformen, måste åtminstone de tecken som faktiskt används vara inbäddade.
Skriva ut i batch -läge från kommandoraden
Utskrift görs vanligtvis inom det grafiska användargränssnittet för en tittare med Arkiv ▸ Skriv ut .... Acrobat Reader och Foxit Reader har delvis tagit bort kommandoradsalternativet / t <fil> <skrivarnamn> i de nyare versionerna (september 2015). I Acrobat kan du bara skriva ut på standardskrivaren, medan med Foxit kan skrivaren väljas, men Foxit öppnar applikationsfönstret och stänger inte det efter utskrift (användaren måste stänga det manuellt).
Linux
Om CUPS :
lpr -P <skrivarnamn> "file.pdf"
Windows
Buntutskrift är möjlig med Ghostscript . [4] Ghostscript installerar sig själv med hjälp av ett installationsprogram under c: \ Program Files \ gs \ gs <Version> \ . Det finns körbara filer i bin \ underkatalogen. Exempel med DOS -fönstret i Windows 7:
C: \ Program Files \ gs \ gs9.16 \ bin> gswin64c.exe \ -dNOPAGEPROMPT \ -dNOPROMPT \ -dNOPAUSE \ -dBATCH \ [-dDEVICEWIDTHPOINTS = <Antal amerikanska punkter för pappersstorleken>] \ [-dDEVICEHEIGHTPOINTS = <Antal amerikanska punkter för pappersstorleken>] \ -sOutputFile = "% printer% \\ <server> \ <skrivarnamn>" \ -sDEVICE = mswinpr2 \ <myfile.pdf>
gswin64c.exe
är 64-bitarsversionen utan ett separat fönster med interaktivt läge på kommandoraden.
dNO
-alternativen dNO
av det interaktiva läget. -dDEVICE
kan användas om skrivaren använder ett ovanligt pappersformat. -sOutputFile
anger skrivarens namn. -sDEVICE
hänvisar till en intern modul i Ghostscript, där mswinpr2
en standardinställning. I slutet förväntar sig kommandoraden att filen ska skrivas ut (kan misslyckas om ordningen är annorlunda). Under utskriften visas en avbokningsdialogruta som stänger sig (kan -dNoCancel
med -dNoCancel
).
Ghostscript för Windows visar också PDF -filen i sitt eget grafiska fönster om det inte finns några kommandoradsparametrar. Denna display visar pixlar och trappeffekter. Å andra sidan är kvaliteten på de utskrivna dokumenten betydligt bättre.
Serialisering och komprimering
Under utvecklingen anpassades PDF flera gånger till särskilda krav för användning på Internet . Ursprungligen måste ett dokument vara helt tillgängligt för att det skulle kunna visas. Det är nu möjligt att serialisera PDF -dokument så att delar av dem kan visas medan de laddas. Från version 1.5 av PDF -specifikationen kan flera objekt kombineras i en PDF och sedan komprimeras, vilket leder till betydligt bättre komprimering, särskilt med de många små objekt som krävs för dokumentstrukturen (bilddata eller den faktiska beskrivningen av en sida har alltid komprimerats).
Vid arkivering av utskrivna dokument som PDF -filer föredras en blandad metod för att både bevara originaldokumentet så mycket som möjligt och för att säkerställa sökbarhet. Genom att smart kombinera de bildkomprimeringsmetoder som stöds av PDF uppnås en mycket stark komprimering (vanligtvis 1: 200) genom att komprimera bakgrunden (vanligtvis plana strukturer och färggradienter) och text (skarpa kanter, men bara några färger) med olika, speciellt lämpliga metoder och placeras sedan ovanpå varandra. Den faktiska texten extraheras med OCR -processen och inbäddas osynligt.
Till skillnad från tidigare sidbeskrivningsspråk som PostScript, är "förhandsvisningen" på skärmen inte längre bara ett hjälpmedel för att undvika testutskrifter, utan erbjuder praktiska funktioner som inte är möjliga i utskriften: med korsreferenser och litteraturreferenser kan du behöver inte rulla till målet, men kan hoppa direkt till målsidan genom att klicka på länken. Navigering i dokumentet underlättas också med hjälp av sidikoner eller visning av strukturträd (enligt innehållsförteckningen). Om du klickar på externa länkar visas måldokumentet i webbläsaren . Dessa funktioner måste emellertid "byggas in" av författaren (till exempel med LaTeX och LaTeX -expansionspaketet hyperref, [5] se # TeX / DVI ) av redigeringsprogramvaran och implementeras av betraktaren .
Standardteckensnitt
14 teckensnitt ( standard 14 teckensnitt ) finns som standard i PDF -läsare och behöver därför inte bäddas in separat i PDF -dokumentet (förutom PDF / A- och PDF / X -dokument): [6]
- Courier (i varianterna standard, fet, kursiv, fet kursiv)
- Helvetica (i varianterna standard, fet, kursiv, fet-kursiv)
- symbol
- Times New Roman (i varianterna standard, fet, kursiv, fet kursiv)
- Zapf dingbats
PDF i operativsystem
Med macOS -operativsystemet från Apple användes PDF som standardformat för både skärm och utskrift för första gången. PDF -generationen kan göras från alla program som har en utskriftsdialog. Eftersom PDF också används för att generera utskriftsdata är det möjligt att mata ut PostScript på icke-Postscript-skrivare. Nästan alla typer av dokument som kan skrivas ut kan konverteras till PDF. Denna möjlighet finns också under GNU / Linux. B. i skrivardialogrutan för skrivbordsmiljön Gnome erbjuds alternativet PDF -generering inbyggt.
Den kostnadsfria Adobe Reader / Acrobat Reader är tillgänglig som PDF -läsare under Windows , klassiskt Mac OS och macOS, GNU / Linux och Unix -operativsystemen Solaris , HP / UX och AIX. Den integrerade Lucide viewer är tillgänglig under eComStation . Sedan Windows 8 har Windows nu också en integrerad PDF -visning. [7] Windows 10 var också utrustad med en PDF -skrivare från Microsoft. [Åttonde]
För Unix-baserade system finns också Xpdf- programmet, som reduceras till de mest grundläggande funktionerna (visning på skärmen, sökning i dokumentet, utskrift), samt några andra program ( Okular och Evince ) som är anpassade till din skrivbordsmiljö. Dessa program med öppen källkod är också lämpliga för att kringgå de förmodade "säkerhetsfunktionerna" i PDF -dokument - det är ibland möjligt att skriva ut dokument även om författaren faktiskt ville neka betraktaren av dokumentet detta alternativ.
Detaljer om sidgeometrin
Information om sidgeometri i ett PDF -dokument är särskilt viktigt i tryckindustrin . De beskriver i vilket område på en sida innehållet är beläget som motsvarar det trimmade slutliga formatet och där ett ytterligare bearbetningsprogram (t.ex. för påläggning , dvs montering av sidor på ett utskriftsark) kan förvänta sig ett trimningsbidrag . Moderna DTP -program lagrar denna information i PDF när de exporteras direkt till PDF. Om PDF -filer matas ut med PostScript, ingår vanligtvis inte motsvarande information. För PostScript -utmatning från vissa program kan Adobe Acrobat Distiller härleda nätets sidområde från beskärningsmärkena, förutsatt att dessa också matas ut.
MediaBox (mediaram)
Den definierar storleken på utmatningsmediet för PDF -dokumentet. Dokumentet har ännu inte trimmats och innehåller vanligtvis PostScript -sidstorleken i PDF -generatorn. MediaBox måste alltid vara den största av alla rutor, eftersom den måste innehålla alla andra rutor, och det är den enda rutan som alltid måste inkluderas i en PDF -fil.
CropBox (trimbox)
CropBox (kallas ibland maskramen) beskriver området på en PDF -sida som ska matas ut på skärmen eller på skrivaren. Värdena för MediaBox är förinställda.
BleedBox (blödningsram)
En blödningsruta innehåller information om blödningsramen , som definierar storleken på det slutliga formatet plus den avsedda trimmen (överfyllning). I tryckindustrin krävs i allmänhet en blödning på 3 till 5 mm per sida. Ett applikationsexempel är bilder som är i blödningen (dvs. direkt på sidans kant) eller bilder som faller av och trimmas vid sidans kant. För en A4 -sida som ska levereras till en skrivare, resulterar en avluftningsbox på 3 mm i en bredd på 210 mm + 6 mm och en längd på 297 mm + 6 mm, dvs. 216 mm × 303 mm. CropBox -värdena är förinställda.
TrimBox (trimbox)
TrimBox är dokumentets slutliga format utan någon trimning.
ArtBox (objektram)
ArtBox (även kallad begränsningsruta ) beskriver sidavsnittet som ska användas när PDF -sidan placeras i ett annat program; jämförbar med storleksspecifikationen för import av en EPS -fil.
Formprocesser
Förutom text och grafiska element kan PDF -dokument innehålla interaktiva formelement för formulärprocesser. Fullständiga formulär kan därmed samlas i ett PDF -dokument; Data som finns registrerade i dokumentet kan skickas tillbaka till utgivaren av formuläret på olika sätt.
- Skriv ut och fyll i: Det handfyllda formuläret kan skickas på vanligt sätt via post eller fax.
- Slutförande och utskrift: Det elektroniskt ifyllda dokumentet kan skrivas ut och skickas på konventionellt sätt.
- Fyll i och skicka via en HTTP -anslutning: Det elektroniskt ifyllda formuläret kan skickas elektroniskt via webbläsaren eller från Adobe Acrobat.
- Fyll i och skicka det elektroniskt ifyllda formuläret via e -post.
Konvertering av andra format till PDF
XML
PDF -dokument kan skapas från XML -data i två steg:
- Transformation med XSLT- formatmall till XSL-FO- format
- Ein PDF-Prozessor (zum Beispiel Apache FOP , Altsoft Xml2PDF ) erzeugt daraus das fertige PDF-Dokument.
Ein leicht nachzuvollziehendes Beispiel ist die Transformation/Formatierung von invitation.xml [9] in PDF (das Beispiel zeigt auch die Transformation in XHTML und WordML ).
HTML
Aus einer HTML -Datei können PDF-Dokumente mit dem Programm HTMLDOC [10] erzeugt werden. Dieses Programm verfügt sowohl über eine Konsolenschnittstelle als auch über eine grafische Benutzeroberfläche. Damit ist es sowohl auf einem Client zur direkten Bedienung durch den Benutzer als auch zum Servereinsatz, z. B. zur On-the-fly-Generierung von PDF-Dokumenten, geeignet.
Ein Perl -Modul HTML::HTMLDoc erleichtert Perl-Entwicklern die Schnittstelle zur Kommandozeile .
Das Programm wkhtmltopdf [11] ermöglicht die Generierung von mehreren PDF-Dokumenten gleichzeitig, ggf. inklusive Inhaltsverzeichnis. Durch die Verwendung des Webkit-Browser-Pakets [12] werden qualitativ sehr hochwertige Dokumente, z. B. zur Dokumentation kompletter Websites, erzeugt. [13] wkhtmltopdf ist ein Konsolenprogramm und kann ggf. auch über das Perl -Modul WKHTMLTOPDF bedient werden.
Auch PDF.js wandelt PDF-Dateien (temporär) in HTML-Code um, um die Anzeige dieser im Browser zu ermöglichen.
TeX/DVI
- Aus DVI -Dateien (das Format wurde 1979 entworfen), die von den Satzprogrammen TeX und groff (ua) erzeugt werden, können auf verschiedene Weisen PDF-Dateien erzeugt werden:
- Man erzeugt aus der
.dvi
-Datei mithilfe des Gerätetreibers dvips eine PostScript-Datei (.ps
) und aus dieser mit dem Adobe Distiller oder dem Ghostscript -Teilprogramm ps2pdf [14] [15] ein.pdf
– kurzdvi→ps→pdf
. - Eine „partielle Abkürzung“ dieser Methode stellen Programme wie dvipdfm oder dvipdfmx dar, die DVI „direkt“ in PDF umwandeln.
- Man erzeugt aus der
- pdfTeX und LuaTeX sind Weiterentwicklungen von TeX , die „direkt“, ohne das Zwischenformat DVI, PDF-Dateien erzeugen. Diese Erweiterungen von TeX erlangten zu Beginn des 21. Jahrhunderts Bedeutung.
Vielen TeX-Nutzern genügen die angegebenen Alternativen zur zuerst genannten Methode dvi→ps→pdf
. Andere TeX-Nutzer betten jedoch PostScript in einem Maße in den Quellcode ein, dass diese Methoden versagen. Dies trifft vor allem zu, wenn das TeX-Paket PSTricks verwendet wird. Die Zusatzpakete pst-pdf, auto-pst-pdf und pdftricks bieten in diesem Fall Erleichterungen. Insgesamt verbleiben jedoch Fälle, in denen die „traditionelle“ Methode dvi→ps→pdf
unersetzbar ist. Eine weitere Alternative bietet aber
- XeTeX , das nach pdfTeX und etwas früher als LuaTeX erschien. Es erzeugt ein Zwischenformat XDV und daraus (vom Anwender kaum bemerkt) mit dem Treiber xdvipdfmx PDF. [16] Dadurch soll PostScript im Dokumentquellcode vollständig verarbeitet werden. [17] [18] Für die Verwendung von PStricks wird noch ein Paket xetex-pstricks angeboten.
3D-Daten
3D-PDF-Dokumente sind PDF-Dokumente, die entweder ein U3D -Flächenmodell oder ein BREP/Flächenmodell PRC [19] enthalten. Sie dienen vorwiegend der Visualisierung von CAD -Daten, kommen aber auch zunehmend in wissenschaftlichen Veröffentlichungen zur Anwendung. [20]
Der kostenlose Adobe Reader kann ab der Version 8.1 beide Formate anzeigen, animieren, schneiden und messen. Mit Acrobat 3D V7 ließen sich 3D-Daten aus 40 CAD-Formaten in 3D-PDF-Dateien konvertieren; jedoch hat 2010 Adobe Entwicklung, Vertrieb und Support der 3D-PDF-Konverter-Technologie an Tech Soft 3D [21] und die PROSTEP AG [22] übergeben. Ab Acrobat X [23] ist die Konvertierung nur noch als kostenpflichtiges 3D-PDF-Converter-Plugin [24] des Unternehmens Tetra 4D verfügbar.
Einige CAD-Programme wie Allplan oder SolidWorks [25] haben einen 3D-PDF-Export; Allplan bietet auch einen 3D-PDF-Import. [26] Auch Werkzeuge wie Deep Exploration von SAP, [27] Pages3D von QuadriSpace [28] und 3DVIA Composer von Dassault Systèmes [29] können 3D-CAD-Modelle als 3D-PDF abspeichern.
Neben den 3D-Daten als Visualisierung können auch andere relevanten Informationen zu einem CAD-Modell in ein PDF eingefügt werden. So können beispielsweise für die Herstellung eines Blechteils [30] die Daten des fertigen Modells als 3D-Visualisierung gezeigt werden.
Videoformate
Ab Acrobat 9 lassen sich diverse in Shockwave Flash (SWF) konvertierte Videoformate in Adobe PDF einbetten. Dadurch können Videos, Animationen und Anwendungen auf vielen Plattformen genutzt werden. Aufgrund der Adobe-Flash-Unterstützung in Adobe Reader ab Version 9 ist kein zusätzlicher Player für die Wiedergabe erforderlich. Seit dem letzten Patch von Adobe Acrobat und Adobe Reader 9 hat Adobe bei 3D-PDF das Standardverhalten geändert, unter anderem wurde der Flashplayer aus Adobe Acrobat 9 und Adobe Reader 9 entfernt – Flashinhalte greifen auf den Flashplayer im Betriebssystem zu. Adobe Acrobat X und Adobe Reader X sind nicht betroffen, da dort fast keine Angriffe erfolgen. 3D-Daten, SWF-Funktionen und SWF-Videoformate können auch kombiniert werden; so ist es möglich, Teilflächen des Modells mit SWF-Videos und Funktionen zu belegen.
Dateien aus Büroanwendungen
Viele aktuelle Programmpakete wie Apple iWork , Microsoft Office , LibreOffice , OpenOffice.org und Softmaker Office bieten einen PDF-Export an.
Versionen von PDF
Jahr | PDF-Version | Adobe-Version | Charakteristika |
---|---|---|---|
1993 | 1.0/PDF | 1 | optisch attraktive Textdarstellung, Einbettung von Lesezeichen und dateiinternen Querverweisen, Reader heißt Carousel |
1994 | 1.1 | 2 | externe Querverweise, Einbettung von Multimedia-Dateien in mittlerweile obsoleten Sound- und Video-Formaten, Dokumente können durchsucht werden, 40-Bit-Verschlüsselung |
1996 | 1.2 | 3 | Möglichkeit der Verwendung des CMYK-Farbmodells , direktes Öffnen im Browserfenster durch Implementierung von Browser-Erweiterungen (sog. Plugins), Zugänglichkeits-Plugin für Blinde für den Acrobat Reader 3, interaktive Elemente wie Checkboxen und Radiobuttons sind möglich |
1999 | 1.3 | 4 | Unterstützung asiatischer Schriften, verbessertes Accessibility Plugin für den Acrobat Reader, weiterhin 40-Bit-Verschlüsselung, digitale Signaturen, JavaScript -Elemente möglich |
2001 | 1.4 | 5 | Wegfall des Zugänglichkeits-Plugin, dafür Unterstützung von MSAA (Microsoft Active Accessibility) durch den Acrobat Reader, RC4 -Verschlüsselung mit 40–128 Bit, Beschreibung des logischen Dokumentaufbaus mit Tags |
2003 | 1.5 | 6 | Einbettung von Bildern im Format JPEG 2000 , Filmen im Format MPEG und Audiodateien im Format MP3 möglich, Public Key-Verschlüsselung PKCS#7 ; Leseprogramm heißt ab jetzt Adobe Reader, keine Unterstützung mehr für DOS-basierte Windows-Versionen ( Windows 9x ) |
2004 | 1.6 | 7 | Unterstützung für das Universal-3D -Dateiformat, Einbettung von OpenType -Fonts, Unterstützung für XFA-2.2-Rich-Text-Elemente und -Attribute, AES -Verschlüsselung, PKCS#7-Verschlüsselung mit SHA256 , DSA bis zu 4096 Bit, unzugängliche PDF-Dokumente können mit Tags versehen werden, bessere Unterstützung für mehrspaltige Dokumente, Formularfelder können mit Hilfe der Sprachausgabefunktionen vorgelesen werden, PDF-Creator mit Ausgabehilfeassistent: unterstützt beim Optimieren für Screenreader und Bildschirmvergrößerungsprogramme |
2006 | 1.7 | 8 | weitere Verbesserung der 3D-Darstellungsoptionen, stärkere Verschlüsselungsalgorithmen (PKCS#7 mit SHA384, SHA512 und RIPEMD-160 , 256-Bit AES) |
2008 | 1.7 | 9 | weitere Verbesserung |
2010 | 1.7 | X | weitere Verbesserung |
2012 | 1.7 | XI | weitere Verbesserung |
2017 | 2.0 | DC | Unterstützung für das PRC -Dateiformat, 3D-Messwerkzeuge, verbesserte Sicherheitsfunktionen [31] |
Normen und Standards
In verschiedenen Gremien der ISO werden seit dem Jahr 1997 Normen auf der Grundlage von PDF erarbeitet und verabschiedet. Dabei werden, basierend auf bestimmten PDF-Versionen, Mindestanforderungen sowie Einschränkungen definiert. Adobe Systems hat in diesem Zusammenhang den betreffenden Gremien der ISO das Recht übertragen, die jeweils nötigen Spezifikationen zeitlich unbegrenzt zum Herunterladen bereitzustellen.
Diese Normen entsprechen in grober Näherung als Basis den unterschiedlichen Versionen von PDF:
ISO | Jahr | Typ | Version | Bezeichnung / Bemerkung |
---|---|---|---|---|
15930 | 2001 | PDF/X | 1.3 | Format für die Übermittlung von Druckvorlagen |
15930-1 | 2001 | PDF/X-1a | 1.3 | siehe PDF/X |
15930-5 | 2003 | PDF/X-2 | 1.4 | siehe PDF/X |
15930-4 | 2003 | PDF/X-1a | 1.4 | siehe PDF/X |
15930-3 | 2002 | PDF/X-3 | 1.3 | siehe PDF/X |
15930-6 | 2003 | PDF/X-3 | 1.4 | siehe PDF/X |
15930-7 | 2008 | PDF/X-4 | 1.6 | siehe PDF/X |
15930-8 | 2008 | PDF/X-5 | 1.6 | siehe PDF/X |
19005-1 | 2005 | PDF/A-1 | 1.4 | Format für die elektronische Archivierung |
19005-1 | 2007 | PDF/A-1 | 1.4 | Korrektur PDF/A-1 |
19005-2 | 2011 | PDF/A-2 | 1.7 | siehe PDF/A-1 |
19005-3 | 2012 | PDF/A-3 | 1.7 | siehe PDF/A-1 |
24517 | 2008 | PDF/E | 1.6 | Format für technische Dokumente aus den Bereichen Ingenieurwesen, Architektur und Geo-Informationssysteme (PDF Engineering) |
– | 2008 | PDF/H | Format für Dokumente im Gesundheitswesen (PDF Healthcare) | |
14289 | 2008 | PDF/UA | 1.7 | Richtlinien zum Aufbau eines barrierefreien Dokuments im Format PDF (Universal Accessability) |
16612-2 | 2010 | PDF/VT | 1.6 | Format für den Einsatz im hochvolumigen und Transaktionsdruck (PDF Variable and Transactional Printing) |
32000-1 | 2008 | PDF 1.7 | 1.7 | |
32000-2 | 2017 | PDF 2.0 | 2.0 | [32] |
Literatur
- Philipp Mayr: Das Dateiformat PDF im Web – eine statistische Erhebung. In: NFD – Nachrichten für Dokumentation. Jg. 53, 2002, S. 475–481.
- Thomas Merz, Olaf Drümmer : Die PostScript- & PDF-Bibel. 2. Auflage. Kopublikation PDFlib / dpunkt Verlag, 2002, ISBN 3-935320-01-9 .
Die PostScript- & PDF-Bibel ( Memento vom 2. März 2013 im Internet Archive ; ZIP) von PDFLib - Betsy A. Fanning:Technology Watch Report, Preserving the Data Explosion: Using PDF (PDF; 136 kB), Digital Preservation Coalition, April 2008.
- Ralf Benzmüller, Karsten Tellmann: PDF: Potentially Dangerous Files, Angriffs- und Abwehrmechanismen bei PDF-Dateien. <kes>, Nr. 1, Februar 2010, S. 61–65; ähnlich bei security-zone.info (PDF; 3,1 MB).
- Hans Peter Schneeberger: PDF in der Druckvorstufe 1. Auflage. Rheinwerk Verlag, 2014, ISBN 978-3-8362-1750-7 .
Weblinks
- Linkkatalog zum Thema PDF bei curlie.org (ehemals DMOZ )
- PDF-Spezifikationen bei Adobe Systems (englisch)
- Technische Betrachtung der PDF-Dateiverschlüsselung
- ISO 19005-1 stützt sich auf das Portable Document Format Meldung auf heise online
- PDF mit dem W3C-Standard XSL-FO erzeugen
- Peter Zschunke, Ben Schwan: PDF wird 20 Jahre alt. (PDF) In: heise online. Abgerufen am 17. Oktober 2013 (Zum Wesen und Werdegang von PDF anlässlich des 20 Jahrestages).
- pst-pdf
- auto-pst-pdf
- pdftricks
- convert-pdfs.com
Einzelnachweise
- ↑ Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr: PDF Reference, fifth Edition, Section 1.5 Intellectual Property. (PDF; 8,1 MB) (Nicht mehr online verfügbar.) Adobe Systems, November 2004, S. 7 , archiviert vom Original am 16. Juni 2015 ; abgerufen am 3. November 2010 (englisch).
- ↑ PDF . Wiki von Ubuntuusers.de
- ↑ a b Chaos Communication Congress: Glauben Sie nicht alles, was in einem PDF-Dokument steht . Zeit Online , Dezember 2019; abgerufen am 4. Januar 2020.
- ↑ ghostscript.com ( Memento vom 13. September 2015 im Internet Archive )
- ↑ Paket hyperref. Comprehensive TeX Archive Network ; abgerufen am 2. Januar 2018.
- ↑ PDF Reference (Sixth Edition, version 1.7) – 5.5.1 Standard Type 1 Fonts ( Memento vom 6. Juli 2015 im Internet Archive ) (PDF, 31 MB, 1.310 S.)
- ↑ netzwelt.de
- ↑ giga.de
- ↑ Stefan Mintert: invitation.xml – Transform a single source XML file to several output formats. In: Website der Linkwerk GmbH. Abgerufen am 3. November 2010 (englisch).
- ↑ HTMLDOC Open Source Home Page. (Nicht mehr online verfügbar.) Michael R Sweet, 16. Januar 2017, archiviert vom Original am 21. Februar 2016 ; abgerufen am 16. Januar 2017 (englisch).
- ↑ wkhtmltopdf. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
- ↑ Webkit Open Source Projekt. Open Source Project, abgerufen am 30. Dezember 2011 (englisch).
- ↑ Website als PDF mit Inhaltsverzeichnis. Innovate Webdoc Services, abgerufen am 30. Dezember 2011 .
- ↑ ps2pdf: PostScript-to-PDF converter auf ghostscript .com
- ↑ PStricks-Seite über PDF-Export. tug.org.
- ↑ xetex auf CTAN.
- ↑ Am höchsten bewertete Antwort von Herbert Voß zu Frage 8413 auf tex.stackexchange.com.
- ↑ Antwort von „egreg“ (Enrico Gregorio) zu Frage 19966 auf tex.stackexchange.com.
- ↑ PRC Format Specification ( Memento vom 2. Dezember 2008 im Internet Archive ) bei Adobe
- ↑ Axel Newe: Enriching scientific publications with interactive 3D PDF: an integrated toolbox for creating ready-to-publish figures . In: PeerJ Computer Science . Band 2 , 20. Juni 2016, ISSN 2376-5992 , doi : 10.7717/peerj-cs.64 ( peerj.com [abgerufen am 28. Juni 2016]).
- ↑ Acrobat Pro Bundle ( Memento vom 11. Mai 2012 im Internet Archive ) bei Tech Soft 3D
- ↑ PDF Generator 3D der PROSTEP AG
- ↑ Acrobat X Pro bei Adobe
- ↑ 3D PDF Converter-Plug-in bei Tetra 4D
- ↑ official help-documentation. DassaultSystemes Solidworks, abgerufen am 27. Juni 2019 (englisch).
- ↑ Datenaustauschformate . allplan.com
- ↑ Deep Exploration ( Memento vom 7. September 2012 im Webarchiv archive.today ) von Right Hemisphere, seit 2012 SAP
- ↑ Pages3D, QuadriSpace
- ↑ 3DVIA Composer ( Memento vom 25. Mai 2013 im Webarchiv archive.today ) bei Dassault Systèmes
- ↑ 3D-PDF Beispiel bei UNITEC Informationssysteme
- ↑ Taking Documents to the Next Level with PDF 2.0. (PDF) Adobe, abgerufen am 11. September 2017 (englisch).
- ↑ ISO 32000-2:2017. ISO Org, abgerufen am 11. September 2017 (englisch).