Zdieľať

Co se skrývá v PDF, který posíláte do tiskárny

Zdieľať

Když jste naposledy posílali PDF do kopírovacího centra nebo externí tiskárny přes webový formulář, pravděpodobně jste nepřemýšleli nad tím, co všechno jde spolu se souborem. Většina z nás to nedělá, dokud se nestane něco nepříjemného. A právě z toho vznikají úniky interních dat, které nikdo neplánoval. Ne přes sofistikovaný útok, ale jednoduše proto, že nikdo se nepodíval, co v souboru zůstalo.

PDF není jen obrázek vašeho textu. Je to kontejner, který v sobě nese mnohem více, než vidíte na obrazovce.

Co všechno je v tom souboru?

Otevřete jakékoli pracovní PDF v Adobe Reader a klikněte na Soubor → Vlastnosti. Uvidíte jméno autora, software, ve kterém byl dokument vytvořen, a data úprav. To je jen zlomek toho, co tam sedí.

Metadata a historie dokumentu

Každý PDF má zabudovanou historii, kde je jméno autora, organizace, interní komentáře, software a jeho verze. Text smazaný v předchozích verzích dokumentu nemusí být skutečně pryč. Obrázky vložené z telefonu mohou nést GPS souřadnice místa, kde byly vyfotografovány. Závisí to na tom, zda mělo zařízení zapnuté geotagování a zda exportovaný soubor tato data zachoval. Není to pravidlo, je to možnost, kterou stojí za to znát.

Doporučujeme

Cesty k souborům

Stalo se vám někdy, že jste dostali PDF a v metadatech jste viděli jméno člověka, který ho vytvářel před třemi úpravami? To je běžné. Méně očekávané je něco jiného: z metadat PDF lze vytáhnout úplné cesty ke složkám, ze kterých byly vloženy obrázky nebo přílohy. Například něco ve stylu C:\Users:jmeno.prijmeni\Projekty\Klient_ABC\finance_Q3.docx. Z takového řetězce jsou čitelné jméno zaměstnance, struktura firemních adresářů i to, jaké projekty ve firmě probíhají. Není to informace, kterou by někdo vědomě sdílel.

 

zdroj: canva

Vložený kód

PDF podporuje JavaScript (v praxi například pro interaktivní formuláře). Stejná funkce se dá zneužít: škodlivý kód skrytý v dokumentu dokáže při otevření spustit stažení malwaru nebo navázat spojení s externím serverem. Vlastních pracovních dokumentů, které sami vytváříte, se to netýká. Relevantní je to u přijatých PDF od neznámých nebo neověřených odesílatelů, což je mimochodem i situace, do které se můžete dostat vy, když někdo pošle dokument vám.

Proč je tiskárna specifický případ

PDF poslaný kolegovi e-mailem je jedna věc. PDF odeslaný externímu subjektu je něco jiného.

Většina online tiskáren funguje tak, že odešlete soubor přes webový formulář na jejich server a zpracování neprobíhá ve vašem prohlížeči, ale u poskytovatele. Během tohoto procesu má dodavatel plný přístup ke struktuře dokumentu včetně všech metadat. U důvěryhodného partnera s jasnými smluvními podmínkami to nemusí být problém. U nového nebo neověřeného dodavatele, kam směřuje citlivá nabídka nebo smlouva, je prostor pro neúmyslný únik reálný.

Jiná situace nastává u firemních síťových tiskáren. Produkční zařízení jsou stále více propojena se sítí a některá si zpracované soubory určitou dobu ukládají. Pokud zařízení není správně zabezpečeno, tyto soubory mohou být dostupné i bez fyzického přístupu k tiskárně. Není to typický útočný vektor, ale v prostředí, kde se tisknou smlouvy nebo nabídky, stojí za to o této možnosti vědět.


Příklad, který se cituje dodnes: v roce 2003 britská vláda zveřejnila zprávu o iráckých zbraních hromadného ničení jako PDF. Metadata odhalila jména konkrétních autorů a ukázalo se, že části textu byly zkopírovány z akademických zdrojů bez uvedení zdroje, včetně faktických chyb z originálů. Soubor odešel bez jakéhokoli čištění. Skandál kolem plagiátorství zdrojů měl okamžité důsledky a případ se od té doby objevuje v každém seriózním textu o bezpečnosti dokumentů.

 

Jak to zjistit sami

Než se podíváte na řešení, doporučuji provést jeden konkrétní test: vezměte běžný pracovní dokument, například nabídku, smlouvu, prezentaci a podívejte se, co v něm je. K tomu slouží tři nástroje:

Adobe Reader (Soubor → Vlastnosti → záložky Popis a Vlastní) je nejrychlejší způsob pro běžného uživatele. Zobrazí základní metadata přímo bez instalace čehokoli dalšího.

ExifTool je bezplatný nástroj pro příkazový řádek: exiftool soubor.pdf vypíše všechna metadata včetně skrytých polí. Pro někoho, kdo s příkazovým řádkem pracuje běžně, je to nejrychlejší a nejpřesnější diagnostika.

PDF Analyzer je grafická alternativa pro ty, komu příkazový řádek nevyhovuje.

Výsledek vás možná překvapí. Možná ne. V každém případě budete vědět, s čím pracujete a totéž platí i opačným směrem: když dostanete PDF od někoho jiného, stejnými nástroji zjistíte, co v něm je. Někdy to řekne víc, než autor zamýšlel.

Kdy to vadí a kdy ne

Ne každý PDF je problém. Veřejný leták, produktový katalog nebo dokument bez jakéhokoli interního obsahu, tam jsou metadata bezvýznamná.

Situace se mění, pokud jste někdy posílali nabídku novému klientovi, smlouvu neověřenému dodavateli nebo dokument, který vznikl úpravou staršího souboru s vlastní historií. V takovém případě se vyplatí podívat, co v souboru zůstalo, a před odesláním ho vyčistit.

Jak soubor vyčistit

Virtuální tiskárna je nejrychlejší způsob bez jakýchkoli nákladů. Na Windows použijete Microsoft Print to PDF, na macOS Uložit jako PDF. Tiskem do virtuální tiskárny ve skutečnosti vytvoříte nový soubor z tiskového výstupu a většina metadat a interaktivních prvků se při tom ztratí. Pro běžné pracovní dokumenty to postačuje.

Adobe Acrobat Pro je nejdůkladnější možnost. Cesta: Všechny nástroje → Upravit PDF → Vyčistit dokument → Remove all. Funkce odstraní metadata, vložené soubory, JavaScript, skryté vrstvy i komentáře. Není to zadarmo, ale pokud pravidelně pracujete s dokumenty, které posíláte externě, investice dává smysl.

Ghostscript je bezplatná alternativa pro technicky zdatnější uživatele. Pracuje přes příkazový řádek a při konverzi PDF odstraní většinu nežádoucích prvků. Hodí se zejména tehdy, když zpracováváte větší objem dokumentů a chcete to automatizovat.

Dvě věci, které lidé podceňují

Začernění textu v PDF. Pokud přes text nakreslíte černý obdélník, původní informace zůstává ve struktuře souboru a lze ji vytáhnout běžnými nástroji. Tato chyba se objevila i ve vládních dokumentech s veřejně zdokumentovanými následky.

ExifTool u některých typů PDF a to konkrétně u těch s XMP metadaty uloženými v samostatném streamu, nepřepíše záznamy natrvalo. Jen přidá novou vrstvu, přičemž původní hodnoty zůstanou zachovány hlouběji ve struktuře. Na diagnostiku je výborný. Jako jediný nástroj čištění citlivých dokumentů nestačí, tam je spolehlivější sanitizace přes Acrobat nebo metoda virtuální tiskárny.

Jeden konkrétní krok

Nemusíte hned zavádět procesy ani kupovat nástroje. Stačí začít u nejbližšího PDF, který posíláte externě: otevřete ho v Adobe Reader a podívejte se na Vlastnosti. Pokud tam je jméno zaměstnance, interní cesta k souboru nebo popis projektu už víte, co je třeba udělat. Stejný princip platí pro všechny běžné kancelářské formáty: Word, Excel i PowerPoint skrývají metadata stejně pečlivě a zkontrolovat je lze stejně jednoduše přes Soubor → Vlastnosti nebo Informace.

Bezpečnost dokumentů je většinou o návycích, ne o drahých nástrojích.

Blog Ďalšie zaujímavé články
Recenze Naši spokojení zákazníci

Hledáte garanci kvality? Namísto dlouhých slibů necháváme mluvit naše klienty.

Váš nákupní košík
Nákupní košík neobsahuje položky
TonerDepot.cz
Přihlášení
Nemáte účet? Registrujte se teď
Menu
Nastavení cookies

Naše webové stránky používají soubory cookie ke zlepšení uživatelského zážitku. Používáním našich webových stránek souhlasíte s nezbytnými soubory cookie v souladu s našimi zásadami používání souborů cookie. Přečíst více

Soubory cookie jsou malé textové soubory, které webové stránky, které navštívíte, ukládají do vašeho počítače. Webové stránky používají soubory cookie, aby uživatelům umožnily efektivně se orientovat a provádět určité funkce. Soubory cookie, které jsou nezbytné pro správné fungování webových stránek, je možné nastavovat bez vašeho svolení. Všechny ostatní soubory cookie je nutné před nastavením v prohlížeči schválit. Svůj souhlas s používáním souborů cookie můžete kdykoli změnit na naší stránce.