PDF (англ. Portable Document Format, «портативный формат документов») — универсальный формат электронных документов, разработанный компанией Adobe Systems в начале 1990-х годов. Первая версия стандарта (PDF 1.0) была представлена в ноябре 1992 года, а первое программное обеспечение для работы с форматом — пакет Adobe Acrobat — поступило в продажу в июне 1993 года[2]. С 1 июля 2008 года PDF является открытым стандартом ISO 32000-1[2].
Что важно знать
| англ. Portable Document Format | |
| Область использования | Электронные документы |
| Дата появления | 1992 |
| Место появления | Лос-Альтос, Калифорния, США[1] |
| Автор понятия | Adobe Systems |
Создание и ранние версии (1990—2000)
История формата началась в 1990 году с внутреннего проекта сооснователя Adobe Systems Джона Уорнока под кодовым названием «Camelot»[3]. Целью было создание универсального формата файла, который позволял бы обмениваться документами между различными компьютерными системами и программами так, чтобы они выглядели одинаково на любом устройстве[3]. Первая версия программы для работы с PDF, Adobe Acrobat, была официально выпущена 15 июня 1993 года[3]. Однако на начальном этапе внедрение формата шло медленно из-за нескольких факторов: программа для просмотра Acrobat Reader была платной (стоила 50 долларов), файлы имели большой размер, а в первой версии отсутствовала поддержка внешних гиперссылок[4].
Ключевым шагом для популяризации формата стало решение Adobe в 1994 году сделать программу Acrobat Reader бесплатной[4]. В сентябре того же года вышла вторая версия Adobe Acrobat, работавшая с файлами формата PDF 1.1[5]. Это обновление принесло важные улучшения: появилась поддержка внешних ссылок, что было необходимо для интеграции с развивающимся интернетом[6], были добавлены независимые от устройства цвета и улучшено шифрование паролей с использованием MD5 и 40-битного RC4[7]. В 1995 году в версии Acrobat 2.1 была добавлена поддержка Windows 95, а также появились плагины для встраивания в документы URL-адресов и мультимедийных файлов (видео и аудио форматов QuickTime и AVI)[4]. Несмотря на конкуренцию со стороны других форматов (таких как DjVu и Envoy), PDF начал находить крупных пользователей — например, Налоговое управление США использовало его для распространения налоговых деклараций[4].
В ноябре 1996 года вместе с выходом Adobe Acrobat 3.0 была представлена спецификация PDF 1.2[8]. Она значительно расширила интерактивность формата, добавив поддержку заполняемых форм, обработку событий мыши и поддержку стандарта Unicode[9]. 1997 год, хотя и не принёс новой версии формата, стал важным для роста его экосистемы: количество бесплатных копий Acrobat Reader превысило 20 миллионов, а функция создания PDF была встроена в ключевые продукты Adobe, такие как Illustrator 7.0, Photoshop 4.0 и PageMaker 6.5[10]. В том же году появилась первая сторонняя библиотека для создания PDF-файлов (PDFlib)[11], а компания Agfa представила Apogee — первую допечатную систему на основе PDF[12]. В 1998 году для нужд полиграфии был создан стандарт PDF/X-1, основанный на PDF 1.2 и гарантировавший готовность файла к печати за счёт встраивания всех шрифтов и изображений[13].
В апреле 1999 года с выходом Adobe Acrobat 4.0 была представлена версия PDF 1.3[14]. Это обновление было ориентировано на корпоративное использование и привнесло такие ключевые функции, как возможность встраивания цифровых подписей, поддержка JavaScript для создания сложной интерактивности, улучшенная работа с цветом (включая профили ICC и смесевые цвета DeviceN) и поддержка двухбайтовых CID-шрифтов для азиатских языков[14]. К 2000 году, когда число загрузок Acrobat Reader превысило 100 миллионов[15], произошло ещё одно знаковое событие: компания Apple выбрала PDF в качестве основы для технологии рендеринга графики Quartz в своей новой операционной системе Mac OS X. Это сделало создание PDF-файлов встроенной функцией операционной системы, что значительно способствовало дальнейшему распространению формата[3].
Расширение функциональности и стандарты (2001—2007)
В мае 2001 года с выходом Adobe Acrobat 5.0 была представлена спецификация PDF 1.4[16]. Это обновление принесло значительные улучшения: появилась поддержка прозрачности объектов, что расширило дизайнерские возможности, а уровень безопасности был повышен за счёт внедрения 128-битного шифрования[16]. Важным нововведением стала поддержка «тегированного PDF» (англ. Tagged PDF), которая добавляла в документ структурную информацию, улучшая доступность контента и его адаптацию для различных устройств. Также была добавлена поддержка сжатия JBIG2 для монохромных изображений и возможность добавлять невидимый текстовый слой после оптического распознавания символов (OCR), что позволяло осуществлять поиск по отсканированным документам. В том же году был принят международный стандарт для полиграфии PDF/X-1a:2001, основанный на PDF 1.3 и предназначенный для надёжного обмена готовыми к печати файлами[17].
В 2003 году вместе с выходом Acrobat 6.0 была представлена версия PDF 1.5[18]. Ключевыми нововведениями стали поддержка слоёв (официально — англ. Optional Content Groups, OCGs), которые позволяли отображать или скрывать части контента, и поддержка нового стандарта сжатия изображений JPEG2000[19]. С выходом шестой версии продуктовой линейки бесплатная программа для просмотра документов была переименована с «Adobe Acrobat Reader» на «Adobe Reader».
В ноябре 2004 года с выходом Acrobat 7.0 была представлена версия PDF 1.6[20]. Она привнесла революционные для формата функции: возможность встраивать в документ интерактивную 3D-графику в формате U3D и использовать PDF в качестве контейнера для вложения файлов любых форматов[20]. Безопасность была усилена за счёт поддержки шифрования AES, а пользователи бесплатного Adobe Reader 7.0 получили возможность добавлять комментарии, если создатель документа предоставлял такое право[21].
Знаковым событием 2005 года стала публикация стандарта PDF/A (англ. PDF for Archiving) — ISO 19005-1:2005[22]. Этот стандарт, основанный на PDF 1.4, был разработан для долгосрочного архивного хранения электронных документов. Он гарантировал, что документ будет воспроизводиться в точно таком же виде спустя годы, для чего запрещал использование внешних зависимостей (например, ссылок на шрифты), JavaScript, аудио- и видеовставок, а также шифрования. Стандарт был представлен в двух уровнях: PDF/A-1b (гарантия точного визуального воспроизведения) и PDF/A-1a (дополнительно требовал наличия структурной разметки для доступности)[23].
В 2006 году вместе с Acrobat 8.0 вышла версия PDF 1.7, которая стала последней, выпущенной под полным контролем Adobe. Она привнесла улучшения в совместную работу и безопасность, а также позволила встраивать в документ настройки печати (например, выбор лотка для бумаги). В январе 2007 года Adobe передала полную спецификацию PDF 1.7 в ISO для стандартизации[24]. Этот шаг завершился 1 июля 2008 года, когда PDF 1.7 был официально опубликован как открытый международный стандарт ISO 32000-1:2008[25], что открыло новую главу в истории формата.
Эпоха открытого стандарта PDF 2.0 и ИИ (2008 — н.в.)
Передача формата в ISO открыла новую главу в его истории, сделав PDF открытым международным стандартом. 1 июля 2008 года спецификация PDF 1.7 была официально опубликована как ISO 32000-1:2008[26]. Это означало, что дальнейшее развитие формата перешло от Adobe к международному комитету экспертов. В 2009 году началась работа над следующей крупной версией формата — PDF 2.0[27].
В последующие годы экосистема формата пополнилась новыми специализированными стандартами. В августе 2010 года был опубликован стандарт ISO 16612-2 (PDF/VT), предназначенный для печати переменных данных и транзакционной печати[28]. В июне 2011 года вышел стандарт для долгосрочного архивирования PDF/A-2 (ISO 19005-2), основанный на PDF 1.7. Он привнёс поддержку сжатия JPEG2000, прозрачности, слоёв и возможность вложения других файлов формата PDF/A. В октябре 2012 года был опубликован стандарт PDF/A-3 (ISO 19005-3), ключевым отличием которого стала возможность встраивать в архивный документ файлы любых форматов (например, XML или CSV), что позволило хранить исходные данные вместе с их визуальным представлением[29][30].
В июле 2017 года, после девяти лет разработки, ISO опубликовала стандарт PDF 2.0 (ISO 32000-2:2017) — первую версию, созданную полностью под эгидой ISO[31]. Он привнёс улучшенные возможности для полиграфии, более надёжные методы шифрования, поддержку геопространственных данных и паролей в формате Unicode, но объявил устаревшими некоторые технологии, например, формы XFA[32]. В декабре 2020 года была выпущена обновлённая редакция стандарта — ISO 32000-2:2020[33], которая устранила неясности и внесла исправления в версию 2017 года, став текущей и действующей[34]. В апреле 2023 года, благодаря спонсорству со стороны PDF Association, Adobe и других компаний, стандарт PDF 2.0 стал постоянно доступен для бесплатного скачивания[35]. На базе PDF 2.0 в 2020 году был также опубликован новый стандарт для архивирования PDF/A-4 (ISO 19005-4), который упростил уровни соответствия и добавил поддержку новых функций, таких как 3D-модели (уровень PDF/A-4e)[36][37].
С 2023 года началось активное внедрение технологий искусственного интеллекта (ИИ) в программное обеспечение для работы с PDF. Одной из первых стала компания Foxit, интегрировавшая в свой PDF Reader помощника на базе ChatGPT для создания кратких сводок и ответов на вопросы по документу[38]. В феврале 2024 года Adobe представила AI Assistant для Acrobat и Reader, который вышел из бета-версии и стал доступен по подписке в том же году[39]. Этот инструмент позволяет генерировать резюме, отвечать на вопросы по содержанию и форматировать информацию для отчётов и писем. Позже в 2024 году его возможности были расширены для анализа групп документов в разных форматах (включая Word и PowerPoint) и генерации изображений[40]. Развитие формата также определяется законодательными требованиями: с 28 июня 2025 года вступает в силу Европейский акт о доступности (EAA), который обязывает делать PDF-документы доступными для людей с ограниченными возможностями, что повышает значимость стандарта PDF/UA (ISO 14289)[41].
Определение
Portable Document Format — цифровой формат, предназначенный для представления документов таким образом, чтобы их визуальный облик (шрифты, графика, разметка страниц) оставался неизменным при открытии на любом оборудовании и в любой операционной системе[42]. Ключевые особенности формата включают:
- независимость от программно-аппаратной платформы;
- сохранение исходного макета и возможность встраивания шрифтов;
- поддержку векторной и растровой графики, мультимедиа и интерактивных элементов;
- встроенные механизмы защиты (пароль, шифрование, цифровая подпись);
- статус международного открытого стандарта ISO 32000[43].
Различают несколько подтипов PDF-файлов:
- текстовые (созданные напрямую из офисных приложений);
- на основе изображений (сканированные, с возможностью OCR);
- интерактивные (формы, сценарии, гиперссылки);
- tagged PDF (с семантической разметкой для обеспечения доступности)[42].
Любой PDF-файл состоит из четырёх обязательных сегментов:[44]
- Header — строка вида
%PDF-1.x, указывающая версию спецификации. - Body — коллекция объектов, описывающих страницы, ресурсы и шрифты[45].
- Cross-Reference Table — таблица смещений, обеспечивающая быстрый доступ к объектам.
- Trailer — словарь, содержащий ссылки на корневой каталог документа и финальный маркер
%%EOF[46].
Тело документа формируется из базовых типов объектов:[47]
- Boolean
- Number
- String
- Name
- Array
- Dictionary
- Null
а также составных Stream-объектов, применяемых для хранения больших объёмов данных с возможностью сжатия.
Возможность семантической разметки, или Tagged PDF (англ. Tagged PDF), была представлена в спецификации PDF 1.4 в мае 2001 года. Эта технология позволяет добавлять в документ невидимый слой с логической структурой, определяя такие элементы, как заголовки, абзацы, таблицы и списки. Наличие тегов значительно повышает доступность контента для людей с ограниченными возможностями (например, для программ экранного доступа), а также облегчает автоматическую обработку и перекомпоновку (англ. reflow) содержимого для корректного отображения на устройствах с разными размерами экранов, например, на КПК.
Концепция тегированной структуры лежит в основе современного стандарта доступности PDF/UA (англ. Universal Accessibility, ISO 14289). Значимость этого стандарта возросла в связи с принятием законодательных актов, таких как Европейский акт о доступности (англ. European Accessibility Act, EAA), который с 28 июня 2025 года обязывает делать цифровые документы, включая PDF, доступными для всех пользователей.
Генерация PDF из офисных документов, графических редакторов, веб-страниц или сканированных изображений осуществляется через встроенные функции экспорта, виртуальные «PDF-принтеры» либо онлайн-конвертеры[48].
Чтение PDF-файлов производится в специальных просмотрщиках и современных браузерах с поддержкой масштабирования, поиска и навигации по миниатюрам страниц[49].
Специализированные редакторы позволяют изменять текст, изображения, структуру страниц и применять OCR для превращения сканов в редактируемый текст[50].
Добавление комментариев, выделений, штампов и фигур, применяемое при совместной работе над документами[51].
Преобразование PDF в офисные форматы, изображения и обратно; при работе со сканами используется OCR[52].
Формат предусматривает парольные уровни доступа, 128-/256-битное шифрование, цифровые подписи и функции удаления скрытых данных[53].
PDF является отраслевым стандартом допечатной подготовки, обеспечивая точное воспроизведение макета на любых печатных устройствах[54].
- сохранение оригинального макета и форматирования[55];
- кроссплатформенность и бесплатные средства просмотра;
- встроенные механизмы безопасности (пароль, шифрование, цифровая подпись)[56];
- компактный размер при использовании сжатия;
- поддержка мультимедиа, 3D-моделей и интерактивных форм;
- соответствие полиграфическим требованиям PDF/X.
- трудоёмкое редактирование без специализированного ПО[56];
- неудобство чтения на небольших экранах из-за фиксированного макета;
- ограниченная доступность при отсутствии тегов структуры[57];
- увеличение размера при встраивании изображений высокого разрешения;
- менее удобная совместная работа по сравнению с облачными форматами.
Сферы применения
- Бизнес и корпоративный документооборот — контракты, счета-фактуры, отчёты, маркетинговые каталоги[58].
- Государственный сектор — официальные формы, заявки, нормативные акты.
- Юриспруденция — судебные документы, соглашения с электронной подписью.
- Образование и наука — учебные материалы, статьи, интерактивные опросники.
- Издательское дело и полиграфия — предпечатные макеты в стандарте PDF/X.
- Инженерия и проектирование — техническая документация и 3D-PDF моделей.
- Здравоохранение — медицинские отчёты, рецепты, защищённые результаты анализов.
- Adobe Acrobat Reader DC — бесплатный просмотр, аннотирование, электронные подписи[59];
- Foxit Reader — легковесный просмотрщик с поддержкой форм;
- SumatraPDF — минималистичный открытый проект для Windows.
- Wondershare PDFelement, Master PDF Editor, PDF-XChange Editor — десктопные решения для правки текста, изображений и конвертации[59];
- Sejda PDF, iLovePDF, Smallpdf — онлайн-редакторы для объединения, разделения и сжатия файлов.
- виртуальные принтеры (CutePDF Writer, PDF24 Creator, PDFcreator) — вывод любого документа в PDF;
- встроенный экспорт в офисных пакетах (Microsoft Word, LibreOffice) и браузерах;
- облачные конвертеры HiPDF, PDF Candy для преобразования PDF в более 20 форматов[60].
- встроенные инструменты подписи и шифрования в Adobe Acrobat, Foxit PDF Editor, PDFelement[53];
- функции удаления метаданных и сокрытия конфиденциальных фрагментов перед публикацией.


