PDF (Portable Document Format) был создан с целью защиты распространения данных. Тип данных используемых в PDF-файлах, различается и содержит текст, изображения, таблицы, ссылки и другие ресурсы.
PDF стал одним из самых популярных форматов файлов, и переводческие агентства ежедневно получают запросы на перевод PDF-файлов. Тем не менее, перевод
PDF не так прост, как документ Word, просто потому, что PDF был разработан в основном для распространения контента, а не для редактирования. Объем работы по верстке, необходимой для каждого документа, зависит от множества факторов.
Отсканированный PDF
Отсканированные PDF-файлы нельзя редактировать, поскольку они являются изображениями. Для конвертации документа в редактируемый вид приходится использовать программное обеспечение OCR (оптическое
распознавание символов), которое может преобразовывать отсканированную информацию в редактируемый текст.
Преобразованные документы часто не совпадают с оригиналом и приходится вручную исправлять форматирование, переносить иллюстрации, править границы таблиц, текстовые блоки, удалять лишние символы, повторяющиеся пробелы и решать другие проблемы.
Текстовой файл PDF
В случае, когда PDF-документ был создан на основе цифрового источника, можно легко извлечь текст, поэтому нет необходимости в дополнительном преобразовании и конвертации. Следует иметь ввиду, что при копировании текста из PDF в Word также могут возникнуть проблемы с форматированием.
Корректировки после перевода
После завершения перевода следует еще один этап работы над версткой. Одной из наиболее типичных проблем, с которыми нам приходится сталкиваться после перевода, является расширение текста (увеличение) или уменьшение общего количества символов при переводе, и влияние, которое это оказывает на строки, абзацы,
форматирование и т. д. Если PDF-файл содержит
текст с изображениями, форматирования документа требует усилий верстальщиков и редакторов, особенно если есть изображения со встроенным текстом.
См. также:
Подробнее о подготовке PDF-файлов и макетов к редактированию и корректуре
Переконвертация PDF-документа в редактируемый формат с целью подготовки к переводу