Введение

Использование текстовых редакторов в издательском процессе имеет как положительные, так и отрицательные стороны. Из положительных сторон можно отметить их доступность (текстовые редакторы есть практически на любом компьютере), простота использования, а также цена (заметно ниже платных продуктов для верстки).

Описанное в данной статье решение основано на использовании офисного пакета LibreOffice. Помимо таких очевидных преимуществ, как низкая стоимость и низкий порог вхождения, оно позволило решить ряд задач, решение которых было затруднено при использовании профессиональных программных продуктов (с закрытым кодом) для верстки.

Технология позволила получить различные виды печатных и электронных макетов всего из одного файла. Получаемые макеты, подходят не только для печати (и распространения) в формате PDF, но и для публикации в формате EPUB (с сохранением пагинации), соответствующей печатному макету. Кроме того, подобный подход также позволил получить макеты: в формате HTML (с сохранением пагинации), который был использован для публикации в электронной библиотеке, а также в формате RDF, пригодившийся при импорте публикаций в семантическое хранилище. Таким образом нет необходимости подготавливать разные макеты для целей печати и электронных книг, а также дорабатывать макеты для публикации в электронной библиотеке (Greenstone) или сематическом хранилище.

Использование открытого стандартизированного формата ODF сняло зависимость от закрытого программного обеспечения (InDesign), а значит от регулярных закупок новых версий данного ПО и сняло риски с архива изданий, с которыми стало работать значительно проще.

Вместе с тем, использование текстовых редакторов в издательском процессе давно пользуется «дурной славой». Это связано с ограниченным функционалом текстовых редакторов, а также их нестабильной работой, что в первую очередь относится к текстовому редактору MS Word. При этом исправление ошибок в его работе и расширение функционала невозможно из-за закрытого кода данного программного продукта.

Подготовка материалов

Чтобы работа над изданиями была максимально предсказуемой необходима предварительная обработка материалов. Желательно проведение подобной предварительной обработки на самой ранней стадии работы с авторскими материалами. Данная обработка может состоять из различных этапов, например:

  • Замены шрифтов на принятые в издательстве, замена нестандартных символов на стандартные символы Unicode.

  • Фильтрация форматирования по принципу белого списка. Удаление всего ручного форматирования, за исключением разрешенного для авторов. Примером разрешенного форматирования может служить выделение жирным, курсив, подчёркивание, верхний индекс, нижний индекс, разрядка.

  • Удаление скрытых ссылок и закладок в тексте

  • Исправление часто встречающихся ошибок набора

  • Удаление неиспользуемых стилей

  • Удаление ручных переносов страниц

  • Удаление макросов из авторских файлов

  • Удаление разрыва страницы в начале документа

  • Задание корректных стилей абзацев, принятых в издательстве, для упрощения дальнейшей верстки

Кроме представленной выше предварительной обработки желательно удостовериться, что больше в документе нет проблем и он может быть далее передан на верстку.

Для автоматизации и упрощения процедуры чистки мною было написано расширение для LibreOffice «Чистка и проверка».

Оно позволяет в автоматическом режиме произвести большинство необходимых исправлений в авторских документах по нажатию на кнопку «Чистка» и затем удостовериться в готовности документа к верстке по нажатию на кнопку «Проверка». Больше информации об этом расширении можно найти на странице расширения.

Вёрстка

Для реализации функциональности, отсутствующей в настоящее время в LibreOffice Writer, потребовалось написать дополнение ePublishing, которое в том числе содержит и функциональные возможности для сборки выпуска журнала из набора статей. Для этого требуется подготовить шаблон выпуска и сохранить его в папке со статьями. Файлы статей следует пронумеровать в соответствии с их планируемым расположением в журнале и собрать их в выпуск с помощью функции сборки статей в шаблон выпуска. Подробнее о возможностях и других функциях расширения ePublishing можно узнать на странице расширения.

Так как файл верстки может быть использован не только для печати, но и для распространения материалов в форматах EPUB и HTML, то в процессе верстки предпочтительно задавать относительную ширину для изображений и таблиц.

Предпубликационная проверка

Перед публикацией макет должен быть проверен для исключения как юридических  проблем, которые могут возникнуть с правами на компоненты издания, так и технических, связанных с множеством способов последующего использования макета. Для моих условий были подходящими проверки, описанные в данном документе.

Печать

Для печати макета на ризографах с использованием формата A3 нужно экспортировать полученный документ в формат PDF и затем воспользоваться программой спуска полос на А3.

Если требуется цветовая модель CMYK, что часто необходимо при офсетной печати, можно конвертировать документ с помощью данного скрипта, использующего pdftops и ghostscript, а также файл postscript для корректной конвертации чёрного цвета из RGB в CMYK.

В случае, если печать не предполагает цветных иллюстраций, то можно воспользоваться скриптом для конвертации в оттенки серого, который использует ghostscript.

HTML, EPUB и RDF

Получение гранок в формате HTML для публикации на сайте (например в системе OJS) или электронной библиотеке, а также распространения документа в формате EPUB, оптимизированном для чтения с помощью электронных книг или для экспорта публикации в формат семантических данных RDF производится с помощью конвертера, который я сделал на основе на проекта конвертера Writer2xhtml. Я реализовал разделение страниц при конвертации, экспорт в RDF и произвел ряд других доработок. Переработанная версия конвертера была названа Writer2phtml. Я очень благодарен Хенрику Джасту, автору Writer2xhtml. Если бы не его работа, которую он опубликовал под лицензией GPLv3, я возможно и не решился бы реализовать программное обеспечение для всего этого проекта.

Архивирование изданий

По окончании проверки документ сохраняется в архив, а значит переносы в нём должны быть сохранены именно в том виде, в котором он был подготовлен и принят для публикации. Для этого в дополнении ePublishing есть функция конвертации автоматических переносов в ручные, что позволяет убрать зависимость расстановки переносов в документе от видов и версий словарей переносов, которые были использованы при верстке. Качество словарей для переносов на русском, поставляемое с LibreOffice оказалось неудовлетворительным и поэтому мною было сделано дополнение со словарём, конвертированным из словаря переносов, который используется в системе верстки TEX.