Важным требованием при экспорте научных книг и статей в HTML и Epub является сохранение пагинации (разбиение документа на страницы). Это требование обусловлено необходимостью сохранить для читателя возможность цитирования документа в производной научной работе.

К сожалению, ни один из из найденных мной способов конвертации в html в 2016 году не позволял сохранить пагинацию и содержимое колонитулов документа. Решив сделать такой конвертер, я взял за основу дополнение к LibreOffice под названием Writer2Latex. Это очень хороший конвертер, написанный на Java и распростраяемый по лицензии GPLv2, но не предусматриваниющий сохранение пагинации при экспорте в HTML и EPub.

На текущий момент получившийся конвертер успешно сохраняет пагинацию при экспорте, а также добавляет специальные комментарии для использования данного HTML в электронной библиотеке Greenstone 3. При экспорте каждая страница сохраняется внутри div с классом pageNum и аттрибутом page равым номеру страницы.

Исходный код и готовые к использованию сборки доработанного дополнения https://github.com/litvinovg/writer2latex