Производительность GOSTGen
Производительность генерации выходного документа 1000 страниц в минуту получена для самой «медленной» SaaS установки GOSTGen в режиме Web-сервера. VPS будет быстрее, On-Premise — быстрее на порядок.
Метрика получена на реальных проектах в моменты одновременной работы 100-150 пользователей в Confluence (общий объем хранимой информации — около 1Тб), объеме глоссария около 200 терминов (умножим их на 6 падежей, и на единственное и множественное числа), объеме словаря аббревиатур около 450 шт., и для документа объемом чуть более 1000 страниц, формируемого из 5 статей Confluence с десятком-другим иллюстраций. VPS — еще быстрее. On-Premise — быстрее на порядок.
Максимальный объем документа, который на сегодняшний день был сформирован GOSTGen в режиме Web-сервера, это 19 585 страниц, собранных за 1135с из 218 страниц Confluence c 323 иллюстрациями. Т.е. та же ~1000 страниц в минуту, при том, что на выгрузку иллюстраций из Confluence ушло 238c, на выгрузку страниц — 257с.
Стандартные тарифные планы GOSTGen адаптированы к этой реальности.
Что определяет производительность GOSTGen? Это несколько независимых факторов, которые зависят от условий применения системы:
- Скорость выдачи страниц Confluence по REST API. Чем больше активных пользователей сейчас работают в Сonfluence, чем больше общий объем информации в нем, чем больше по объему статья, чем больше в статье использовано макросов, тем больше времени требуется Confluence для преобразования статьи в HTML из внутреннего формата хранения и ее выдачи пользователю. Среднее время отклика «большого» Confluence по REST API может составлять несколько секунд. Если вы формируете выходной документ из десятка статей, то лишь одна выгрузка информации из Confluence потребует заметного времени;
- Объем и количество рисунков, включенных в документ;
- Объем глоссария, т.е. количество слов и словосочетаний во всех заданных склонениях единственного и множественного числа, поиск которых проводится в тексте документа для составления разделов «Термины и определения»;
- «Чистота» форматирования статьи Confluence. Вставка во встроенный редактор статей Confluence текста из LibreOffice Writer или MS Word на экране может выглядеть вполне пристойно, но внутри содержать огромное количество «мусорной» информации, на избавление от которой GOSTGen вынужден тратить драгоценные секунды времени работы технического писателя.
Чтобы максимально сократить время формирования выходного документа, GOSTGen кэширует все, что только возможно — и каскады словарей глоссария и аббревиатур, и страницы, и базовые шаблоны, и рисунки, и форматирование предыдущих версий документа, обновляя кэш по мере изменения этой информации в Confluence. Естественно, кэширование может быть отключено в целях безопасности, но тогда придется пожертвовать десятком-других секунд быстродействия системы при подготовке каждого документа.