В заключение отметим, что ротация лог-файлов, т.е. генерация нескольких журналов системных событий вместо одного огромного лога, не уменьшает общий размер журналов. Поэтому полезно включить сжатие лог-файлов, настроив конфигурацию сервера истории spark.history.fs.eventLog.rolling.maxFilesToRetain. При этом стоит помнить, что сжатие — это операция с потерями данных. Оно отбросит некоторые события, которые больше не будут видны в пользовательском интерфейсе. Например, если приложение имеет 5 лог-файлов и конфигурации spark.history.fs.eventLog.rolling.maxFilesToRetain установлено значение 2, то для сжатия будут выбраны первые 3 файла журнала. Именно они будут перезаписаны в один компактный файл с отбрасыванием устаревших событий, которые решено исключить: