Re: Про bzip2


Сайт о сжатии >> Форум #Компрессор# >> [Ответить] [Ответы]

Автор: Vadim,
23 апреля 2003 года в 17:43:22

В ответ на : Re: Про bzip2 от Serge Osnach в 23 апреля 2003 года в 11:48:48:


> > > Кстати, потребление памяти вполне можно сократить примерно втрое на реальных данных, не особо и теряя в скорости.

> > Надеюсь, это не банальное сокращение за счет размерности указателей на данных длиной до 256 байт? ;-) Понятное дело, на некоторых данных типа текстов можно обойтись без т.н. "квадрантов" - но это копеечная экономия, не втрое.

> > (Между прочим, что ты имеешь в виду под реальными данными?)

> Содержимое архивов на некоем компе/сервере. Замечу, именно архивов.

Содержимое содержимому рознь. Где-то больше мультимедийных данных, где-то текстовых (да-да!), где-то превалируют базы данных и т.п. На всех сразу все равно не угодишь.

> > Если нет - то какой способ сокращения расходов памяти ты имеешь в виду? Если не секрет, конечно :)

> Сортировать блок по частям.

> Например, сначала сортировать символы, у которых предыдущий, например, в интервале 0x00-0x40, потом -- с предудыщим символом в интервале 0x40-0x80...

Расходы памяти это, действительно, уменьшит. Но вот насчет скорости ты ошибаешься - она упадет заметно. Т.к. самый большой прирост производительности у современных БВТ-пакеров происходит именно от использования результатов сортировки предыдущих блоков, читай, от уже упорядоченных указателей. На которых ты и предлагаешь съкономить.

> > Кто-то же пишет BWT-компрессоры ;-) А новых LZ-пакеров, наоборот, что-то мало появляется. Кроме Игоря, никто LZ фактически не продвигает...

> Вероятно, так происходит потому, что достаточно легко, используя BWT добиться результата, превосходящего Zip. А вот с LZ для того, чтобы обойти Zip, уже прийдется повозиться.

Это плохо, что легко добиться? ;-)

> И потом, BWT -- хорошая тема для статьи или дисертации :)

Я уж промолчу про PPM в этом аспекте ;-)

> > Что касается, преимуществ одних методов перед другими - ты же знаешь, на эту можно много говорить... Да, собственно, уже все сказано. Или у тебя есть новая информация? ;-)

> Для массового применения BWT, к сожалению, не прижился (BZIP2 -- единственное исключение),

Ничего себе, "не прижился". Всем бы так "не прижиться" :)))
Может быть, ты видишь подобные исключения по "приживанию" из лагеря PPM? ;-)

> обогнать лучшие PPM и CM ему не светит, для специализированных компрессоров LZ подходит куда больше, чем BWT по причине больших возможностей подгонки модели.

Уж если на то пошло, то всех по скорости обгоняет шибко специализированная команда "copy" ;-) Я, конечно, понимаю, что все PPM-писатели под словом "обогнать" имеют в виду "сильнее сжать". Но надо шире смотреть на вещи ;-)))

> > Каждый метод хорош по-своему. Кстати, BWT-пакеры лучше всех, как выяснилось, жмут геодезические данные (файл geo - не показатель, у меня есть реальные современные данные).
> Где можно найти образец подобных данных?

У меня есть немного. Прислать?

Ответы:



Ответить на это сообщение

Тема:

Имя (желательно полное):

E-Mail:

URL:

Город:

Страна:

Вежливый и подробный комментарий:
(Форматируйте его, пожалуйста, как почту - короткими строками
Еnter в конце строки, пустая строка между параграфами).

Пожалуйста, заполните все поля.
И не нажимайте по два раза на кнопку! Дождитесь ответа сервера.