Автор: Serge Osnach, <ench@intelserv.kiev.ua>
Киев, Украина, 25 мая 2002 года в 13:24:42
В ответ на : Re: PPMonstr I от Maxim Smirnov
в 25 мая 2002 года в 10:22:02:
> Предлагаю перенести разговор в > фидошную эху ru.compress > Форум не особо удобен как средство > общения. Перенес и туда. :)> > > Возникла мысль - завести еще > контексты, где хранить инфу в > духе "средняя вероятность того, что в > произвольном контексте после символа А > будет символ Б - 12/39 ..." и > заниматься RS скажем для первых 3-х > наиболее вероятных символов. Первые > прикидки (с априорными формулами) > показали ограниченную полезность такого > подхода. Стабильно как минимум 0.05% > выиграша. > Я пробовал, мне не понравилось. > Неэффективно. Затрачиваемое время > лучше пустить на что-нибудь другое. > Скажем, на взвешивание. Элементы CTW? Особенно мне понравилось взвешивание разных контекстов в сочетании с LOE. > > Да, обьясни магию чисел - в > маскированных контекстах увеличиваю > частоту на 1/4 для всех символов, > которые (Symbol XOR Recent) > И что? :-) > Лучше сжимается? > Надо анализировать структуру файла, > это же алфавитом определяется. В том-то и магия, что я не нашел _реального_ файла, где такой подход ухудшает сжатие :) > [escape] > > > > Хорошо. А как ведет себя размер оставшейся части? :-) > > > А куда ж ему деваться? Уменьшается, естественно. > Надо смотреть алгоритм, схоластика > здесь непродуктивна.
> > > > SEE. Насколько я помню, в моем > PPMN > > > > это компенсируется, но не всегда. > > Не знаю, я к SEE прикрутил > дополнительный балансировщик с целью > улучшить адаптацию SEE на бинарниках, > так что если я и приведу числа, у тебя > все может быть совсем иначе > Логично. С балансировщиком одна проблема - из-за его "шатаний" сжатие на однородных файлах (такстах) чуть-чуть, но ухудшается. Есть идеи по подавлению шатаний?
|