Автор: Shelwien,
30 августа 2003 года в 13:56:49
В ответ на : полный pm от Олег Набатов
в 30 августа 2003 года в 12:45:50:
>Кто-нибудь думал положить >огромную ppm-модель в >получаемый архив? Наверно, все думали ;) Однако проблема та же, что, в конечном итоге, и с любыми другими трансформированными данными - бывает сложно исключить избыточность (чтобы набор преобразованных данных однозначно соответствовал исходным), а с адаптивностью вообще все плохо. > Для небольших >префиксов вполне реально. >Например полная модель 3-битных >префиксов это всего лишь 8 бит, т.к. >сами тройки хранить не нужно, только >бит результата. > Т.е. есть адаптивный, статический, а >это статический-полный, хотя потом >можно начать его адаптировать. > Сделал программку, проверяет все 256 >8-битных моделей и выбирает лучшую. > Возможное сжатие получается ~80% от >исходных данных, если брать их из >random с нормальным распределением, но >блоки надо брать ~50бит, на больших >все усредняется. > http://olegnabatov.narod.ru/fpm8.gif 1. Посмотри CM Булата Зиганшина. 2. Попробуй сделать "модель" шкаринским ppmtrain и научись ее правильно сжимать 3. Любую модель, которую ты сочинишь для статистики, можно будет переформулировать в терминах исходных данных и получить, в итоге, лучшие результаты. Счастливо! - Шелвин
|