Re: еще дополнение о суперкомпрессии
Автор: Алексей, Россия, 26 ноября 2002 года в 16:18:59 В ответ на : Re: еще дополнение о суперкомпрессии от Serge Osnach в 25 ноября 2002 года в 18:24:23: > > > Пусть у нас есть некая случайная величина, принимающая значение "1" с вероятностью 4/5 и "0" с вероятностью 1/5. Тогда средняя длина кода, которая потребуется для того, чтобы ее закодировать, зная эту вероятность, будет 4/5*(-log2(4/5))+1/5*(-log2(1/5)) ~= 4/5* 0.322 + 1/5*2.322 ~= 0.7219 бит. > > > Именно такой будет средняя длина кода в дет. контексте у C. > > Почему кодировать надо сразу на основании вероятности... непонятно. > Какими бы ты кодами ни пользовался, ты всегда неявно присваиваешь некоему кодируемому символу или строке определенную вероятность появления в данном месте. вот именно, если наш декодер выводил вероятность появления 1 (или к) символа, > > 123123123123123123123 - вероятность появления каждого символа одинакова, и какова здесь длина кода? > > 111222333111222333 - здесь использовать другой алгоритм :) так это и ясно, только другой пак сделает это лучше. > > > Если мы оценим эту вероятность в 9/10, > > > Так в данном случае такой MMP-компрессор будет кодировать хуже, чем C. > > Не в данном случае, а в среднем. А в данном вполне вероятно что лучше. > Естественно, _некоторые_ исходые файлы после такого преобразования уменьшатся. может стоит заменить _некоторые_ на _многие_, в конце концов все зависит от алгоритма. > > > > Рассмотрим 100 символов например в системе с основанием 4. (т.е. 400 бит). Переведем их в систему с основанием 13 так: берем 11 симв.(44 бита) и записываем как 6 симв. (44 бита) в системе с основанием 13. (получим теже 400 бит или 401 (: ) Сжимаем их в новой системе, и преобразуем обратно, но уже 7 симв. из сист с основанием 13 в 13 симв. с основанием 4. Или проще: 32012020130230123010 -=> AAAABBB333 -=> жмем в A(4)B(3)3(3) -=> > > > Замечательный пример суперсжатия -- из 11 символов получили 13! ;-) > > Это шутка, или действительно не все понятно в этом примере? ;( > > > А что будем делать, если совпадений будет достаточно мало, и их будет невыгодно кодировать? А если их будет предостаточно... > > так систем счисления ой как много, причем можно и не через одну пропускать, только бы ресурсов хватило... > Тогда тебе прийдется отдельно писать в архив используемую систему счисления... вот уж проблемо-та - по 30 бит на систему, коих и будет-то может не более 3-х. Только перебрать ~2^30 (или 2^90)систем и для каждой попробовать сжать - вот проблема. > > А ведь таких случаев будет подавляющее большинство... > Повторяю доказательство в несколько ином виде: > Пусть у нас есть компрессор, позволяющий сжимать и распаковывать без потерь :) произвольные файлы длиной не более N. эти два исходных файла будут соответствовать одному архиву. Теперь положим, что один из этих файлов является полностью состоящим из нулей. А зачем его вообще сжимать? (а если добавить и одни единицы, получается что один число-архив еще и не используеться!) > Мы пришли к противоречию, которое показывает, что по крайней мере одно из исходных утверждений неверно. Следовательно, либо произвольный компрессор сжимает хоть на один бит менне половины исходных файлов длины не более, чем N, либо он не сможет распаковать некоторые файлы без потерь. > Замечу, что и рекурсивные схемы сжатия также попадают под это доказательство. > Если ты принципиально согласен с этим доказательством, то тема исчерпана. Как же тут можно согласиться. > Сразу замечу, что рекурсивное применение такого подхода не будет возможно, поскольку ты собираешься отображать множество "архивов" на множество всех файлов. Кто-то что-то хотел сделать "для поднятия траффика", а тут и так он уже зашкаливает! ;) |
Ответы:
- Re: еще дополнение о суперкомпрессии Serge Osnach 19:43:25 26/11/2002
(3)
- Re: еще дополнение о суперкомпрессии Алексей 14:46:00 27/11/2002
(2)
- Re: еще дополнение о суперкомпрессии Serge Osnach 18:05:58 27/11/2002
(1)
- Re: еще дополнение о суперкомпрессии Алексей 13:23:01 28/11/2002
(0)
- Re: еще дополнение о суперкомпрессии Алексей 13:23:01 28/11/2002
(0)
- Re: еще дополнение о суперкомпрессии Serge Osnach 18:05:58 27/11/2002
(1)
- Re: еще дополнение о суперкомпрессии Алексей 14:46:00 27/11/2002
(2)
Ответить на это сообщение