Re: еще дополнение о суперкомпрессии
Автор: Serge Osnach, <ench@netcity.ru> Kiev, Ukraine, 25 ноября 2002 года в 18:24:23 В ответ на : Re: еще дополнение о суперкомпрессии от Алексей в 25 ноября 2002 года в 17:53:22: > > > > Пусть мы распаковываем некие случайные данные неким достаточно слабым биективным компрессором C. > > Посмотри на > thanks ;) > > > Естественно, если это компрессор того же типа как PPM, - для него все так и будет, в этом я не сомневаюсь. Но если это будет компрессор типа MMP order-1/3, Escape method зю, который будет рассматривать этот символ не только в детерминированном контексте, где некий символ встречался 4 раза, но и еще в других контекстах, (а не только по пред. совпадениям) скорректирует свой результат, например в сторону вероятности 9/10, и в итоге окажеться прав. > > Пусть у нас есть некая случайная величина, принимающая значение "1" с вероятностью 4/5 и "0" с вероятностью 1/5. Тогда средняя длина кода, которая потребуется для того, чтобы ее закодировать, зная эту вероятность, будет 4/5*(-log2(4/5))+1/5*(-log2(1/5)) ~= 4/5* 0.322 + 1/5*2.322 ~= 0.7219 бит. > Почему кодировать надо сразу на основании вероятности... непонятно. Какими бы ты кодами ни пользовался, ты всегда неявно присваиваешь некоему кодируемому символу или строке определенную вероятность появления в данном месте. > 123123123123123123123 - вероятность появления каждого символа одинакова, и какова здесь длина кода? > 111222333111222333 - здесь использовать другой алгоритм :) > > Если мы оценим эту вероятность в 9/10, > > Так в данном случае такой MMP-компрессор будет кодировать хуже, чем C. > Не в данном случае, а в среднем. А в данном вполне вероятно что лучше. Естественно, _некоторые_ исходые файлы после такого преобразования уменьшатся. > > > Рассмотрим 100 символов например в системе с основанием 4. (т.е. 400 бит). Переведем их в систему с основанием 13 так: берем 11 симв.(44 бита) и записываем как 6 симв. (44 бита) в системе с основанием 13. (получим теже 400 бит или 401 (: ) Сжимаем их в новой системе, и преобразуем обратно, но уже 7 симв. из сист с основанием 13 в 13 симв. с основанием 4. Или проще: 32012020130230123010 -=> AAAABBB333 -=> жмем в A(4)B(3)3(3) -=> > > Замечательный пример суперсжатия -- из 11 символов получили 13! ;-) > Это шутка, или действительно не все понятно в этом примере? ;( > > А что будем делать, если совпадений будет достаточно мало, и их будет невыгодно кодировать? > так систем счисления ой как много, причем можно и не через одну пропускать, только бы ресурсов хватило... Тогда тебе прийдется отдельно писать в архив используемую систему счисления... > А ведь таких случаев будет подавляющее большинство... Повторяю доказательство в несколько ином виде: Пусть у нас есть компрессор, позволяющий сжимать и распаковывать без потерь :) произвольные файлы длиной не более N. Мы пришли к противоречию, которое показывает, что по крайней мере одно из исходных утверждений неверно. Следовательно, либо произвольный компрессор сжимает хоть на один бит менне половины исходных файлов длины не более, чем N, либо он не сможет распаковать некоторые файлы без потерь. Замечу, что и рекурсивные схемы сжатия также попадают под это доказательство. Если ты принципиально согласен с этим доказательством, то тема исчерпана. > > > P.S.: А не подскажут ли мне добрые люди, куда бежать в том случае, если я вдруг обнаружу формулу, вокруг которой ведутся все эти дискуссии? (на всякий случай ;D )
|
Ответы:
- Re: еще дополнение о суперкомпрессии Алексей 16:18:59 26/11/2002
(4)
- Re: еще дополнение о суперкомпрессии Serge Osnach 19:43:25 26/11/2002
(3)
- Re: еще дополнение о суперкомпрессии Алексей 14:46:00 27/11/2002
(2)
- Re: еще дополнение о суперкомпрессии Serge Osnach 18:05:58 27/11/2002
(1)
- Re: еще дополнение о суперкомпрессии Алексей 13:23:01 28/11/2002
(0)
- Re: еще дополнение о суперкомпрессии Алексей 13:23:01 28/11/2002
(0)
- Re: еще дополнение о суперкомпрессии Serge Osnach 18:05:58 27/11/2002
(1)
- Re: еще дополнение о суперкомпрессии Алексей 14:46:00 27/11/2002
(2)
- Re: еще дополнение о суперкомпрессии Serge Osnach 19:43:25 26/11/2002
(3)
- Re: еще дополнение о суперкомпрессии Maxim Smirnov 18:50:34 25/11/2002
(2)
- Re: еще дополнение о суперкомпрессии Serge Osnach 19:01:26 25/11/2002
(1)
- Re: еще дополнение о суперкомпрессии Алексей 16:32:10 26/11/2002
(0)
- Re: еще дополнение о суперкомпрессии Алексей 16:32:10 26/11/2002
(0)
- Re: еще дополнение о суперкомпрессии Serge Osnach 19:01:26 25/11/2002
(1)
Ответить на это сообщение