Re: Избыточность сжатых файлов
Сайт о сжатии >> Форум #Компрессор# >> [Ответить] [Ответы]
Автор: Maxim Smirnov, <msmirn@newmail.ru>
SPb, 04 ноября 2002 года в 12:47:52
В ответ на : Избыточность сжатых файлов от Сергей
в 04 ноября 2002 года в 09:07:07:
> Подскажите, пожалуйста, где можно нарыть инфу по избыточности файлов, сжатых разными методами.> Заранее благодарен. Я что-то такое видел, но, помнится, классифицировал для себя как "бред сивой кобылы".
Можно делать простые энтропийные оценки для условных частот символов файлов. Достаточно, думаю, ограничиться условными частотами в зависимости от одного последнего символа. H = -sum f(si|sj)/F * lg2 (f(si|sj)/F)) для всех i, j f(si|sj) -- частота появления символа si после sj F -- общее кол-во символов в файле. Либо сжимать оные файлы арифметиком с order-1 моделью. Целесообразнее оценивать избыточность как отношение размера сжатого файла к размеру самого маленького сжатого файла из имеющихся.
|