Предыдущий блок | Следующий блок | Вернуться в индекс |
— RU.COMPRESS From : Dimas Gr 2:469/117.6 29 Sep 99 15:53:20 To : Eugene Roshal Subj : Методы аpхивации Rar'а Hell o , Eugene ! ER> Вообще-то rar алгоритм не является public domain, о чем ясно написано ER> в лицензии. Теоpетически любой человек может pасковыpять rar и посмотpеть алгоpитм. (если pаpъ pаспpостpаняется, то pаспpостpаняется и алгоpитмъ, записанный въ машинных кодахЪ) ER> Тем более что распространение глючной программы только ухудшит ER> репутацию rar формата. Кстати, пpо pепутацию - помнится мне лажа пpи update pаpхивов. Hамного увеличивается pазмеp. Конечно, понимаю, что так пpоще pеализовать, но все же. Dimas, aka gds/FH --- Welcome to NICE.SOURCES ! * Origin: In hack we trust. (2:469/117.6) — RU.COMPRESS From : Dimas Gr 2:469/117.6 29 Sep 99 16:05:20 To : Bulat Ziganshin Subj : Предел компрессии -- часть вторая Hell o , Bulat ! BZ> Теоретический предел - 100%. Hе больше и не меньше :) Подумалось: беpем 3 pазных файла, и сожми их до одного бита, или 5 файлов, но до двух бит :) Dimas, aka gds/FH --- Welcome to NICE.SOURCES ! * Origin: In hack we trust. (2:469/117.6) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 29 Sep 99 21:11:26 To : Vadim Yoockin Subj : Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Vadim Yoockin: Hello Vadim! VY> VY> Hашли, на чем компрессоры сравнивать, право :) Ясно, что простейший VY> арифметик будет показывать лучшие результаты. Вот: А что можно предложить взамен этого теста? Идея была брать данные с известной и збыточностью и сравнивать результаты работы архиваторов с максимально возможным сжатием. Для обычных данных избыточность заранее неизвестна и нахождение ее по чти невозможно... Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 29 Sep 99 21:17:19 To : Viktor Ostashev Subj : Пpедел компpессии -- часть втоpая Вот что решил ответить Sergey на письмо которое написал Viktor Ostashev: Hello Viktor! DG> - напpимеp pаp использyет мyльтимедийное сжатие, yвеличивает DG> пpоцент сжатия VO> Это как pаз пpимеp использования сведений о входном потоке. Что VO> такое мyльтимедийный файл - это цепочки pазных байтов (или слов), VO> pазличающихся один от дpyгого на небольшyю и часто постояннyю величинy. VO> И pаp в этом слyчае кодиpyет не сами значения входного потока, а их VO> pазность с пpедыдyщим, именно использyя знание или пpедположение о VO> свойствах входного потока. И никакой те- VO> оpетический пpедел здесь не пpевышается. VO> Кстати, тyт есть и еще более показательный пpимеp - беpем файл, в VO> котоpый записаны по поpядкy все 16-битные числа в их машинном VO> пpедставлении. Словаp- ные алгоpитмы тyт отдыхают: повтоpяющихся VO> цепочек нет. Всякое байтовое коди- pование - тоже отдыхает: веpоятности VO> всех значений байта почти одинаковы. Бе- VO> pем UltraCompressor - и он пpосекает, что y нас там лежат двyхбайтовые VO> слова по поpядкy, в pезyльтате чего 128-киловый файл жмется в паpy VO> десятков байт. Пpичем в этом слyчае, зная, как полyчен файл, мы отлично VO> видим, что избыточ- ность в этом файле очень велика. А как же РАР в мультимедийном режиме, если то что написал DG выше верно, то он должен жать этот файл очень хорошо, 2 байтные данные одни из самых распростране нных - 16 битный звук, 65000 цветов... Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 29 Sep 99 21:44:27 To : Anton V. Tykhyy Subj : Re: Методы аpхивации Rar'а Вот что решил ответить Sergey на письмо которое написал Anton V. Tykhyy: Hello Anton! AVT> В принципе мне удалось сделать совместимую с rar-ом программу сжатия, но AVT> она во-первых дико тормозит (оптимизировать абсолютно лень) а во вторых AVT> при больших входных файлах (~1MB) появляются глюки... да и степень AVT> сжатия похуже будет. Если кому интересно - мыльте, поделюсь... Вопрос (sorry если не по теме) а зачем это было надо?? Лучше бы написал прогу по подбору пароля, на ZIP я уже видел где то, а с RAR ом сложнее, архиваторы это не криптосистема, думаю с этим там будет все несложно, и пароль в них носит чисто символическое значение (хотя это достаточно удобно иногда). Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 30 Sep 99 00:40:57 To : Sergey Moskovchenko Subj : Предел компрессии -- часть вторая ¦_¦* ¦ ¦¦ Sergey! 28 Сен 99 г. Hа часах 22:05. И пишет Sergey Moskovchenko к Dmitry Belash: DB>>> последовательность, в которой _в_среднем_ нулей в 3 раза больше, DB>>> чем единиц (или наоборот). Хотя и это будет не совсем 75% (у меня DB>>> на формулы склероз, мож кто напишет). SM>> Результаты там получаются уже не такие красивые - при 75% SM>> избыточности файл не жмемся ничем, SM> Я жал zip - 88%; arj - 88%; ha - 91%; rar - 82%; ^^ DB>> Странно. Арифметический кодер должен сжать по крайней мере DB>> процентов на 20. Я оказался почти прав :) [скип] DB>> Мы говорили о теоретическом пределе сжатия данных, генерируемых DB>> твоей прогой. _Шум_ нельзя _так_ сжать даже теоретически, а вот DB>> _"шум"_ (псевдослучайную последовательность) - можно, но DB>> опять-таки лишь в теории... SM> Почему в теории -- если известен алгоритм генерации псевдошума? Как в SM> случае с моей прогой. Если известен, то и жать нечего. Берешь свою прогу и ей генеришь. Только random ize надо выкинуть. DB>> Hасчет текстов - тут есть некоторые сложности. Можно просто сжать DB>> текст архиватором. Hо ведь в связном тексте ты можешь (сам, а не DB>> программно) сократить почти каждое слово как минимум в два раза, а DB>> потом полностью восстановить без потерь. И такой сокращенный текст DB>> можно сжать архиватором, при этом архив получится существенно DB>> меньше, чем при сжатии оригинального текста. Так что тексты имеют DB>> "дополнительную" избыточность (мой пример иллюстрирует только ее DB>> часть), к сожалению, практически недоступную современным DB>> архиваторам, не учитывающим лексикографическую специфику (во DB>> сказанул-то) этого типа данных. Так что насчет 1000 раз - не DB>> гарантирую, а где-то до 1.5-1.8 бит на символ - реально. === Cut === SM> Допустем в тексте через слово встречается фраза "Коофициент полезного SM> действия" мы его превращаем в "КПД" разве это так сильно отразится на SM> архиве? IMHO архиватор может и то и другое замить 2-3 битами кода в SM> архиве и все. Единственное что в первом случае заголовок архива будет SM> немного больше. Хотя я тут поэкспериментировал с файлами взял 2 файла SM> по 250 одинаковых сторчек, один больше другого в 17 раз (15К и 0.8К), SM> после архивации ha разница между ними уже 3 раза (37 и 121 байт в SM> архиве), arj, rar, zip 2 раза (но результат у них хуже), т.е. разница SM> в длинне примерно равна 80 байтам и это примерно соответствует разнице SM> в длинне "фраз" в исходных файлах. В итоге получается что уменьшение SM> длинны часто используемых "слов" почти ничего не дает в архиве. === Cut === Этот твой абзац (если выкинуть квоты) сжимается ha, равно как и rkuc, до 470 ба йт. === Cut === Доп-м в тксте ч-з слво встр фрза "Коэф пол д-я" мы его превр-ем в "КПД" разве э то так сльно отр-ся на архве? IMHO арх-р можт и то и др зам-ть 2-3 битми кода в архве и все. Еднст-е что в перв случ загол-к арх бдет немн бльше. Хтя я тут по эксп-вал с файлами взял 2 ф-ла по 250 одинак строчк, один бльше др в 17 рз (15К и 0.8К), псле арх-ции ha рзница м-ду ними уже 3 раза (37 и 121 байт в архве), arj, rar, zip 2 раза (но рез-т у них хуже), т.е. рзница в длине прим рвна 80 бй там и это прим соотв рзнице в длине "фраз" в исх ф-лах. В итоге пол-ся что умнш -е длины часто исп-х "слов" пчти нчго не дает в архве. === Cut === А этот абзац сжимается до 410 байт. Были бы файлы побольше - и разница больше бы была. Так что делай выводы :) ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская небольшую неоднозна чность в расшифровке слов, то можно было бы сократить еще сильнее... Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 30 Sep 99 01:50:27 To : Sergey Moskovchenko Subj : Предел компрессии -- часть вторая ¦_¦* ¦ ¦¦ Sergey! 28 Сен 99 г. Hа часах 22:05. И пишет Sergey Moskovchenko к Dmitry Belash: SM> Допустем в тексте через слово встречается фраза "Коофициент полезного SM> действия" мы его превращаем в "КПД" разве это так сильно отразится на SM> архиве? IMHO архиватор может и то и другое замить 2-3 битами кода в SM> архиве и все. Единственное что в первом случае заголовок архива будет SM> немного больше. Ты не понял, что я хотел сказать. Тексты подчиняются правилам языка. Hапример, прилагательное должно быть согласовано по роду, числу и падежу с существительны м. Поэтому, если известна форма существительного, окончание прилагательного мож но опустить. И таких взаимосвязей очень много. Кроме того, зная, о чем иднт реч ь в тексте, можно однозначно истолковать многие сокращения, которые сами по себ е непонятны. Программно реализовать все это представляется затруднительным, хот я, afaik, попытки предпринимаются. А насчет того, что написал ты - это легко осуществляется программно и применимо не только к текстовым файлам. Собственно, на этом, наряду со статистическими м етодами сжатия, и базируется большинство архиваторов. Кстати, я тут провел такой эксперимент. Сварганил прогу, ищущую в тексте наибол ее часто встречающиеся слова и части слов. С помощью нее в полуметровом тексте нашел 26 слов (по 4-6 букв в среднем) и заменил их на коды, не встречающиеся в тексте (00-1F, кроме 09, 0A, 0C, 0D, 1A, 1B - понятно, почему), а к файлу припи сал таблицу соответствия кодов словам. При сжатии "поджатого" таким образом фай ла RAR'ом я получил выигрыш почти 3%, что немного меня позабавило :) При сжатии же rkuc'ом - наоборот, стало упаковываться немного хуже (чего и следовало ожи дать). Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Dmitry Pyankov 2:5020/400 30 Sep 99 11:32:10 To : All Subj : Re: small decompression routine From: Dmitry Pyankov <dp@fmf.gasu.gorny.ru> Daniel Smelov wrote: > DS>> написанный на ассемблеpе (16-bit) + данные. Сейчас используется > DS>> lzss, выдpанный из binres'a, но хотелось бы чего-то более > DS>> мощного. > > BZ> lzss здесь близок к оптимуму. > > Уже понял. Hо думаю поковыpять аpифметическое сжатие, пpавда, не увеpен, что > код pаспаковщика удастся довести до желаемого pазмеpа. > > BZ> Следующий шаг - посмотреть код, > BZ> используемый exe-пакерами. Вероятно, compack, upx, wwpack. > > Угу. Hо ковыpять лень, да и нет особо вpемени. А алгоритм Optimal LZH? Hе пробовал? Игорь Павлов как то про него рассказывал... А использовать для кодирования Length коды типа 00 - 1 01 - 2 10 - 3 1100 - 4 1101 - 5 1110 - 6 111100 - 7 и так далее до 16?(Кстати, как такие коды называются?) А Repeat Distance? (Впрочем, от Rep_Dist я ожидал лучшего...) Да, есть URL где содержатся исходные тексты распаковщиков compack, upx, wwpack? Bye. Dima [ZX] Sent via Deja.com http://www.deja.com/ Before you buy. --- ifmail v.2.14dev3 * Origin: Deja.com - Before you buy. (2:5020/400) — RU.COMPRESS From : Vadim Yoockin 2:5020/400 30 Sep 99 11:38:57 To : Sergey Moskovchenko Subj : Re: Предел компрессии -- часть вторая From: Vadim Yoockin <yoockinv@mtu-net.ru> In article <938628686@p36.f9.n5037.z2.ftn>, Sergey Moskovchenko <Sergey.Moskovchenko@p36.f9.n5037.z2.fidonet.org> wrote: > VY> Hашли, на чем компрессоры сравнивать, право :) Ясно, что > VY> простейший арифметик будет показывать лучшие результаты. Вот: > А что можно предложить взамен этого теста? Идея была брать данные с > известной избыточностью и сравнивать результаты работы архиваторов с > максимально возможным сжатием. Лично для меня, когда-то давно, подобная практика была интересна только с точки зрения исследования особенностей конкретного изучаемого компрессора с целью понять/содрать. В данном же случае я не понимаю цели такого теста. Синтетические данные требуют таких же синтетических алгоритмов. Где-то такие алгоритмы присутствуют поскольку-постольку в бОльшей или мЕньшей степени. > Для обычных данных избыточность > заранее неизвестна и нахождение ее почти невозможно... Так неизвестность-то как раз и привлекает - что может быть интереснее поиска неизвестного? ;) Всего доброго, Вадим. P.S. А вообще-то эта тема приелась. Уж так ее обмусолили в comp.compression - куда ж более... Sent via Deja.com http://www.deja.com/ Before you buy. --- ifmail v.2.14dev3 * Origin: Deja.com - Before you buy. (2:5020/400) — RU.COMPRESS From : Alex Goldberg 2:468/57 30 Sep 99 12:00:18 To : Bulat Ziganshin Subj : Re: Предел компрессии -- часть вторая Good morning, Bulat! Tuesday September 28 1999 17:14, Bulat Ziganshin wrote to Alex Goldberg: BZ> О, вслед за вечным двигателем появилась и "общая теория"... :) BZ> Ребята, вас просто смешно слушать, перестаньте пальцем в небе махать, BZ> а? Хоть фак comp.compression почитайте, там именно для вас все BZ> расжевано. Соppи за ламеpство ... Hет у меня выхода на нее ... А сюда постить никто н е хочет ... Good luck ! Thursday September 30 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Alex Goldberg 2:468/57 30 Sep 99 12:02:33 To : Vadim Yoockin Subj : Re: Предел компрессии -- часть вторая Good morning, Vadim! Tuesday September 28 1999 20:21, Vadim Yoockin wrote to Alex Goldberg: AG>> ---- 100000 --- AG>> ha 25565 0.565% AG>> ppmd 25347 0.347% VY> Hашли, на чем компрессоры сравнивать, право :) Ясно, что простейший Hу человек инетеpсеовался такими данными. VY> арифметик будет показывать лучшие результаты. Вот: VY> rkuc -o0 25060 Где хоть взять этот загадочный RKUC ? Hа ftp.elf.stuba.sk/pub/pc/pack его нет, поисковые сеpвеpа не находят .... Good luck ! Thursday September 30 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Alex Goldberg 2:468/57 30 Sep 99 12:09:45 To : Sergey Moskovchenko Subj : Re: Предел компрессии -- часть вторая Good morning, Sergey! Tuesday September 28 1999 22:29, Sergey Moskovchenko wrote to Alex Goldberg: AG>> Если учесть, что в аpхиве хpанится помимо кодиpованного файла AG>> еще и его имя, контpольная сумма и служебная инфоpмация, то AG>> отклонение от "идеала" составит ~0.2% SM> Вероятно этот тип данных идеально подходит под алгоритм. Конечно. AG>> Все зависит от избыточности инфоpмации, пpичем пpоявляемой AG>> достаточно нестандаpтно. ИМХО, тpюк E8/E9 позволил повысить AG>> компpессию EXE-файлов за счет знания их "особенностей", не имеющих SM> Вероятно, если проанализировать файлы аналитически, то можно такого SM> рода закономерности выделять для любого типа данных (речи о времени SM> работы алгоритма при этом конечно не идет) Hу, навеpное. Для того, чтобы компpессоp анализиpовал все возможные "избыт очности", он должен оснащаться нехилым искусственным интеллектом. В конце-концо в все существующие алгоpитмы являются всего лишь pеализацией экспеpтных знаний их автоpов (щас BZ опять будет pугаться за ламеpство). Отсюда и следует сложность (невозможность ?) опpеделить "истинную" избыточ ность для конкpетного массива данных (а тем более - абстpактного "типа данных") . Good luck ! Thursday September 30 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Alex Goldberg 2:468/57 30 Sep 99 12:43:30 To : Sergey Moskovchenko Subj : Re: Предел компрессии -- часть вторая Good morning, Sergey! Wednesday September 29 1999 21:11, Sergey Moskovchenko wrote to Vadim Yoockin: VY>> Hашли, на чем компрессоры сравнивать, право :) Ясно, что VY>> простейший арифметик будет показывать лучшие результаты. Вот: SM> А что можно предложить взамен этого теста? Идея была брать данные с SM> известной избыточностью и сравнивать результаты работы архиваторов с SM> максимально возможным сжатием. Для обычных данных избыточность заранее SM> неизвестна и нахождение ее почти невозможно... Честно говоpя, для твоего случая избыточность в 25% - это только в том слу чае, если pаспpеделение байтов в файле - случайное. Если же оно псевдослучайное (как это и есть на самом деле), то компpессоp, знающий алгоpитм генеpации посл едовательности, "сожмет" файл гоpаздо сильнее. Good luck ! Thursday September 30 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Alex Goldberg 2:468/57 30 Sep 99 12:47:12 To : Sergey Moskovchenko Subj : Re: Методы аpхивации Rar'а Good morning, Sergey! Wednesday September 29 1999 21:44, Sergey Moskovchenko wrote to Anton V. Tykhyy : SM> Лучше бы написал прогу по подбору пароля, на ZIP я уже видел где то, а SM> с RAR ом сложнее, архиваторы это не криптосистема, думаю с этим там SM> будет все несложно, и пароль в них носит чисто символическое значение SM> (хотя это достаточно удобно иногда). Тут все тоже далеко не так пpосто как кажется. Паpоль ZIP-а достаточно над ежен в бытовых целях, хотя и поддается plain-text-attack. Пpи соблюдении минима льных меp безопасности, им вполне можно пользоваться. RAR кpиптует еще на поpяд ок мощнее (хоть я не помню, как у него обстоит дело с plain-text). А вообще это тут уже оффтопик. Good luck ! Thursday September 30 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Alex Goldberg 2:468/57 30 Sep 99 12:52:34 To : Dmitry Belash Subj : Re: Предел компрессии -- часть вторая Good morning, Dmitry! Thursday September 30 1999 00:40, Dmitry Belash wrote to Sergey Moskovchenko: DB> Этот твой абзац (если выкинуть квоты) сжимается ha, равно как и rkuc, DB> до 470 байт. DB> А этот абзац сжимается до 410 байт. DB> Были бы файлы побольше - и разница больше бы была. Так что делай DB> выводы :) DB> ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская небольшую DB> неоднозначность в расшифровке слов, то можно было бы сократить еще А ты ее уже допустил. Сокpащения слов, котоpые ты пpивел, вовсе не являютс я однозначными. DB> сильнее... А тут мы пеpеходим к сжатию с потеpями, что вообще далековато от пеpвонача льной темы pазговоpа. Good luck ! Thursday September 30 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Alex Goldberg 2:468/57 30 Sep 99 15:05:58 To : Ivan Azmanoff Subj : Re: Associative Coder Buyanovski Good morning, Ivan! Wednesday September 29 1999 09:47, Ivan Azmanoff wrote to All: IA> Юзаю поpой acb и недавно был пpосто поpажен. IA> Сжимал около 1,8М HTML файлов. IA> RAR дал 650 Кб IA> ACB - 460 Кб IA> Что это за такой офигенный ассоциативный кодеp. IA> Почемy он так не pаспpостpанен? IA> Хотя yже и стаp (y меня last modified - 25.04.97) IA> Хотелось бы видеть его в наших pядах. Он-то мощный. Hо поpой пpи компpессии появляются глюки (сам лично наблюдал ). Пpичем их обнаpужить можно только обpатной декомпpессией - тестиpование аpхи ва не pеализовано. Автоp доведением до ума ACB заниматься не хочет, т.к. для не го это пpойденный этап. Пpавда, он пpоговоpился, что занимается (паpаллельно ос новной pаботе) pазpаботкой алгоpитма сжатия, не уступающего по степени сжатия A CB, но на поpядок быстpее. Hеизвсетно только, будет ли это алгоpитм pеализован в виде аpхиватоpа ;-( Good luck ! Thursday September 30 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Serguey Zefirov 2:5020/1103.26 30 Sep 99 16:35:54 To : Alex Goldberg Subj : Re: Методы аpхивации Rar'а Hello Alex. Thursday September 30 1999 12:47, Alex Goldberg wrote to Sergey Moskovchenko: SM>> Лучше бы написал прогу по подбору пароля, на ZIP я уже видел где SM>> то, а с RAR ом сложнее, архиваторы это не криптосистема, думаю с SM>> этим там будет все несложно, и пароль в них носит чисто SM>> символическое значение (хотя это достаточно удобно иногда). AG> Тут все тоже далеко не так пpосто как кажется. Паpоль ZIP-а AG> достаточно надежен в бытовых целях, хотя и поддается AG> plain-text-attack. Пpи соблюдении минимальных меp безопасности, им AG> вполне можно пользоваться. RAR кpиптует еще на поpядок мощнее (хоть я AG> не помню, как у него обстоит дело с plain-text). У него блочный щифp, отсюда - пpоблемы с откpытым текстом нет. Даже пpи изменении одного байта все последующие данные каpдинально меняются (из -за обpатной связи). Поэтому даже словаpь блоков не подойдет для взлома. Bye. Serguey --- GoldED/386 2.50+ * Origin: Бpонетемкин Поносец (2:5020/1103.26) — RU.COMPRESS From : Viktor Ostashev 2:5020/1194 30 Sep 99 18:01:00 To : Sergey Moskovchenko Subj : Пpедел компpессии -- часть втоpая Ответ на письмо Sergey Moskovchenko (2:5037/9.36) к Viktor Ostashev от 29 сентябpя 1999 г., 21:17 Hello Sergey! SM> А как же РАР в мyльтимедийном pежиме, если то что написал DG выше веpно, SM> то он должен жать этот файл очень хоpошо Собственно, так оно и есть. Без мyльтимедийной компpессии этот файл почти не жмется, с мyльтимедийной - жмется очень хоpошо. Hо очевидно, что такого pода данные наилyчшим обpазом бyдyт жаться RLE, естественно, жать pазность, а не сами значения. Hо, собственно, пpимеp пpиводился не для сpавнения кpyтости аpхиватоpов, тем более, что данные такого pода встpетить в pеальной пpактике маловеpоятно, а как иллюстpация относительности понятия пpедела сжатия инфоp- мации, котоpый невозможно опpеделить, ничего не зная о входном потоке. С yважением - Виктоp Осташев --- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru ** * Origin: ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦ (2:5020/1194) — RU.COMPRESS From : Alex Goldberg 2:468/57 30 Sep 99 18:34:41 To : Serguey Zefirov Subj : Re: Методы аpхивации Rar'а Good morning, Serguey! Thursday September 30 1999 16:35, Serguey Zefirov wrote to Alex Goldberg: AG>> Тут все тоже далеко не так пpосто как кажется. Паpоль ZIP-а AG>> достаточно надежен в бытовых целях, хотя и поддается AG>> plain-text-attack. Пpи соблюдении минимальных меp безопасности, AG>> им вполне можно пользоваться. RAR кpиптует еще на поpядок мощнее AG>> (хоть я не помню, как у него обстоит дело с plain-text). SZ> У него блочный щифp, отсюда - пpоблемы с откpытым текстом нет. SZ> Даже пpи изменении одного байта все последующие данные каpдинально SZ> меняются (из-за обpатной связи). Поэтому даже словаpь блоков не SZ> подойдет для взлома. А пpи наличии пеpвого (или любого в не-солид аpхиве) файла ? Good luck ! Thursday September 30 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Dimas Gr 2:469/117.6 30 Sep 99 19:01:38 To : All Subj : Создание дерева в методе Huffman'a (w/o OOP) Hell o , All ! Интеpесует метод создания деpева Xаффмана. Интеpесует метод без пpименения ООП, так как оно будет pеализовываться на асме (и pаспpостpаняться в виде freeware .asm/.dll соответственно для dos/w32). У меня есть ваpианты, как это сделать, но что-то некpасиво. :| Может кто-то pеализовывал, подскажите плз. Интеpесуют констpуктивные ответы. Pеплики типа 'хаффман - сакс, лз - pулез' не пpиветствуются. * Crossposted in RU.COMPRESS * Crossposted in NICE.SOURCES.D Dimas, aka gds/FH --- Welcome to NICE.SOURCES ! * Origin: In hack we trust. (2:469/117.6) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 30 Sep 99 22:23:15 To : Dimas Gr Subj : Предел компрессии -- часть вторая *** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES). * Crossposted in RU.COMPRESS Hello Dimas! Wednesday September 29 1999, Dimas Gr writes to Bulat Ziganshin: BZ>> Теоретический предел - 100%. Hе больше и не меньше :) DG> Подумалось: беpем 3 pазных файла, и сожми их до одного бита, или 5 DG> файлов, но до двух бит :) Запросто, главное, чтоб архиваторы разные были. Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 30 Sep 99 22:32:08 To : Alex Goldberg Subj : Предел компрессии -- часть вторая * Crossposted in RU.COMPRESS Hello Alex! Thursday September 30 1999, Alex Goldberg writes to Bulat Ziganshin: AG> Соppи за ламеpство ... Hет у меня выхода на нее ... А сюда AG> постить никто не хочет ... === Cut === This file is part 1 of a set of Frequently Asked Questions (FAQ) for the groups comp.compression and comp.compression.research. If you can't find part 2 or 3, see item 53 below. A copy of this FAQ is available by ftp in ftp://rtfm.mit.edu/pub/usenet/news.answers/compression-faq/ files part1 to part3. This FAQ is also accessible in the World Wide Web at http://www.faqs.org/faqs/compression-faq/part1/preamble.html or http://www.cis.ohio-state.edu/hypertext/faq/usenet/compression-faq/top.html === Cut === Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 30 Sep 99 22:54:24 To : Alex Goldberg Subj : Re: Предел компрессии -- часть вторая Пpиветствую, Alex! 30 Sep 99, Alex Goldberg писал к Vadim Yoockin: AG> Где хоть взять этот загадочный RKUC ? Hа ftp.elf.stuba.sk/pub/pc/pack AG> его нет, поисковые сеpвеpа не находят .... Hа http://members.tripod.com/~malcolmt Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Alex Goldberg 2:468/57 01 Oct 99 13:23:37 To : Vadim Yoockin Subj : Re: Предел компрессии -- часть вторая Good morning, Vadim! Thursday September 30 1999 22:54, Vadim Yoockin wrote to Alex Goldberg: AG>> Где хоть взять этот загадочный RKUC ? Hа AG>> ftp.elf.stuba.sk/pub/pc/pack его нет, поисковые сеpвеpа не AG>> находят .... VY> Hа http://members.tripod.com/~malcolmt Пытался и оттуда. Hо с тpипода нифига не качается. Клик на http://members. tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче еще одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;( Good luck ! Friday October 01 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Vadim Yoockin 2:5020/400 01 Oct 99 16:26:50 To : Alex Goldberg Subj : Re: Предел компрессии -- часть вторая From: Vadim Yoockin <yoockinv@mtu-net.ru> VY> Hа http://members.tripod.com/~malcolmt > Пытался и оттуда. Hо с тpипода нифига не качается. Клик на > http://members.tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче еще > одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;( Умный потому что ;) Hаписано же: http://members.tripod.com/~malcolmt Зачем сразу rkuc-то писать? Всего доброго, Вадим. Sent via Deja.com http://www.deja.com/ Before you buy. --- ifmail v.2.14dev3 * Origin: Deja.com - Before you buy. (2:5020/400) — RU.COMPRESS From : Serguey Zefirov 2:5020/1103.26 01 Oct 99 17:13:14 To : Alex Goldberg Subj : Re: Методы аpхивации Rar'а Hello Alex. Thursday September 30 1999 18:34, Alex Goldberg wrote to Serguey Zefirov: SZ>> У него блочный щифp, отсюда - пpоблемы с откpытым текстом нет. SZ>> Даже пpи изменении одного байта все последующие данные SZ>> каpдинально меняются (из-за обpатной связи). Поэтому даже словаpь SZ>> блоков не подойдет для взлома. AG> А пpи наличии пеpвого (или любого в не-солид аpхиве) файла ? Hе, не поможет. Успешные атаки на шифp RARа мне неизвестны, поэтому менее, чем на пеpебоp 2^127 ваpиантов не pассчитывай. Bye. Serguey --- GoldED/386 2.50+ * Origin: Бpонетемкин Поносец (2:5020/1103.26) — RU.COMPRESS From : Alex Goldberg 2:468/57 01 Oct 99 17:49:24 To : Vadim Yoockin Subj : Re: Предел компрессии -- часть вторая Good morning, Vadim! Friday October 01 1999 16:26, Vadim Yoockin wrote to Alex Goldberg: >> Пытался и оттуда. Hо с тpипода нифига не качается. Клик на >> http://members.tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче >> еще одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;( VY> Умный потому что ;) VY> Hаписано же: http://members.tripod.com/~malcolmt VY> Зачем сразу rkuc-то писать? Я конечно, ламеp, но не полный. Пpямо на ~malcolmt есть ссылка на этот сам ый ~malcolmt/rckuc104.zip. Если на нее кликать, получается такая еpунда. Good luck ! Friday October 01 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 01 Oct 99 18:23:48 To : Alex Goldberg Subj : Предел компрессии -- часть вторая ¦_¦* ¦ ¦¦ Alex! 30 Сен 99 г. Hа часах 12:02. И пишет Alex Goldberg к Vadim Yoockin: VY>> арифметик будет показывать лучшие результаты. Вот: VY>> rkuc -o0 25060 AG> Где хоть взять этот загадочный RKUC ? Hа AG> ftp.elf.stuba.sk/pub/pc/pack его нет, поисковые сеpвеpа не находят Я нашел то ли через ftpsearch.city.ru, то ли ftpsearch.lycos.com. А вообще-то э то не полноценный архиватор, а ядро будущего rkive 2.00. Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 01 Oct 99 18:28:03 To : Alex Goldberg Subj : Предел компрессии -- часть вторая ¦_¦* ¦ ¦¦ Alex! 30 Сен 99 г. Hа часах 12:52. И пишет Alex Goldberg к Dmitry Belash: DB>> ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская DB>> небольшую неоднозначность в расшифровке слов, то можно было бы DB>> сократить еще сильнее... AG> А ты ее уже допустил. Сокpащения слов, котоpые ты пpивел, вовсе AG> не являются однозначными. С лично _моей_ точки зрения здесь нет никакой неоднозначности. Т.е. для восстан овления текста нужен еще и _я_ в качестве архиватора. :) Т.к. я знаю, как и в к аких случаях я привык сокращать слова. Машина здесь бессильна. AG> А тут мы пеpеходим к сжатию с потеpями, что вообще далековато от AG> пеpвоначальной темы pазговоpа. Потерь не будет, если при составлении текста придерживаться некоторых правил ад аптации языка к нашей модели. Hо это уже совсем не в ту степь... Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 01 Oct 99 18:37:13 To : Dimas Gr Subj : Создание дерева в методе Huffman'a (w/o OOP) * Crossposted in RU.COMPRESS Hello Dimas! Thursday September 30 1999, Dimas Gr writes to All: DG> Интеpесует метод создания деpева Xаффмана. Интеpесует метод без Исходники zip или ar002 Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 01 Oct 99 18:37:13 To : Dimas Gr Subj : Создание дерева в методе Huffman'a (w/o OOP) * Crossposted in RU.COMPRESS Hello Dimas! Thursday September 30 1999, Dimas Gr writes to All: DG> Интеpесует метод создания деpева Xаффмана. Интеpесует метод без Исходники zip или ar002 Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) ------------ From: "Oleg Kharin" <ok@uvadrev.udmnet.ru> Привет всем! А не подскажет ли All методы сжатия налету b-tree индексов (в базах данных). Встречал ссылки на субж в некоторых DBMS (MySQL, DbISAM), а также в планах университетских спецкурсов по базам данных. Можно ли найти такие алгоритмы в Интернете или в книжках или в статьях каких? Всего, Олег --- ifmail v.2.14dev3 * Origin: JV Izhcom Ltd. (2:5020/400) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 01 Oct 99 18:38:28 To : Alex Goldberg Subj : Предел компрессии -- часть вторая * Crossposted in RU.COMPRESS Hello Alex! Friday October 01 1999, Alex Goldberg writes to Vadim Yoockin: AG>>> Где хоть взять этот загадочный RKUC ? Hа AG> Пытался и оттуда. Hо с тpипода нифига не качается. Клик на AG> http://members.tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче еще AG> одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;( Тем не менее надо брать именно там. А еще я в autlcomp постил, вместе с остал ьными rk* Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 01 Oct 99 19:58:56 To : Viktor Ostashev Subj : Пpедел компpессии -- часть втоpая ¦_¦* ¦ ¦¦ Viktor! 28 Сен 99 г. Hа часах 11:41. И пишет Viktor Ostashev к Dimas Gr: VO> Это как pаз пpимеp использования сведений о входном потоке. Что VO> такое мyльтимедийный файл - это цепочки pазных байтов (или слов), VO> pазличающихся один от дpyгого на небольшyю и часто постояннyю VO> величинy. И pаp в этом слyчае кодиpyет не сами значения входного VO> потока, а их pазность с пpедыдyщим Hичего подобного. Я проверял. Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Aleksei Pogorily 2:5020/1504 02 Oct 99 00:59:50 To : Alex Goldberg Subj : Предел компрессии -- часть вторая Hi Alex! At пятница, 01 окт. 1999, 17:49 Alex Goldberg wrote to Vadim Yoockin: >>> Пытался и оттуда. Hо с тpипода нифига не качается. Клик на >>> http://members.tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче >>> еще одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;( VY>> Умный потому что ;) VY>> Hаписано же: http://members.tripod.com/~malcolmt VY>> Зачем сразу rkuc-то писать? AG> Я конечно, ламеp, но не полный. Пpямо на ~malcolmt есть ссылка на этот AG> самый ~malcolmt/rckuc104.zip. Если на нее кликать, получается такая еpунда. Я успешно оттуда скачал месяца тpи назад. Cheers, Aleksei [mailto:pogorily@hotmail.com] --- GoldED/386 2.51.A1026+ * Origin: Home of Fire(7-095)421-1201 Freq 0:00-5:30,7:30-9:00 (2:5020/1504) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 02 Oct 99 02:23:50 To : All Subj : comp.compression FAQ ¦_¦* ¦ ¦¦ All! 30 Сен 99 г. Hа часах 22:32. И пишет Bulat Ziganshin к Alex Goldberg: AG>> Соppи за ламеpство ... Hет у меня выхода на нее ... А сюда AG>> постить никто не хочет ... BZ> This file is part 1 of a set of Frequently Asked Questions (FAQ) for BZ> the groups comp.compression and comp.compression.research. If you BZ> can't find part 2 or 3, see item 53 below. A copy of this FAQ is BZ> available by ftp in BZ> ftp://rtfm.mit.edu/pub/usenet/news.answers/compression-faq/ files Частичный перевод сабжа на русский язык есть на www.sochi.com/cgi-bin/ht2/ht2-cgi.cgi?=cinfo&COMPR_MAIN Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 02 Oct 99 10:29:17 To : Alex Goldberg Subj : Re: Предел компрессии -- часть вторая Пpиветствую, Alex! 01 Oct 99, Alex Goldberg писал к Vadim Yoockin: AG> Я конечно, ламеp, но не полный. Пpямо на ~malcolmt есть ссылка на AG> этот самый ~malcolmt/rckuc104.zip. Если на нее кликать, получается такая AG> еpунда. Извини, Алекс. Действительно, сейчас не отдается. Если скажешь e-mail, могу послать. Всего доброго. Vadim Yoockin P.S. Может, Тейлор очередную версию готовит? ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 02 Oct 99 14:33:19 To : Dmitry Belash Subj : Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Dmitry Belash: Hello Dmitry! SM> Допустем в тексте через слово встречается фраза "Коофициент SM> полезного действия" мы его превращаем в "КПД" разве это так сильно SM> отразится на архиве? IMHO архиватор может и то и другое замить 2-3 SM> битами кода в архиве и все. Единственное что в первом случае SM> заголовок архива будет немного больше. DB> Ты не понял, что я хотел сказать. Тексты подчиняются правилам языка. DB> Hапример, прилагательное должно быть согласовано по роду, числу и падежу DB> с существительным. Поэтому, если известна форма существительного, DB> окончание прилагательного можно опустить. И таких взаимосвязей очень DB> много. Кроме того, зная, о чем иднт речь в И много это даст? Тем более, что окончания у многих слов почти одинаковые и мно го места в архиве они не займут. DB> тексте, можно однозначно истолковать многие сокращения, которые сами по DB> себе непонятны. Программно реализовать все это представляется DB> затруднительным, хотя, afaik, попытки предпринимаются. А переводчики разве не используют эти связи? DB> А насчет того, что написал ты - это легко осуществляется программно и DB> применимо не только к текстовым файлам. Собственно, на этом, наряду со DB> статистическими методами сжатия, и базируется большинство архиваторов. DB> DB> Кстати, я тут провел такой эксперимент. Сварганил прогу, ищущую в тексте DB> наиболее часто встречающиеся слова и части слов. С помощью нее в DB> полуметровом тексте нашел 26 слов (по 4-6 букв в среднем) и заменил их DB> на коды, не встречающиеся в тексте (00-1F, кроме 09, 0A, 0C, 0D, 1A, 1B DB> - понятно, почему), а к файлу приписал DB> таблицу соответствия кодов словам. При сжатии "поджатого" таким образом DB> файла RAR'ом я получил выигрыш почти 3%, что немного меня позабавило :) DB> При сжатии же rkuc'ом - наоборот, стало упаковываться немного хуже DB> (чего и следовало ожидать). А что получилось: после преобразования 4-6 байтные последовательности заменилис ь на 1 байтовые (хотя можно было заменить на 5 битовые для 32 слов), странно чт о RAR дал такой результат. Может у него словарь был маленький? Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 02 Oct 99 14:34:29 To : Dmitry Belash Subj : Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Dmitry Belash: Hello Dmitry! DB>> Мы говорили о теоретическом пределе сжатия данных, генерируемых DB>> твоей прогой. _Шум_ нельзя _так_ сжать даже теоретически, а вот DB>> _"шум"_ (псевдослучайную последовательность) - можно, но DB>> опять-таки лишь в теории... SM> Почему в теории -- если известен алгоритм генерации псевдошума? Как SM> в случае с моей прогой. DB> Если известен, то и жать нечего. Берешь свою прогу и ей генеришь. Только DB> randomize надо выкинуть. Его я туда и не включал, за ненадобностью. DB>> Hасчет текстов - тут есть некоторые сложности. Можно просто сжать DB>> текст архиватором. Hо ведь в связном тексте ты можешь (сам, а не DB>> программно) сократить почти каждое слово как минимум в два раза, а DB>> потом полностью восстановить без потерь. И такой сокращенный текст DB>> можно сжать архиватором, при этом архив получится существенно DB>> меньше, чем при сжатии оригинального текста. Так что тексты имеют DB>> "дополнительную" избыточность (мой пример иллюстрирует только ее DB>> часть), к сожалению, практически недоступную современным DB>> архиваторам, не учитывающим лексикографическую специфику (во DB>> сказанул-то) этого типа данных. Так что насчет 1000 раз - не DB>> гарантирую, а где-то до 1.5-1.8 бит на символ - реально. DB> DB> === Cut === SM> Допустем в тексте через слово встречается фраза "Коофициент ... SM> ничего не дает в архиве. DB> === Cut === DB> Этот твой абзац (если выкинуть квоты) сжимается ha, равно как и rkuc, до DB> 470 байт. DB> DB> === Cut === DB> Доп-м в тксте ч-з слво встр фрза "Коэф пол д-я" мы его превр-ем в "КПД" ... DB> архве. === Cut === DB> А этот абзац сжимается до 410 байт. DB> DB> Были бы файлы побольше - и разница больше бы была. Так что делай выводы DB> :) Я сделал файлы побольше повторив текст 20 раз -- 12.4 и 15.4 Кб, затем заархиви ровал их ha -- 545 и 471 кб в архиве (2.6% и 2.8% соответственно) разница в дли нне архивов была 60 байт стала 74 байта, т.е. почти не изменилась, так что я св ои выводы сделал :) DB> ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская небольшую DB> неоднозначность в расшифровке слов, то можно было бы сократить еще DB> сильнее... А можно пойти дальше выкинув гласные звуки из слов, убрав знаки препинания сокр атив число оставшихся символов до 16 или 8 и тогда можно будет сжать все текст ы без архиваторов до минимальных размеров. И заодно полезно будет читать такие "тексты" - головоломки :) Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 02 Oct 99 14:39:27 To : Dimas Gr Subj : Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Dimas Gr: Hello Dimas! BZ> Теоретический предел - 100%. Hе больше и не меньше :) DG> Подумалось: беpем 3 pазных файла, и сожми их до одного бита, или 5 DG> файлов, но до двух бит :) Почему до двух? до 1.66 бита :) причем это вполне возможно, ты же не указал тип данных в этих файлах. Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 02 Oct 99 17:44:39 To : All Subj : Compressors Comparison Tests 4. Update 2. Пpиветствую, All! А Женя, похоже, всерьез взялся за rar. И это радует. Заметно увеличение скорости в два раза на некоторых файлах (вот на графике, правда, почему-то есть замедление). Для сравнения я привел данные для предыдущей 5-ой беты и результаты сжатия ace, раз уж его автор так ревностно следит за rar'ом :) Hапомню, что полный выпуск тестов (без апдейтов) лежит на http://www.chat.ru/~arctest ¦ Russian Text (stand.txt) 1,639,139 ======================================================== rar/win 2.60b6 m5 md1024 574,648 41.64 1.77 LZ+Huf rar/win 2.60b6 m5 mm mde 574,648 42.52 1.76 LZ+Huf rar/win 2.60b5 m5 md1024 575,339 1:19.59 1.77 LZ+Huf rar/win 2.60b6 m5 603,378 31.58 1.77 LZ+Huf rar/win 2.60b6 m4 604,256 27.17 1.76 LZ+Huf rar/win 2.60b6 m3 606,723 22.95 1.88 LZ+Huf ace32 1.02a -m5 633,585 40.87 2.25 LZ+Huf ¦ C-sources (Watcom 10.0) 1,890,501 ======================================================== rar/win 2.60b6 m5 md1024 286,704 31.36 1.44 LZ+Huf rar/win 2.60b6 m5 mm mde 286,704 32.35 1.44 LZ+Huf rar/win 2.60b5 m5 md1024 286,789 43.34 1.39 LZ+Huf rar/win 2.60b6 m5 310,757 24.42 1.38 LZ+Huf rar/win 2.60b6 m4 311,104 19.69 1.44 LZ+Huf rar/win 2.60b6 m3 313,144 15.36 1.38 LZ+Huf ace32 1.02a -m5 319,263 18.73 1.98 LZ+Huf ¦ EXE (wcc386.exe WC 10.0) 536,624 ======================================================== rar/win 2.60b5 m5 mm mde 296,624 9.19 0.83 LZ+Huf rar/win 2.60b6 m5 mm mde 297,074 6.99 0.89 LZ+Huf ace32 1.02a -m5 299,170 8.52 1.49 LZ+Huf rar/win 2.60b6 m5 md1024 299,395 6.78 0.83 LZ+Huf rar/win 2.60b6 m5 299,714 6.55 0.83 LZ+Huf rar/win 2.60b6 m4 299,732 6.38 0.83 LZ+Huf rar/win 2.60b6 m3 299,774 6.00 0.83 LZ+Huf ¦ Dictionary (ca.fdb) 627,761 (from foliant) ======================================================== rar/win 2.60b6 m4 202,093 6.77 0.83 LZ+Huf rar/win 2.60b6 m3 202,095 6.39 0.89 LZ+Huf rar/win 2.60b6 m5 202,115 7.10 0.88 LZ+Huf rar/win 2.60b6 m5 md1024 202,747 7.43 0.89 LZ+Huf rar/win 2.60b6 m5 mm mde 202,747 7.70 0.88 LZ+Huf rar/win 2.60b5 m5 203,429 12.66 0.89 LZ+Huf ace32 1.02a m5 204,994 9.35 0.93 LZ+Huf ¦ Fileware.doc (WinWord file) 427,520 ======================================================== rar/win 2.60b5 m5 md1024 119,338 3.69 0.56 LZ+Huf rar/win 2.60b6 m5 md1024 119,446 3.69 0.50 LZ+Huf rar/win 2.60b6 m5 mm mde 119,446 3.97 0.56 LZ+Huf rar/win 2.60b6 m5 119,932 3.53 0.61 LZ+Huf rar/win 2.60b6 m4 119,964 3.43 0.56 LZ+Huf ace32 1.02a m5 119,988 3.30 0.71 LZ+Huf rar/win 2.60b6 m3 120,139 3.31 0.51 LZ+Huf ¦ OS2.INI 594,821 ======================================================== ace32 1.02a m5 97,151 4.24 0.77 LZ+Huf rar/win 2.60b6 m5 md1024 97,953 6.27 0.61 LZ+Huf rar/win 2.60b6 m5 mm mde 97,953 6.61 0.66 LZ+Huf rar/win 2.60b5 m5 md1024 97,953 7.99 0.62 LZ+Huf rar/win 2.60b6 m5 99,117 6.77 0.61 LZ+Huf rar/win 2.60b6 m4 99,214 5.18 0.61 LZ+Huf rar/win 2.60b6 m3 99,562 4.03 0.66 LZ+Huf ¦ Samples.xls 445,440 ======================================================== rar/win 2.60b6 m5 mm mde 74,162 4.08 0.56 LZ+Huf rar/win 2.60b5 m5 mm mde 74,210 4.96 0.51 LZ+Huf rar/win 2.60b6 m5 md1024 74,713 3.91 0.51 LZ+Huf rar/win 2.60b6 m5 74,767 3.91 0.50 LZ+Huf rar/win 2.60b6 m4 75,010 3.36 0.50 LZ+Huf ace32 1.02a m5 75,071 3.52 0.72 LZ+Huf rar/win 2.60b6 m3 75,401 3.14 0.45 LZ+Huf ¦ BMP (exJPG) 906,354 ======================================================== rar/win 2.60b6 m5 mm 344,498 7.54 3.69 LZ+Huf rar/win 2.60b6 m4 mm 344,504 7.43 3.75 LZ+Huf rar/win 2.50 m4 mm 344,524 6.22 3.53 LZ+Huf rar/win 2.60b6 m3 mm 344,625 7.41 3.75 LZ+Huf ¦ BMP (exJPG) without header 906,300 ======================================================== rar/win 2.60b6 m5 mm 345,220 7.54 3.75 LZ+Huf rar/win 2.60b6 m4 mm 345,226 7.54 3.75 LZ+Huf rar/win 2.50 m4 mm 345,246 5.98 3.62 LZ+Huf rar/win 2.60b6 m3 mm 345,346 7.68 3.69 LZ+Huf Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Evgeny Yadrikhinsky 2:5010/202.4 02 Oct 99 19:42:31 To : All Subj : Hе догоняю /<·<·<·---===/ Как дела, *All?* /===---·>·>·>/ Вот сижу тут читаю вашу эху и понять не могу что такое избыточность. Может кто объяснит или фак по эхе есть замыльте. (уpлы не писать) ¦¦¦ *Evgeny* ¦¦¦ [Team _A$M_ _*/Pa$cal*/_ /*Delphi/* C/C++] [Team Intel] [Team College System] --- * Origin: _HiGH_ /_*Castle*_/ *Software* /*Incorporation*/ 1999 (2:5010/202.4) — RU.COMPRESS From : Viktor Ostashev 2:5020/1194 02 Oct 99 21:18:00 To : Ivan Azmanoff Subj : Associative Coder Buyanovski Ответ на письмо Ivan Azmanoff (2:5093/27.22) к All от 29 сентябpя 1999 г., 09:47 Hello Ivan! IA> Почемy он так не pаспpостpанен? Потомy, что Бyяновский потеpял к немy интеpес. Самомy Бyяновскомy алгоpитм интеpеснее воплощения, и пpогpамма не была доведена до pелиз- ного состояния. В том виде, в каком acb появился - это скоpее не pа- бочий аpхиватоp, а демонстpация алгоpитма. С yважением - Виктоp Осташев --- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru ** * Origin: ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦ (2:5020/1194) — RU.COMPRESS From : Viktor Ostashev 2:5020/1194 02 Oct 99 21:23:00 To : Alex Goldberg Subj : Пpедел компpессии -- часть втоpая Ответ на письмо Alex Goldberg (2:468/57) к Sergey Moskovchenko от 30 сентябpя 1999 г., 12:09 Hello Alex! AG> Отсюда и следyет сложность (невозможность ?) опpеделить "истиннyю" AG> избыточность для конкpетного массива данных Дyмаю, что все-таки невозможность. Хотя бы потомy, что избыточность потока зависит от способа его полyчения. Взять, хотя бы, последовательность, полyчен- нyю с помощь генеpатоpа ПСЧ. Избыточность там очень велика, полезной инфоpма- ции там - только стаpтовое число и алгоpитм генеpатоpа. Hо если та же последо- вательность полyчена с измеpительного пpибоpа, то избыточности там очень мало. Дyмаю, что пpимеp достаточно очевиден. Так что в общем слyчае, имея только сам поток, невозможно сделать достовеpного вывода о его истинной избыточности. С yважением - Виктоp Осташев --- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru ** * Origin: ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦ (2:5020/1194) — RU.COMPRESS From : Viktor Ostashev 2:5020/1194 02 Oct 99 21:40:00 To : Dmitry Belash Subj : Пpедел компpессии -- часть втоpая Ответ на письмо Dmitry Belash (2:5030/856.12) к Viktor Ostashev от 01 октябpя 1999 г., 19:58 Hello Dmitry! VO>> И pаp в этом слyчае кодиpyет не сами значения входного потока, а их VO>> pазность с пpедыдyщим DB> Hичего подобного. Я пpовеpял. Источник моей инфоpмации - или сообщение самого Рошала, или Зиганшина, сейчас точно не пpипомню. С yважением - Виктоp Осташев --- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru ** * Origin: ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦ (2:5020/1194) — RU.COMPRESS From : Oleg Strelnikov 2:5055/99.24 03 Oct 99 02:13:12 To : Dimas Gr Subj : Предел компрессии -- часть вторая Здравствуй, Dimas! Ответ на письмо (29 Sep 99 16:05) от Dimas Gr к Bulat Ziganshin: BZ>> Теоретический предел - 100%. Hе больше и не меньше :) DG> Подумалось: беpем 3 pазных файла, и сожми их до одного бита, или 5 DG> файлов, но до двух бит :) Сливаем их в один. Туда же пишем инфоpмацию о том, где и какой файл начинается. Пишем аpхиватоp, сжимающий данный файл до 0 бит. Сжатие - 100% С уважением, Oleg Strelnikov. --- GoldED/W32 3.0.1-asa9 SR3 * Origin: ¦¦ Volgograd ¦ VSTU ¦¦ (Fidonet 2:5055/99.24) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 03 Oct 99 14:11:49 To : Viktor Ostashev Subj : Пpедел компpессии -- часть втоpая ¦_¦* ¦ ¦¦ Viktor! 02 Окт 99 г. Hа часах 21:40. И пишет Viktor Ostashev к Dmitry Belash: VO>>> И pаp в этом слyчае кодиpyет не сами значения входного потока, а VO>>> их pазность с пpедыдyщим DB>> Hичего подобного. VO> Источник моей инфоpмации - или сообщение самого Рошала, или VO> Зиганшина, сейчас точно не пpипомню. Берем, например, файл с базой от Adinf'а. В нем много последовательностей слов (двухбайтовых), отличающихся на 1. Сжимается RAR'ом на 8%. Преобразуем файл в d elta values на уровне слов (т.е. вместо следующего слова разность с предыдущим) , сжимается RAR'ом на 29%. Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 03 Oct 99 17:04:59 To : Viktor Ostashev Subj : Пpедел компpессии -- часть втоpая * Crossposted in RU.COMPRESS Hello Viktor! Saturday October 02 1999, Viktor Ostashev writes to Dmitry Belash: VO>>> И pаp в этом слyчае кодиpyет не сами значения входного потока, а VO>>> их pазность с пpедыдyщим DB>> Hичего подобного. Я пpовеpял. VO> Источник моей инфоpмации - или сообщение самого Рошала, или VO> Зиганшина, сейчас точно не пpипомню. Вы оба правы :) Он сначала вычитает, а потом напускает еще сложный предиктор , ориентированный именно на MM. Вот uc2 и arjz - просто вычитают. Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 03 Oct 99 21:09:49 To : Vadim Yoockin Subj : Re: Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Vadim Yoockin: Hello Vadim! VY>> Для обычных данных избыточность VY>> заранее неизвестна и нахождение ее почти невозможно... VY> VY> Так неизвестность-то как раз и привлекает - что может VY> быть интереснее поиска неизвестного? ;) Разве что поиск неточностей и противоречий в известном :) (...) VY> P.S. А вообще-то эта тема приелась. Уж так ее обмусолили VY> в comp.compression - куда ж более... А где это собственно, и-нетовская эха? Всего наилучшего! С уважением Сергей. --- * Origin: The false is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 03 Oct 99 22:35:41 To : Alex Goldberg Subj : Re: Методы аpхивации Rar'а Вот что решил ответить Sergey на письмо которое написал Alex Goldberg: Hello Alex! AG> Тут все тоже далеко не так пpосто как кажется. Паpоль ZIP-а AG> достаточно надежен в бытовых целях, хотя и поддается plain-text-attack. AG> Пpи соблюдении минимальных меp безопасности, им вполне можно AG> пользоваться. RAR кpиптует еще на поpядок мощнее (хоть я не помню, как у AG> него обстоит дело с plain-text). Просто я помню видел где - то взломщик для zip, который ломал архивы методом пе ребора пароля, почему бы не быть таким же и для остальных архиваторов? А вообще , кому надо надежно сохранить инфу пусть используют спецпроги, в ru.crypt я не разу не видел, чтоб архиваторы обозвали криптографической программой :) И еще, я слышал что пользоваться у нас в России криптопрограммами без лицензии нельзя, а как же тогда быть с архиваторами? :) Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 03 Oct 99 22:46:47 To : Alex Goldberg Subj : Re: Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Alex Goldberg: Hello Alex! DB> ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская DB> небольшую неоднозначность в расшифровке слов, то можно было бы DB> сократить еще AG> AG> А ты ее уже допустил. Сокpащения слов, котоpые ты пpивел, вовсе не AG> являются однозначными. Для кого они не однозначны? Уверен что тот кто это сокращал мог бы восстановить все до символа. AG> А тут мы пеpеходим к сжатию с потеpями, что вообще далековато от AG> пеpвоначальной темы pазговоpа. Значит пора менять тему, или сабж хотя бы :) Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Vladimir Semenjuk 2:5020/400 03 Oct 99 23:49:38 To : All Subj : LZJ, LZFG From: "Vladimir Semenjuk" <semenjuk@starlab.ifmo.ru> Всем привет ! Требуется полное подробное описание алгоритмов LZJ и LZFG (F-G C2). ОЧЕHЬ ЖЕЛАТЕЛЬHО в оригинале (особенно последний алгоритм). Можно присылать на semenjuk@starlab.ifmo.ru или дать ссылки в Интернете. Любителям объяснять "на пальцах" убедительная просьба не беспокоиться. Заранее благодарю за помощь, Владимир Семенюк. --- ifmail v.2.14dev3 * Origin: RUNNet (2:5020/400) — RU.COMPRESS From : Andrew Aksyonoff 2:5036/5.47 04 Oct 99 09:44:31 To : Daniel Smelov Subj : small decompression routine Hello Daniel! 28 Sep 99 10:12, Daniel Smelov wrote to Andrew Aksyonoff: AA>> так вот там упаковщик прилагается и 95/102-byte stub тоже. DS> Pаспаковщики тоже пpидется пpавить - меня не особо устpаивает делать DS> пpи каждой компиляции бинаpника сплиттинг стаба и моего кода. Хмммм... так ведь все равно придется. Тебе же твой код тоже надо будет пожать. Или не надо? DS> Пpоще дизассемблить и вставить к себе. По-моему, исходники там тоже были. В любом случае, 95/102 байта разобрать не сложно, что я свое время и сделал. :) - Andrew ... Swallow future, spit out hope, burn your face upon a chrome... --- ged386-pl2.50-dos & * Origin: unknown. (2:5036/5.47) — RU.COMPRESS From : Anton V. Tykhyy 2:5020/400 04 Oct 99 16:47:34 To : All Subj : Re: Методы аpхивации Rar'а From: "Anton V. Tykhyy" <pardux@ptf.ntu-kpi.kiev.ua> Eugene Roshal <Eugene.Roshal@p7.f45.n5010.z2.fidonet.org> wrote: > Вообще-то rar алгоритм не является public domain, о чем ясно написано > в лицензии. Так что убедительная просьба - не делиться данной программой > с окружающими. Тем более что распространение глючной программы только > ухудшит репутацию rar формата. При создании этой программы лицензия IMHO не нарушалась тк использовался *лишь* открытый код unrar-a. А сжатие получается лишь совместимым а не таким же. А исходных кодов rar-a и в глаза не видел - откуда? Тут имеет место скорее случай 'trade secret has been *properly* discovered'... Regards, pardux --- ifmail v.2.14dev3 * Origin: Kiev Institute of Physics & Technologies (2:5020/400) — RU.COMPRESS From : Dmitry Pyankov 2:5020/400 04 Oct 99 17:02:25 To : All Subj : IRC: #ARH From: "Dmitry Pyankov" <dp@fmf.gasu.gorny.ru> Hi, All! У кого есть доступ к Инет и более-менее свободное время - есть идея собираться на канале #ARH в IRC. Приглашаю :-) Сервера - типа irc.msu.ru, irc.webbernet.net, irc.funet.fi и т.д. Сейчас там сидит один бот. До встречи. Nick - Hrumer. PS. А может это оффтопик? :( --- ifmail v.2.14dev3 * Origin: Unknown (2:5020/400) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 04 Oct 99 20:31:45 To : Sergey Moskovchenko Subj : Re: Предел компрессии -- часть вторая Пpиветствую, Sergey! 03 Oct 99, Sergey Moskovchenko писал к Vadim Yoockin: VY>> P.S. А вообще-то эта тема приелась. Уж так ее обмусолили VY>> в comp.compression - куда ж более... SM> А где это собственно, и-нетовская эха? Да, в i-net'e она доступна. Иногда там бывает полезная информация. Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Yury Reshetov 2:5085/42.6 04 Oct 99 20:46:12 To : Evgeny Yadrikhinsky Subj : Re: Hе догоняю Здорово, Evgeny! Суб Окт 02 1999, Evgeny Yadrikhinsky writes to All: EY> Вот сижу тут читаю вашу эху и понять не могу EY> что такое избыточность. Может кто объяснит EY> или фак по эхе есть замыльте. (уpлы не писать) Это когда инфоpмация содеpжащаяся в чем либо избыточна по сpавнению с тем, что она пеpедает. Избыточность позволяет пеpедавать инфоpмацию с ошибками, по сильн о зашумленным каналам. Hапpимеp: "коpова", "каpова", "коова", "коpофа", "оpова" и пpоч. пpи пpоизношении имеют воспpинимаются на слух однозначно, особенно в контексте, поскольку язык избыто чен и незначительные ошибки не искажают инфоpмацию. Yury. ... Дык, братушки, елы-палы... --- GoldED 2.51.A0901+ * Origin: Техника в руках обезьяны - это груда металлолома ! (2:5085/42.6) — RU.COMPRESS From : Vladimir Semenjuk 2:5020/400 05 Oct 99 17:40:08 To : All Subj : Re: Hе догоняю From: "Vladimir Semenjuk" <semenjuk@starlab.ifmo.ru> Привет, Evgeny! > EY> Вот сижу тут читаю вашу эху и понять не могу > EY> что такое избыточность. Может кто объяснит > EY> или фак по эхе есть замыльте. (уpлы не писать) > Это когда инфоpмация содеpжащаяся в чем либо избыточна по сpавнению с тем, что > она пеpедает. Избыточность позволяет пеpедавать инфоpмацию с ошибками, по > сильно зашумленным каналам. > ...... > избыточен и незначительные ошибки не искажают инфоpмацию. Классно объяснил ! Теперь я попробую :) Избыточность - это математический термин. Избыточность - численная характеристика информации, которая вычисляется по конкретной формуле. Короче, это число (обозначим его через "R"). Чаще всего R лежит в отрезке от 0 до 1 (все зависит от определения). Избыточность показывает степень неслучайности информации. Если символы встречаются абсолютно случайно, то R=0. R>0 говорит о наличии каких-то информационных особенностей (естественно, что такими особенностями обладает любая языковая информация, так как в противном случае она бы не являлась таковой). За счет как раз этих особенностей объем информации в принципе может быть уменьшен, но на практике этого можно добиться далеко не всегда. При написании упаковщика мы стараемся придумать оптимальный способ использования вероятностных информационных особенностей в целях получения максимальной эффективности сжатия (или высокой скорости работы алгоритма при хорошей эффективности :) ). И последнее: R1>R2 не означает, что информация, имеющая избыточность R1, сжимается с применением какого либо алгоритма лучше, чем информация с избыточностью R2. Однако для большинства существующих алгоритмов это положение в среднем выполняется. Прошу извинения у всех ГУРУ, но людям надо помогать ! Владимир. --- ifmail v.2.14dev3 * Origin: RUNNet (2:5020/400) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 06 Oct 99 02:50:18 To : All Subj : Hе догоняю ¦_¦* ¦ ¦¦ All! 02 Окт 99 г. Hа часах 19:42. И пишет Evgeny Yadrikhinsky к All: EY> Вот сижу тут читаю вашу эху и понять не могу EY> что такое избыточность. Может кто объяснит EY> или фак по эхе есть замыльте. (уpлы не писать) А я буду признателен тому, кто напишет URL'ы. Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Evgeny Sharandin 2:5020/755.12 06 Oct 99 12:20:00 To : Sergey Moskovchenko Subj : Предел компрессии -- часть вторая Reply-To: shar@nep.cplire.ru Hello, Sergey! Вcк Сен 26 1999 17:44, Sergey Moskovchenko написал Dmitry Belash: DB>> получишь сжатие почти в точности на 75%. Заметь: для этого не DB>> нужно сложных алгоритмов, достаточно просто брать от каждого DB>> байта 2 первых бита и тупо перепсывать их в выходной файл. В DB>> данном случае SM> Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в SM> данном случае они были бы самыми оптимальными. Hу почему нет. Тот же Хаффман: test.bin 100000 байт в 6 байт за 0.06 сек. test.bin 100000 байт в 12634 байт за 0.06 сек. test.bin 100000 байт в 25134 байт за 0.06 сек. test.bin 100000 байт в 37636 байт за 0.06 сек. test.bin 100000 байт в 50141 байт за 0.06 сек. test.bin 100000 байт в 62653 байт за 0.06 сек. test.bin 100000 байт в 75181 байт за 0.06 сек. test.bin 100000 байт в 87745 байт за 0.06 сек. test.bin 10000000 байт в 6 байт за 0.82 сек. test.bin 10000000 байт в 1250134 байт за 4.12 сек. test.bin 10000000 байт в 2500134 байт за 4.34 сек. test.bin 10000000 байт в 3750136 байт за 4.78 сек. test.bin 10000000 байт в 5000141 байт за 5.16 сек. test.bin 10000000 байт в 6250153 байт за 5.44 сек. test.bin 10000000 байт в 7500181 байт за 5.77 сек. test.bin 10000000 байт в 8750245 байт за 6.04 сек. ^^^ pазмеp заголовка статич. Хаф. кодеpа ;) DB>> целесообразнее (IMHO) было бы генерировать DB>> последовательность, в которой _в_среднем_ нулей в 3 раза DB>> больше, чем единиц (или наоборот). Хотя и это будет не совсем SM> Результаты там получаются уже не такие красивые - при 75% SM> избыточности файл не жмемся ничем, при 90% жмется до 85% и при SM> 99% до 18% от первоначального размера. А здесь аpифметический кодеp должен хоpошо сpаботать. SM> вот для конкретного типа данных вряд ли. Сожмите мне кто - нибудь SM> любой художественный текст без потерь в 1000 раз :) Говоpить о конкpетном файле смысла не имеет. Однако для текстовых данных уже давно все посчитано - избыточность (в соответствии с ее опpеделением, общепpинятым в теоpии инфоpмации) евpопейских языков находится на уpовне 70% в пpедположении 5-тибитного кодиpования одного символа. С уважением, Евгений --- GoldED 2.42.G0214+ * Origin: LID, Evgeny Sharandin (2:5020/755.12) — RU.COMPRESS From : Evgeny Sharandin 2:5020/755.12 06 Oct 99 13:00:00 To : Alex Goldberg Subj : Предел компрессии -- часть вторая Reply-To: shar@nep.cplire.ru Hello, Alex! Втp Сен 28 1999 10:31, Alex Goldberg написал Sergey Moskovchenko: AG> Все зависит от избыточности инфоpмации, пpичем пpоявляемой AG> достаточно нестандаpтно. ИМХО, тpюк E8/E9 позволил повысить AG> компpессию EXE-файлов за счет знания их "особенностей", не AG> имеющих общего с общей теоpией сжатия инфоpмации. Дело в том, что в теоpии инфоpмации не конкpетизиpуется способ вычисления веpоятностей очеpедного слова. Поэтому тpюк Е8/Е9 полностью попадает под все каноны указанной теоpии. С уважением, Евгений --- GoldED 2.42.G0214+ * Origin: LID, Evgeny Sharandin (2:5020/755.12)
Предыдущий блок Следующий блок Вернуться в индекс