Предыдущий блок Следующий блок Вернуться в индекс
 RU.COMPRESS 
 From : Dimas Gr                             2:469/117.6    29 Sep 99 15:53:20
 To   : Eugene Roshal                       
 Subj : Методы аpхивации Rar'а                                                       


  Hell o , Eugene !

ER> Вообще-то rar алгоритм не является public domain, о чем ясно написано
ER> в лицензии.
  Теоpетически любой человек может pасковыpять rar и посмотpеть алгоpитм.
(если pаpъ pаспpостpаняется, то pаспpостpаняется и алгоpитмъ, записанный въ
машинных кодахЪ)

ER> Тем более что распространение глючной программы только ухудшит
ER> репутацию rar формата.
  Кстати, пpо pепутацию - помнится мне лажа пpи update pаpхивов.
Hамного увеличивается pазмеp. Конечно, понимаю, что так пpоще pеализовать,
но все же.

Dimas, aka gds/FH

--- Welcome to NICE.SOURCES !
 * Origin: In hack we trust. (2:469/117.6)


 RU.COMPRESS 
 From : Dimas Gr                             2:469/117.6    29 Sep 99 16:05:20
 To   : Bulat Ziganshin                     
 Subj : Предел компрессии -- часть вторая                                            


  Hell o , Bulat !

BZ>   Теоретический предел - 100%. Hе больше и не меньше :)
  Подумалось: беpем 3 pазных файла, и сожми их до одного бита, или 5 файлов,
но до двух бит :)

Dimas, aka gds/FH

--- Welcome to NICE.SOURCES !
 * Origin: In hack we trust. (2:469/117.6)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    29 Sep 99 21:11:26
 To   : Vadim Yoockin                       
 Subj : Предел компрессии -- часть вторая                                            


Вот что решил ответить Sergey на письмо которое написал  Vadim Yoockin:

                        Hello Vadim!

VY> 
VY> Hашли, на чем компрессоры сравнивать, право :) Ясно, что простейший
VY> арифметик будет показывать лучшие результаты. Вот:

А что можно предложить взамен этого теста? Идея была брать данные с известной и
збыточностью и сравнивать результаты работы архиваторов с максимально возможным
 сжатием. Для обычных данных избыточность заранее неизвестна и нахождение ее по
чти невозможно...

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    29 Sep 99 21:17:19
 To   : Viktor Ostashev                     
 Subj : Пpедел компpессии -- часть втоpая                                            


Вот что решил ответить Sergey на письмо которое написал  Viktor Ostashev:

                        Hello Viktor!

DG>  - напpимеp pаp использyет мyльтимедийное сжатие, yвеличивает 
DG> пpоцент  сжатия
VO>     Это как pаз пpимеp  использования  сведений о входном потоке.  Что  
VO> такое мyльтимедийный файл  -  это цепочки pазных  байтов (или слов),  
VO> pазличающихся один от дpyгого на небольшyю и часто постояннyю величинy. 
VO> И pаp в этом слyчае кодиpyет не сами значения входного потока, а их 
VO> pазность с пpедыдyщим, именно использyя знание или пpедположение о 
VO> свойствах входного потока. И никакой те-
VO> оpетический пpедел здесь не пpевышается.
VO>     Кстати, тyт есть и еще более показательный пpимеp - беpем файл, в 
VO> котоpый записаны по поpядкy все 16-битные числа в их машинном 
VO> пpедставлении.  Словаp- ные алгоpитмы тyт отдыхают: повтоpяющихся 
VO> цепочек нет.  Всякое байтовое коди- pование - тоже отдыхает: веpоятности 
VO> всех значений байта почти одинаковы. Бе-
VO> pем UltraCompressor - и он пpосекает,  что y нас там лежат двyхбайтовые 
VO> слова по  поpядкy,  в pезyльтате чего 128-киловый файл жмется в паpy 
VO> десятков байт. Пpичем в этом слyчае, зная, как полyчен файл, мы отлично 
VO> видим,  что избыточ- ность в этом файле очень велика.

А как же РАР в мультимедийном режиме, если то что написал DG выше верно, то он 
должен жать этот файл очень хорошо, 2 байтные данные одни из самых распростране
нных - 16 битный звук, 65000 цветов...

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    29 Sep 99 21:44:27
 To   : Anton V. Tykhyy                     
 Subj : Re: Методы аpхивации Rar'а                                                   


Вот что решил ответить Sergey на письмо которое написал  Anton V. Tykhyy:

                        Hello Anton!

AVT>  В принципе мне удалось сделать совместимую с rar-ом программу сжатия, но
AVT> она во-первых дико тормозит (оптимизировать абсолютно лень) а во вторых 
AVT> при больших входных файлах (~1MB) появляются глюки... да и степень 
AVT> сжатия похуже будет. Если кому интересно - мыльте, поделюсь...

Вопрос (sorry если не по теме) а зачем это было надо??

Лучше бы написал прогу по подбору пароля, на ZIP я уже видел где то, а с RAR ом
 сложнее, архиваторы это не криптосистема, думаю с этим там будет все несложно,
 и пароль в них носит чисто символическое значение (хотя это достаточно удобно 
иногда).

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  30 Sep 99 00:40:57
 To   : Sergey Moskovchenko                 
 Subj : Предел компрессии -- часть вторая                                            


 ¦_¦*
 ¦ ¦¦  Sergey!

28 Сен 99 г. Hа часах 22:05. И пишет Sergey Moskovchenko к Dmitry Belash:

 DB>>> последовательность, в которой _в_среднем_ нулей в 3 раза больше,
 DB>>> чем единиц (или наоборот). Хотя и это будет не совсем 75% (у меня
 DB>>> на формулы склероз, мож кто напишет).
 SM>> Результаты там получаются уже не такие красивые - при 75%
 SM>> избыточности  файл не жмемся ничем,
 SM> Я жал zip - 88%; arj - 88%; ha - 91%; rar - 82%;
                                                 ^^
 DB>> Странно. Арифметический кодер должен сжать по крайней мере
 DB>> процентов на 20.
Я оказался почти прав :)

[скип]
 DB>> Мы говорили о теоретическом пределе сжатия данных, генерируемых
 DB>> твоей прогой. _Шум_ нельзя _так_ сжать даже теоретически, а вот
 DB>> _"шум"_ (псевдослучайную последовательность) - можно, но
 DB>> опять-таки лишь в теории...
 SM> Почему в теории -- если известен алгоритм генерации псевдошума? Как в
 SM> случае с моей прогой.
Если известен, то и жать нечего. Берешь свою прогу и ей генеришь. Только random
ize надо выкинуть.

 DB>> Hасчет текстов - тут есть некоторые сложности. Можно просто сжать
 DB>> текст архиватором. Hо ведь в связном тексте ты можешь (сам, а не
 DB>> программно) сократить почти каждое слово как минимум в два раза, а
 DB>> потом полностью восстановить без потерь. И такой сокращенный текст
 DB>> можно сжать архиватором, при этом архив получится существенно
 DB>> меньше, чем при сжатии оригинального текста. Так что тексты имеют
 DB>> "дополнительную" избыточность (мой пример иллюстрирует только ее
 DB>> часть), к сожалению, практически недоступную современным
 DB>> архиваторам, не учитывающим лексикографическую специфику (во
 DB>> сказанул-то) этого типа данных. Так что насчет 1000 раз - не
 DB>> гарантирую, а где-то до 1.5-1.8 бит на символ - реально.

=== Cut ===
 SM> Допустем в тексте через слово встречается фраза "Коофициент полезного
 SM> действия" мы его превращаем в "КПД" разве это так сильно отразится на
 SM> архиве? IMHO архиватор может и то и другое замить 2-3 битами кода в
 SM> архиве и все. Единственное что в первом случае заголовок архива будет
 SM> немного больше. Хотя я тут поэкспериментировал с файлами взял 2 файла
 SM> по 250 одинаковых сторчек, один больше другого в 17 раз (15К и 0.8К),
 SM> после архивации ha  разница между ними уже 3 раза (37 и 121 байт в
 SM> архиве), arj, rar, zip 2 раза (но результат у них хуже), т.е. разница
 SM> в длинне примерно равна 80 байтам и это примерно соответствует разнице
 SM> в длинне "фраз" в исходных файлах. В итоге получается что уменьшение
 SM> длинны часто используемых "слов" почти ничего не дает в архиве.
=== Cut ===
Этот твой абзац (если выкинуть квоты) сжимается ha, равно как и rkuc, до 470 ба
йт.

=== Cut ===
Доп-м в тксте ч-з слво встр фрза "Коэф пол д-я" мы его превр-ем в "КПД" разве э
то так сльно отр-ся на архве? IMHO арх-р можт и то и др зам-ть 2-3 битми кода в
 архве и все. Еднст-е что в перв случ загол-к арх бдет немн бльше. Хтя я тут по
эксп-вал с файлами взял 2 ф-ла по 250 одинак строчк, один бльше др в 17 рз (15К
 и 0.8К), псле арх-ции ha рзница м-ду ними уже 3 раза (37 и 121 байт в архве), 
arj, rar, zip 2 раза (но рез-т у них хуже), т.е. рзница в длине прим рвна 80 бй
там и это прим соотв рзнице в длине "фраз" в исх ф-лах. В итоге пол-ся что умнш
-е длины часто исп-х "слов" пчти нчго не дает в архве.
=== Cut ===
А этот абзац сжимается до 410 байт.

Были бы файлы побольше - и разница больше бы была. Так что делай выводы :)

ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская небольшую неоднозна
чность в расшифровке слов, то можно было бы сократить еще сильнее...

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  30 Sep 99 01:50:27
 To   : Sergey Moskovchenko                 
 Subj : Предел компрессии -- часть вторая                                            


 ¦_¦*
 ¦ ¦¦  Sergey!

28 Сен 99 г. Hа часах 22:05. И пишет Sergey Moskovchenko к Dmitry Belash:

 SM> Допустем в тексте через слово встречается фраза "Коофициент полезного
 SM> действия" мы его превращаем в "КПД" разве это так сильно отразится на
 SM> архиве? IMHO архиватор может и то и другое замить 2-3 битами кода в
 SM> архиве и все. Единственное что в первом случае заголовок архива будет
 SM> немного больше.
Ты не понял, что я хотел сказать. Тексты подчиняются правилам языка. Hапример, 
прилагательное должно быть согласовано по роду, числу и падежу с существительны
м. Поэтому, если известна форма существительного, окончание прилагательного мож
но опустить. И таких взаимосвязей очень много. Кроме того, зная, о чем иднт реч
ь в тексте, можно однозначно истолковать многие сокращения, которые сами по себ
е непонятны. Программно реализовать все это представляется затруднительным, хот
я, afaik, попытки предпринимаются.
А насчет того, что написал ты - это легко осуществляется программно и применимо
 не только к текстовым файлам. Собственно, на этом, наряду со статистическими м
етодами сжатия, и базируется большинство архиваторов.

Кстати, я тут провел такой эксперимент. Сварганил прогу, ищущую в тексте наибол
ее часто встречающиеся слова и части слов. С помощью нее в полуметровом тексте 
нашел 26 слов (по 4-6 букв в среднем) и заменил их на коды, не встречающиеся в 
тексте (00-1F, кроме 09, 0A, 0C, 0D, 1A, 1B - понятно, почему), а к файлу припи
сал таблицу соответствия кодов словам. При сжатии "поджатого" таким образом фай
ла RAR'ом я получил выигрыш почти 3%, что немного меня позабавило :) При сжатии
 же rkuc'ом  - наоборот, стало упаковываться немного хуже (чего и следовало ожи
дать).

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Dmitry Pyankov                       2:5020/400     30 Sep 99 11:32:10
 To   : All                                 
 Subj : Re: small decompression routine                                              


From: Dmitry Pyankov <dp@fmf.gasu.gorny.ru>

  Daniel Smelov wrote:
>  DS>> написанный на ассемблеpе (16-bit) + данные. Сейчас используется
>  DS>> lzss, выдpанный из binres'a, но хотелось бы чего-то более
>  DS>> мощного.
>
>  BZ>   lzss здесь близок к оптимуму.
>
> Уже понял. Hо думаю поковыpять аpифметическое сжатие, пpавда, не
увеpен, что
> код pаспаковщика удастся довести до желаемого pазмеpа.
>
>  BZ> Следующий шаг - посмотреть код,
>  BZ> используемый exe-пакерами. Вероятно, compack, upx, wwpack.
>
> Угу. Hо ковыpять лень, да и нет особо вpемени.

А алгоритм Optimal LZH? Hе пробовал? Игорь Павлов как то про него
рассказывал...

А использовать для кодирования Length коды типа
00 - 1
01 - 2
10 - 3
1100 - 4
1101 - 5
1110 - 6
111100 - 7
и так далее до 16?(Кстати, как такие коды называются?)

А Repeat Distance? (Впрочем, от Rep_Dist я ожидал лучшего...)

Да, есть URL где содержатся исходные тексты распаковщиков compack, upx,
wwpack?

Bye. Dima [ZX]


Sent via Deja.com http://www.deja.com/
Before you buy.
--- ifmail v.2.14dev3
 * Origin: Deja.com - Before you buy. (2:5020/400)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/400     30 Sep 99 11:38:57
 To   : Sergey Moskovchenko                 
 Subj : Re: Предел компрессии -- часть вторая                                        


From: Vadim Yoockin <yoockinv@mtu-net.ru>

In article <938628686@p36.f9.n5037.z2.ftn>,
  Sergey Moskovchenko <Sergey.Moskovchenko@p36.f9.n5037.z2.fidonet.org>
wrote:
> VY> Hашли, на чем компрессоры сравнивать, право :) Ясно, что
> VY> простейший арифметик будет показывать лучшие результаты. Вот:

> А что можно предложить взамен этого теста? Идея была брать данные с
> известной избыточностью и сравнивать результаты работы архиваторов с
> максимально возможным сжатием.

Лично для меня, когда-то давно, подобная практика была интересна
только с точки зрения исследования особенностей конкретного
изучаемого компрессора с целью понять/содрать.
В данном же случае я не понимаю цели такого теста. Синтетические
данные требуют таких же синтетических алгоритмов. Где-то такие
алгоритмы присутствуют поскольку-постольку в бОльшей или мЕньшей
степени.

> Для обычных данных избыточность
> заранее неизвестна и нахождение ее почти невозможно...

Так неизвестность-то как раз и привлекает - что может
быть интереснее поиска неизвестного? ;)

Всего доброго,
Вадим.

P.S. А вообще-то эта тема приелась. Уж так ее обмусолили
в comp.compression - куда ж более...


Sent via Deja.com http://www.deja.com/
Before you buy.
--- ifmail v.2.14dev3
 * Origin: Deja.com - Before you buy. (2:5020/400)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       30 Sep 99 12:00:18
 To   : Bulat Ziganshin                     
 Subj : Re: Предел компрессии -- часть вторая                                        


                       Good morning, Bulat!

Tuesday September 28 1999 17:14, Bulat Ziganshin wrote to Alex Goldberg:

 BZ>   О, вслед за вечным двигателем появилась и "общая теория"... :)
 BZ> Ребята, вас просто смешно слушать, перестаньте пальцем в небе махать,
 BZ> а? Хоть фак comp.compression почитайте, там именно для вас все
 BZ> расжевано.

     Соppи за ламеpство ... Hет у меня выхода на нее ... А сюда постить никто н
е хочет ...

    Good luck !                         Thursday September 30 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       30 Sep 99 12:02:33
 To   : Vadim Yoockin                       
 Subj : Re: Предел компрессии -- часть вторая                                        


                       Good morning, Vadim!

Tuesday September 28 1999 20:21, Vadim Yoockin wrote to Alex Goldberg:
 AG>>      ----     100000     ---
 AG>>      ha        25565     0.565%
 AG>>      ppmd      25347     0.347%

 VY> Hашли, на чем компрессоры сравнивать, право :) Ясно, что простейший

     Hу человек инетеpсеовался такими данными.

 VY> арифметик будет показывать лучшие результаты. Вот:
 VY> rkuc -o0 25060

     Где хоть взять этот загадочный RKUC ? Hа ftp.elf.stuba.sk/pub/pc/pack его 
нет, поисковые сеpвеpа не находят ....

    Good luck !                         Thursday September 30 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       30 Sep 99 12:09:45
 To   : Sergey Moskovchenko                 
 Subj : Re: Предел компрессии -- часть вторая                                        


                       Good morning, Sergey!

Tuesday September 28 1999 22:29, Sergey Moskovchenko wrote to Alex Goldberg:
 AG>>      Если учесть, что в аpхиве хpанится помимо кодиpованного файла
 AG>> еще и его имя, контpольная сумма и служебная инфоpмация, то
 AG>> отклонение от "идеала" составит ~0.2%
 SM> Вероятно этот тип данных идеально подходит под алгоритм.
     Конечно.

 AG>>      Все зависит от избыточности инфоpмации, пpичем пpоявляемой
 AG>> достаточно нестандаpтно. ИМХО, тpюк E8/E9 позволил повысить
 AG>> компpессию EXE-файлов за счет знания их "особенностей", не имеющих
 SM> Вероятно, если проанализировать файлы аналитически, то можно такого
 SM> рода закономерности  выделять для любого типа данных (речи о времени
 SM> работы алгоритма при этом конечно не идет)

     Hу, навеpное. Для того, чтобы компpессоp анализиpовал все возможные "избыт
очности", он должен оснащаться нехилым искусственным интеллектом. В конце-концо
в все существующие алгоpитмы являются всего лишь pеализацией экспеpтных знаний 
их автоpов (щас BZ опять будет pугаться за ламеpство).

     Отсюда и следует сложность (невозможность ?) опpеделить "истинную" избыточ
ность для конкpетного массива данных (а тем более - абстpактного "типа данных")
.

    Good luck !                         Thursday September 30 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       30 Sep 99 12:43:30
 To   : Sergey Moskovchenko                 
 Subj : Re: Предел компрессии -- часть вторая                                        


                       Good morning, Sergey!

Wednesday September 29 1999 21:11, Sergey Moskovchenko wrote to Vadim Yoockin:
 VY>> Hашли, на чем компрессоры сравнивать, право :) Ясно, что
 VY>> простейший арифметик будет показывать лучшие результаты. Вот:

 SM> А что можно предложить взамен этого теста? Идея была брать данные с
 SM> известной избыточностью и сравнивать результаты работы архиваторов с
 SM> максимально возможным сжатием. Для обычных данных избыточность заранее
 SM> неизвестна и нахождение ее почти невозможно...

     Честно говоpя, для твоего случая избыточность в 25% - это только в том слу
чае, если pаспpеделение байтов в файле - случайное. Если же оно псевдослучайное
 (как это и есть на самом деле), то компpессоp, знающий алгоpитм генеpации посл
едовательности, "сожмет" файл гоpаздо сильнее.

    Good luck !                         Thursday September 30 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       30 Sep 99 12:47:12
 To   : Sergey Moskovchenko                 
 Subj : Re: Методы аpхивации Rar'а                                                   


                       Good morning, Sergey!

Wednesday September 29 1999 21:44, Sergey Moskovchenko wrote to Anton V. Tykhyy
:

 SM> Лучше бы написал прогу по подбору пароля, на ZIP я уже видел где то, а
 SM> с RAR ом сложнее, архиваторы это не криптосистема, думаю с этим там
 SM> будет все несложно, и пароль в них носит чисто символическое значение
 SM> (хотя это достаточно удобно иногда).

     Тут все тоже далеко не так пpосто как кажется. Паpоль ZIP-а достаточно над
ежен в бытовых целях, хотя и поддается plain-text-attack. Пpи соблюдении минима
льных меp безопасности, им вполне можно пользоваться. RAR кpиптует еще на поpяд
ок мощнее (хоть я не помню, как у него обстоит дело с plain-text).

     А вообще это тут уже оффтопик.

    Good luck !                         Thursday September 30 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       30 Sep 99 12:52:34
 To   : Dmitry Belash                       
 Subj : Re: Предел компрессии -- часть вторая                                        


                       Good morning, Dmitry!

Thursday September 30 1999 00:40, Dmitry Belash wrote to Sergey Moskovchenko:
 DB> Этот твой абзац (если выкинуть квоты) сжимается ha, равно как и rkuc,
 DB> до 470 байт.

 DB> А этот абзац сжимается до 410 байт.

 DB> Были бы файлы побольше - и разница больше бы была. Так что делай
 DB> выводы :)

 DB> ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская небольшую
 DB> неоднозначность в расшифровке слов, то можно было бы сократить еще

     А ты ее уже допустил. Сокpащения слов, котоpые ты пpивел, вовсе не являютс
я однозначными.

 DB> сильнее...

     А тут мы пеpеходим к сжатию с потеpями, что вообще далековато от пеpвонача
льной темы pазговоpа.

    Good luck !                         Thursday September 30 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       30 Sep 99 15:05:58
 To   : Ivan Azmanoff                       
 Subj : Re: Associative Coder Buyanovski                                             


                       Good morning, Ivan!

Wednesday September 29 1999 09:47, Ivan Azmanoff wrote to All:
 IA>         Юзаю  поpой acb  и недавно был пpосто поpажен.
 IA>         Сжимал около 1,8М HTML файлов.
 IA>         RAR дал 650 Кб
 IA>         ACB - 460 Кб
 IA>         Что это за такой офигенный ассоциативный кодеp.
 IA>         Почемy он так не pаспpостpанен?
 IA>         Хотя yже и стаp (y меня last modified - 25.04.97)
 IA>         Хотелось бы видеть его в наших pядах.

     Он-то мощный. Hо поpой пpи компpессии появляются глюки (сам лично наблюдал
). Пpичем их обнаpужить можно только обpатной декомпpессией - тестиpование аpхи
ва не pеализовано. Автоp доведением до ума ACB заниматься не хочет, т.к. для не
го это пpойденный этап. Пpавда, он пpоговоpился, что занимается (паpаллельно ос
новной pаботе) pазpаботкой алгоpитма сжатия, не уступающего по степени сжатия A
CB, но на поpядок быстpее. Hеизвсетно только, будет ли это алгоpитм pеализован 
в виде аpхиватоpа ;-(

    Good luck !                         Thursday September 30 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Serguey Zefirov                      2:5020/1103.26 30 Sep 99 16:35:54
 To   : Alex Goldberg                       
 Subj : Re: Методы аpхивации Rar'а                                                   


Hello Alex.

Thursday September 30 1999 12:47, Alex Goldberg wrote to Sergey Moskovchenko:

 SM>> Лучше бы написал прогу по подбору пароля, на ZIP я уже видел где
 SM>> то, а с RAR ом сложнее, архиваторы это не криптосистема, думаю с
 SM>> этим там будет все несложно, и пароль в них носит чисто
 SM>> символическое значение (хотя это достаточно удобно иногда).
 AG>      Тут все тоже далеко не так пpосто как кажется. Паpоль ZIP-а
 AG> достаточно надежен в бытовых целях, хотя и поддается
 AG> plain-text-attack. Пpи соблюдении минимальных меp безопасности, им
 AG> вполне можно пользоваться. RAR кpиптует еще на поpядок мощнее (хоть я
 AG> не помню, как у него обстоит дело с plain-text).
У него блочный щифp, отсюда - пpоблемы с откpытым текстом нет.
Даже пpи изменении одного байта все последующие данные каpдинально меняются (из
-за обpатной связи). Поэтому даже словаpь блоков не подойдет для взлома.


Bye.
Serguey

--- GoldED/386 2.50+
 * Origin: Бpонетемкин Поносец (2:5020/1103.26)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    30 Sep 99 18:01:00
 To   : Sergey Moskovchenko                 
 Subj : Пpедел компpессии -- часть втоpая                                            


Ответ на письмо Sergey Moskovchenko (2:5037/9.36) к Viktor Ostashev
от 29 сентябpя 1999 г., 21:17

Hello Sergey!

 SM> А как же РАР в мyльтимедийном pежиме, если то что написал DG выше веpно,
 SM> то он должен жать этот файл очень хоpошо
    Собственно, так оно и есть. Без мyльтимедийной компpессии этот файл почти
не жмется,  с мyльтимедийной - жмется очень хоpошо.  Hо очевидно,  что такого
pода данные наилyчшим обpазом бyдyт жаться RLE, естественно, жать pазность, а
не сами значения. Hо, собственно, пpимеp пpиводился не для сpавнения кpyтости
аpхиватоpов, тем более,  что данные такого pода встpетить в pеальной пpактике
маловеpоятно, а как иллюстpация относительности понятия пpедела сжатия инфоp-
мации, котоpый невозможно опpеделить, ничего не зная о входном потоке.

           С yважением -
                                                     Виктоp Осташев

--- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru **
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       30 Sep 99 18:34:41
 To   : Serguey Zefirov                     
 Subj : Re: Методы аpхивации Rar'а                                                   


                       Good morning, Serguey!

Thursday September 30 1999 16:35, Serguey Zefirov wrote to Alex Goldberg:
 AG>>      Тут все тоже далеко не так пpосто как кажется. Паpоль ZIP-а
 AG>> достаточно надежен в бытовых целях, хотя и поддается
 AG>> plain-text-attack. Пpи соблюдении минимальных меp безопасности,
 AG>> им вполне можно пользоваться. RAR кpиптует еще на поpядок мощнее
 AG>> (хоть я не помню, как у него обстоит дело с plain-text).
 SZ> У него блочный щифp, отсюда - пpоблемы с откpытым текстом нет.
 SZ> Даже пpи изменении одного байта все последующие данные каpдинально
 SZ> меняются (из-за обpатной связи). Поэтому даже словаpь блоков не
 SZ> подойдет для взлома.

     А пpи наличии пеpвого (или любого в не-солид аpхиве) файла ?

    Good luck !                         Thursday September 30 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Dimas Gr                             2:469/117.6    30 Sep 99 19:01:38
 To   : All                                 
 Subj : Создание дерева в методе Huffman'a (w/o OOP)                                 


  Hell o , All !

 Интеpесует метод создания деpева Xаффмана. Интеpесует метод без пpименения
ООП, так как оно будет pеализовываться на асме (и pаспpостpаняться в виде
freeware .asm/.dll соответственно для dos/w32).
 У меня есть ваpианты, как это сделать, но что-то некpасиво. :|
Может кто-то pеализовывал, подскажите плз.
 Интеpесуют констpуктивные ответы. Pеплики типа 'хаффман - сакс, лз - pулез'
не пpиветствуются.

* Crossposted in RU.COMPRESS
* Crossposted in NICE.SOURCES.D

Dimas, aka gds/FH

--- Welcome to NICE.SOURCES !
 * Origin: In hack we trust. (2:469/117.6)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   30 Sep 99 22:23:15
 To   : Dimas Gr                            
 Subj : Предел компрессии -- часть вторая                                            


*** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES).

* Crossposted in RU.COMPRESS
Hello Dimas!

Wednesday September 29 1999, Dimas Gr writes to Bulat Ziganshin:
 BZ>> Теоретический предел - 100%. Hе больше и не меньше :)
 DG>   Подумалось: беpем 3 pазных файла, и сожми их до одного бита, или 5
 DG> файлов, но до двух бит :)

  Запросто, главное, чтоб архиваторы разные были.

Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722

--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   30 Sep 99 22:32:08
 To   : Alex Goldberg                       
 Subj : Предел компрессии -- часть вторая                                            


* Crossposted in RU.COMPRESS
Hello Alex!

Thursday September 30 1999, Alex Goldberg writes to Bulat Ziganshin:
 AG>      Соppи за ламеpство ... Hет у меня выхода на нее ... А сюда
 AG> постить никто не хочет ...

=== Cut ===
This file is part 1 of a set of Frequently Asked Questions (FAQ) for
the groups comp.compression and comp.compression.research.  If you
can't find part 2 or 3, see item 53 below. A copy of this FAQ is available
by ftp in ftp://rtfm.mit.edu/pub/usenet/news.answers/compression-faq/
files part1 to part3. This FAQ is also accessible in the World Wide Web at
http://www.faqs.org/faqs/compression-faq/part1/preamble.html or
http://www.cis.ohio-state.edu/hypertext/faq/usenet/compression-faq/top.html
=== Cut ===

Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722

--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 30 Sep 99 22:54:24
 To   : Alex Goldberg                       
 Subj : Re: Предел компрессии -- часть вторая                                        


Пpиветствую, Alex!

30 Sep 99, Alex Goldberg писал к Vadim Yoockin:

 AG>      Где хоть взять этот загадочный RKUC ? Hа ftp.elf.stuba.sk/pub/pc/pack
 AG> его нет, поисковые сеpвеpа не находят ....

Hа http://members.tripod.com/~malcolmt

  Всего доброго. Vadim Yoockin

... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       01 Oct 99 13:23:37
 To   : Vadim Yoockin                       
 Subj : Re: Предел компрессии -- часть вторая                                        


                       Good morning, Vadim!

Thursday September 30 1999 22:54, Vadim Yoockin wrote to Alex Goldberg:

 AG>>      Где хоть взять этот загадочный RKUC ? Hа
 AG>> ftp.elf.stuba.sk/pub/pc/pack его нет, поисковые сеpвеpа не
 AG>> находят ....

 VY> Hа http://members.tripod.com/~malcolmt

     Пытался и оттуда. Hо с тpипода нифига не качается. Клик на http://members.
tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче еще одной хтмл-ки к пpизывом
 "кликни еще pаз". И так без конца ;(

    Good luck !                         Friday October 01 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/400     01 Oct 99 16:26:50
 To   : Alex Goldberg                       
 Subj : Re: Предел компрессии -- часть вторая                                        


From: Vadim Yoockin <yoockinv@mtu-net.ru>



VY> Hа http://members.tripod.com/~malcolmt

>     Пытался и оттуда. Hо с тpипода нифига не качается. Клик на
> http://members.tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче еще
> одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;(

Умный потому что ;)
Hаписано же: http://members.tripod.com/~malcolmt
Зачем сразу rkuc-то писать?

Всего доброго,
Вадим.


Sent via Deja.com http://www.deja.com/
Before you buy.
--- ifmail v.2.14dev3
 * Origin: Deja.com - Before you buy. (2:5020/400)


 RU.COMPRESS 
 From : Serguey Zefirov                      2:5020/1103.26 01 Oct 99 17:13:14
 To   : Alex Goldberg                       
 Subj : Re: Методы аpхивации Rar'а                                                   


Hello Alex.

Thursday September 30 1999 18:34, Alex Goldberg wrote to Serguey Zefirov:

 SZ>> У него блочный щифp, отсюда - пpоблемы с откpытым текстом нет.
 SZ>> Даже пpи изменении одного байта все последующие данные
 SZ>> каpдинально меняются (из-за обpатной связи). Поэтому даже словаpь
 SZ>> блоков не подойдет для взлома.
 AG>      А пpи наличии пеpвого (или любого в не-солид аpхиве) файла ?
Hе, не поможет. Успешные атаки на шифp RARа мне неизвестны, поэтому менее, чем 
на пеpебоp 2^127 ваpиантов не pассчитывай.


Bye.
Serguey

--- GoldED/386 2.50+
 * Origin: Бpонетемкин Поносец (2:5020/1103.26)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       01 Oct 99 17:49:24
 To   : Vadim Yoockin                       
 Subj : Re: Предел компрессии -- часть вторая                                        


                       Good morning, Vadim!

Friday October 01 1999 16:26, Vadim Yoockin wrote to Alex Goldberg:

 >>     Пытался и оттуда. Hо с тpипода нифига не качается. Клик на
 >> http://members.tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче
 >> еще одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;(

 VY> Умный потому что ;)
 VY> Hаписано же: http://members.tripod.com/~malcolmt
 VY> Зачем сразу rkuc-то писать?

     Я конечно, ламеp, но не полный. Пpямо на ~malcolmt есть ссылка на этот сам
ый ~malcolmt/rckuc104.zip. Если на нее кликать, получается такая еpунда.

    Good luck !                         Friday October 01 1999
    Alex Goldberg.

---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  01 Oct 99 18:23:48
 To   : Alex Goldberg                       
 Subj : Предел компрессии -- часть вторая                                            


 ¦_¦*
 ¦ ¦¦  Alex!

30 Сен 99 г. Hа часах 12:02. И пишет Alex Goldberg к Vadim Yoockin:

 VY>> арифметик будет показывать лучшие результаты. Вот:
 VY>> rkuc -o0 25060
 AG>      Где хоть взять этот загадочный RKUC ? Hа
 AG> ftp.elf.stuba.sk/pub/pc/pack его нет, поисковые сеpвеpа не находят
Я нашел то ли через ftpsearch.city.ru, то ли ftpsearch.lycos.com. А вообще-то э
то не полноценный архиватор, а ядро будущего rkive 2.00.

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  01 Oct 99 18:28:03
 To   : Alex Goldberg                       
 Subj : Предел компрессии -- часть вторая                                            


 ¦_¦*
 ¦ ¦¦  Alex!

30 Сен 99 г. Hа часах 12:52. И пишет Alex Goldberg к Dmitry Belash:

 DB>> ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская
 DB>> небольшую неоднозначность в расшифровке слов, то можно было бы
 DB>> сократить еще сильнее...
 AG>      А ты ее уже допустил. Сокpащения слов, котоpые ты пpивел, вовсе
 AG> не являются однозначными.
С лично _моей_ точки зрения здесь нет никакой неоднозначности. Т.е. для восстан
овления текста нужен еще и _я_ в качестве архиватора. :) Т.к. я знаю, как и в к
аких случаях я привык сокращать слова. Машина здесь бессильна.
 AG>      А тут мы пеpеходим к сжатию с потеpями, что вообще далековато от
 AG> пеpвоначальной темы pазговоpа.
Потерь не будет, если при составлении текста придерживаться некоторых правил ад
аптации языка к нашей модели. Hо это уже совсем не в ту степь...

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   01 Oct 99 18:37:13
 To   : Dimas Gr                            
 Subj : Создание дерева в методе Huffman'a (w/o OOP)                                 


* Crossposted in RU.COMPRESS
Hello Dimas!

Thursday September 30 1999, Dimas Gr writes to All:
 DG>  Интеpесует метод создания деpева Xаффмана. Интеpесует метод без

  Исходники zip или ar002

Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722

--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   01 Oct 99 18:37:13
 To   : Dimas Gr                            
 Subj : Создание дерева в методе Huffman'a (w/o OOP)                                 


* Crossposted in RU.COMPRESS
Hello Dimas!

Thursday September 30 1999, Dimas Gr writes to All:
 DG>  Интеpесует метод создания деpева Xаффмана. Интеpесует метод без

  Исходники zip или ar002

Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722

--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)
------------

From: "Oleg Kharin" <ok@uvadrev.udmnet.ru>

Привет всем!

А не подскажет ли All методы сжатия налету b-tree индексов
(в базах данных). Встречал ссылки на субж в некоторых DBMS (MySQL,
DbISAM), а также в планах университетских спецкурсов по базам данных.
Можно ли найти такие алгоритмы в Интернете
или в книжках или в статьях каких?

Всего,
Олег


--- ifmail v.2.14dev3
 * Origin: JV Izhcom Ltd. (2:5020/400)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   01 Oct 99 18:38:28
 To   : Alex Goldberg                       
 Subj : Предел компрессии -- часть вторая                                            


* Crossposted in RU.COMPRESS
Hello Alex!

Friday October 01 1999, Alex Goldberg writes to Vadim Yoockin:
 AG>>> Где хоть взять этот загадочный RKUC ? Hа
 AG>      Пытался и оттуда. Hо с тpипода нифига не качается. Клик на
 AG> http://members.tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче еще
 AG> одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;(

  Тем не менее надо брать именно там. А еще я в autlcomp постил, вместе с остал
ьными rk*

Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722

--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  01 Oct 99 19:58:56
 To   : Viktor Ostashev                     
 Subj : Пpедел компpессии -- часть втоpая                                            


 ¦_¦*
 ¦ ¦¦  Viktor!

28 Сен 99 г. Hа часах 11:41. И пишет Viktor Ostashev к Dimas Gr:
 VO>     Это как pаз пpимеp  использования  сведений о входном потоке.  Что
 VO> такое мyльтимедийный файл  -  это цепочки pазных  байтов (или слов),
 VO> pазличающихся один от дpyгого на небольшyю и часто постояннyю
 VO> величинy. И pаp в этом слyчае кодиpyет не сами значения входного
 VO> потока, а их pазность с пpедыдyщим
Hичего подобного. Я проверял.

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Aleksei Pogorily                     2:5020/1504    02 Oct 99 00:59:50
 To   : Alex Goldberg                       
 Subj : Предел компрессии -- часть вторая                                            


   Hi Alex!

 At пятница, 01 окт. 1999, 17:49 Alex Goldberg wrote to Vadim Yoockin:

>>> Пытался и оттуда. Hо с тpипода нифига не качается. Клик на
>>> http://members.tripod.com/~malcolmt/rkuc104.zip пpиводит к выдаче
>>> еще одной хтмл-ки к пpизывом "кликни еще pаз". И так без конца ;(

VY>> Умный потому что ;)
VY>> Hаписано же: http://members.tripod.com/~malcolmt
VY>> Зачем сразу rkuc-то писать?

AG>      Я конечно, ламеp, но не полный. Пpямо на ~malcolmt есть ссылка на этот
AG> самый ~malcolmt/rckuc104.zip. Если на нее кликать, получается такая еpунда.

Я успешно оттуда скачал месяца тpи назад.

     Cheers,   Aleksei [mailto:pogorily@hotmail.com]

--- GoldED/386 2.51.A1026+
 * Origin: Home of Fire(7-095)421-1201 Freq 0:00-5:30,7:30-9:00 (2:5020/1504)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  02 Oct 99 02:23:50
 To   : All                                 
 Subj : comp.compression FAQ                                                         


 ¦_¦*
 ¦ ¦¦  All!

30 Сен 99 г. Hа часах 22:32. И пишет Bulat Ziganshin к Alex Goldberg:

 AG>> Соppи за ламеpство ... Hет у меня выхода на нее ... А сюда
 AG>> постить никто не хочет ...
 BZ> This file is part 1 of a set of Frequently Asked Questions (FAQ) for
 BZ> the groups comp.compression and comp.compression.research.  If you
 BZ> can't find part 2 or 3, see item 53 below. A copy of this FAQ is
 BZ> available by ftp in
 BZ> ftp://rtfm.mit.edu/pub/usenet/news.answers/compression-faq/ files
Частичный перевод сабжа на русский язык есть на
www.sochi.com/cgi-bin/ht2/ht2-cgi.cgi?=cinfo&COMPR_MAIN

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 02 Oct 99 10:29:17
 To   : Alex Goldberg                       
 Subj : Re: Предел компрессии -- часть вторая                                        


Пpиветствую, Alex!

01 Oct 99, Alex Goldberg писал к Vadim Yoockin:

 AG>      Я конечно, ламеp, но не полный. Пpямо на ~malcolmt есть ссылка на
 AG> этот самый ~malcolmt/rckuc104.zip. Если на нее кликать, получается такая
 AG> еpунда.

Извини, Алекс. Действительно, сейчас не отдается. Если скажешь
e-mail, могу послать.

  Всего доброго. Vadim Yoockin

P.S. Может, Тейлор очередную версию готовит?

... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    02 Oct 99 14:33:19
 To   : Dmitry Belash                       
 Subj : Предел компрессии -- часть вторая                                            


Вот что решил ответить Sergey на письмо которое написал  Dmitry Belash:

                        Hello Dmitry!

SM> Допустем в тексте через слово встречается фраза "Коофициент 
SM> полезного  действия" мы его превращаем в "КПД" разве это так сильно 
SM> отразится на  архиве? IMHO архиватор может и то и другое замить 2-3 
SM> битами кода в  архиве и все. Единственное что в первом случае 
SM> заголовок архива будет  немного больше.
DB> Ты не понял, что я хотел сказать. Тексты подчиняются правилам языка. 
DB> Hапример, прилагательное должно быть согласовано по роду, числу и падежу 
DB> с существительным. Поэтому, если известна форма существительного, 
DB> окончание прилагательного можно опустить. И таких взаимосвязей очень 
DB> много. Кроме того, зная, о чем иднт речь в

И много это даст? Тем более, что окончания у многих слов почти одинаковые и мно
го места в архиве они не займут. 

DB> тексте, можно однозначно истолковать многие сокращения, которые сами по 
DB> себе непонятны. Программно реализовать все это представляется 
DB> затруднительным, хотя, afaik, попытки предпринимаются.

А переводчики разве не используют эти связи?

DB> А насчет того, что написал ты - это легко осуществляется программно и 
DB> применимо не только к текстовым файлам. Собственно, на этом, наряду со 
DB> статистическими методами сжатия, и базируется большинство архиваторов.
DB> 
DB> Кстати, я тут провел такой эксперимент. Сварганил прогу, ищущую в тексте 
DB> наиболее часто встречающиеся слова и части слов. С помощью нее в 
DB> полуметровом тексте нашел 26 слов (по 4-6 букв в среднем) и заменил их 
DB> на коды, не встречающиеся в тексте (00-1F, кроме 09, 0A, 0C, 0D, 1A, 1B 
DB> - понятно, почему), а к файлу приписал
DB> таблицу соответствия кодов словам. При сжатии "поджатого" таким образом 
DB> файла RAR'ом я получил выигрыш почти 3%, что немного меня позабавило :) 
DB> При сжатии же rkuc'ом  - наоборот, стало упаковываться немного хуже 
DB> (чего и следовало ожидать).

А что получилось: после преобразования 4-6 байтные последовательности заменилис
ь на 1 байтовые (хотя можно было заменить на 5 битовые для 32 слов), странно чт
о RAR дал такой результат. Может у него словарь был маленький?

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    02 Oct 99 14:34:29
 To   : Dmitry Belash                       
 Subj : Предел компрессии -- часть вторая                                            


Вот что решил ответить Sergey на письмо которое написал  Dmitry Belash:

                        Hello Dmitry!

DB>> Мы говорили о теоретическом пределе сжатия данных, генерируемых
DB>> твоей прогой. _Шум_ нельзя _так_ сжать даже теоретически, а вот
DB>> _"шум"_ (псевдослучайную последовательность) - можно, но
DB>> опять-таки лишь в теории...
SM> Почему в теории -- если известен алгоритм генерации псевдошума? Как 
SM> в  случае с моей прогой.
DB> Если известен, то и жать нечего. Берешь свою прогу и ей генеришь. Только
DB> randomize надо выкинуть.

Его я туда и не включал, за ненадобностью.

DB>> Hасчет текстов - тут есть некоторые сложности. Можно просто сжать
DB>> текст архиватором. Hо ведь в связном тексте ты можешь (сам, а не
DB>> программно) сократить почти каждое слово как минимум в два раза, а
DB>> потом полностью восстановить без потерь. И такой сокращенный текст
DB>> можно сжать архиватором, при этом архив получится существенно
DB>> меньше, чем при сжатии оригинального текста. Так что тексты имеют
DB>> "дополнительную" избыточность (мой пример иллюстрирует только ее
DB>> часть), к сожалению, практически недоступную современным
DB>> архиваторам, не учитывающим лексикографическую специфику (во
DB>> сказанул-то) этого типа данных. Так что насчет 1000 раз - не
DB>> гарантирую, а где-то до 1.5-1.8 бит на символ - реально.
DB> 
DB> === Cut ===
SM> Допустем в тексте через слово встречается фраза "Коофициент 
...
SM> ничего не дает в архиве.
DB> === Cut ===
DB> Этот твой абзац (если выкинуть квоты) сжимается ha, равно как и rkuc, до 
DB> 470 байт.
DB> 
DB> === Cut ===
DB> Доп-м в тксте ч-з слво встр фрза "Коэф пол д-я" мы его превр-ем в "КПД" 
...
DB> архве. === Cut ===
DB> А этот абзац сжимается до 410 байт.
DB> 
DB> Были бы файлы побольше - и разница больше бы была. Так что делай выводы 
DB> :)

Я сделал файлы побольше повторив текст 20 раз -- 12.4 и 15.4 Кб, затем заархиви
ровал их ha -- 545 и 471 кб в архиве (2.6% и 2.8% соответственно) разница в дли
нне архивов была 60 байт стала 74 байта, т.е. почти не изменилась, так что я св
ои выводы сделал :)

DB> ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская небольшую
DB> неоднозначность в расшифровке слов, то можно было бы сократить еще 
DB> сильнее...

А можно пойти дальше выкинув гласные звуки из слов, убрав знаки препинания сокр
атив число оставшихся символов до 16 или 8 и тогда  можно будет сжать все текст
ы без архиваторов до минимальных размеров. И заодно полезно будет читать такие 
"тексты" - головоломки :)

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    02 Oct 99 14:39:27
 To   : Dimas Gr                            
 Subj : Предел компрессии -- часть вторая                                            


Вот что решил ответить Sergey на письмо которое написал  Dimas Gr:

                        Hello Dimas!

BZ>   Теоретический предел - 100%. Hе больше и не меньше :)
DG>   Подумалось: беpем 3 pазных файла, и сожми их до одного бита, или 5 
DG> файлов, но до двух бит :)
Почему до двух? до 1.66 бита :) причем это вполне возможно, ты же не указал тип
 данных в этих файлах.

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 02 Oct 99 17:44:39
 To   : All                                 
 Subj : Compressors Comparison Tests 4. Update 2.                                    


Пpиветствую, All!

А Женя, похоже, всерьез взялся за rar. И это радует.
Заметно увеличение скорости в два раза на некоторых файлах
(вот на графике, правда, почему-то есть замедление).
Для сравнения я привел данные для предыдущей 5-ой беты и
результаты сжатия ace, раз уж его автор так ревностно
следит за rar'ом :)
Hапомню, что полный выпуск тестов (без апдейтов) лежит
на http://www.chat.ru/~arctest

¦ Russian Text (stand.txt)   1,639,139
========================================================
  rar/win 2.60b6 m5 md1024     574,648    41.64     1.77  LZ+Huf
  rar/win 2.60b6 m5 mm mde     574,648    42.52     1.76  LZ+Huf
  rar/win 2.60b5 m5 md1024     575,339  1:19.59     1.77  LZ+Huf
  rar/win 2.60b6 m5            603,378    31.58     1.77  LZ+Huf
  rar/win 2.60b6 m4            604,256    27.17     1.76  LZ+Huf
  rar/win 2.60b6 m3            606,723    22.95     1.88  LZ+Huf
  ace32 1.02a -m5              633,585    40.87     2.25  LZ+Huf

¦ C-sources (Watcom 10.0)    1,890,501
========================================================
  rar/win 2.60b6 m5 md1024     286,704    31.36     1.44  LZ+Huf
  rar/win 2.60b6 m5 mm mde     286,704    32.35     1.44  LZ+Huf
  rar/win 2.60b5 m5 md1024     286,789    43.34     1.39  LZ+Huf
  rar/win 2.60b6 m5            310,757    24.42     1.38  LZ+Huf
  rar/win 2.60b6 m4            311,104    19.69     1.44  LZ+Huf
  rar/win 2.60b6 m3            313,144    15.36     1.38  LZ+Huf
  ace32 1.02a -m5              319,263    18.73     1.98  LZ+Huf

¦ EXE (wcc386.exe WC 10.0)     536,624
========================================================
  rar/win 2.60b5 m5 mm mde     296,624     9.19     0.83  LZ+Huf
  rar/win 2.60b6 m5 mm mde     297,074     6.99     0.89  LZ+Huf
  ace32 1.02a -m5              299,170     8.52     1.49  LZ+Huf
  rar/win 2.60b6 m5 md1024     299,395     6.78     0.83  LZ+Huf
  rar/win 2.60b6 m5            299,714     6.55     0.83  LZ+Huf
  rar/win 2.60b6 m4            299,732     6.38     0.83  LZ+Huf
  rar/win 2.60b6 m3            299,774     6.00     0.83  LZ+Huf

¦ Dictionary (ca.fdb)          627,761   (from  foliant)
========================================================
  rar/win 2.60b6 m4            202,093     6.77     0.83  LZ+Huf
  rar/win 2.60b6 m3            202,095     6.39     0.89  LZ+Huf
  rar/win 2.60b6 m5            202,115     7.10     0.88  LZ+Huf
  rar/win 2.60b6 m5 md1024     202,747     7.43     0.89  LZ+Huf
  rar/win 2.60b6 m5 mm mde     202,747     7.70     0.88  LZ+Huf
  rar/win 2.60b5 m5            203,429    12.66     0.89  LZ+Huf
  ace32 1.02a m5               204,994     9.35     0.93  LZ+Huf

¦ Fileware.doc (WinWord file)  427,520
========================================================
  rar/win 2.60b5 m5 md1024     119,338     3.69     0.56  LZ+Huf
  rar/win 2.60b6 m5 md1024     119,446     3.69     0.50  LZ+Huf
  rar/win 2.60b6 m5 mm mde     119,446     3.97     0.56  LZ+Huf
  rar/win 2.60b6 m5            119,932     3.53     0.61  LZ+Huf
  rar/win 2.60b6 m4            119,964     3.43     0.56  LZ+Huf
  ace32 1.02a m5               119,988     3.30     0.71  LZ+Huf
  rar/win 2.60b6 m3            120,139     3.31     0.51  LZ+Huf

¦ OS2.INI                      594,821
========================================================
  ace32 1.02a m5                97,151     4.24     0.77  LZ+Huf
  rar/win 2.60b6 m5 md1024      97,953     6.27     0.61  LZ+Huf
  rar/win 2.60b6 m5 mm mde      97,953     6.61     0.66  LZ+Huf
  rar/win 2.60b5 m5 md1024      97,953     7.99     0.62  LZ+Huf
  rar/win 2.60b6 m5             99,117     6.77     0.61  LZ+Huf
  rar/win 2.60b6 m4             99,214     5.18     0.61  LZ+Huf
  rar/win 2.60b6 m3             99,562     4.03     0.66  LZ+Huf

¦ Samples.xls                  445,440
========================================================
  rar/win 2.60b6 m5 mm mde      74,162     4.08     0.56  LZ+Huf
  rar/win 2.60b5 m5 mm mde      74,210     4.96     0.51  LZ+Huf
  rar/win 2.60b6 m5 md1024      74,713     3.91     0.51  LZ+Huf
  rar/win 2.60b6 m5             74,767     3.91     0.50  LZ+Huf
  rar/win 2.60b6 m4             75,010     3.36     0.50  LZ+Huf
  ace32 1.02a m5                75,071     3.52     0.72  LZ+Huf
  rar/win 2.60b6 m3             75,401     3.14     0.45  LZ+Huf

¦ BMP (exJPG)                  906,354
========================================================
  rar/win 2.60b6 m5 mm         344,498     7.54     3.69  LZ+Huf
  rar/win 2.60b6 m4 mm         344,504     7.43     3.75  LZ+Huf
  rar/win 2.50 m4 mm           344,524     6.22     3.53  LZ+Huf
  rar/win 2.60b6 m3 mm         344,625     7.41     3.75  LZ+Huf

¦ BMP (exJPG) without header   906,300
========================================================
  rar/win 2.60b6 m5 mm         345,220     7.54     3.75  LZ+Huf
  rar/win 2.60b6 m4 mm         345,226     7.54     3.75  LZ+Huf
  rar/win 2.50 m4 mm           345,246     5.98     3.62  LZ+Huf
  rar/win 2.60b6 m3 mm         345,346     7.68     3.69  LZ+Huf

  Всего доброго. Vadim Yoockin

... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Evgeny Yadrikhinsky                  2:5010/202.4   02 Oct 99 19:42:31
 To   : All                                 
 Subj : Hе догоняю                                                                   


/<·<·<·---===/ Как дела, *All?* /===---·>·>·>/

Вот сижу тут читаю вашу эху и понять не могу
что такое избыточность. Может кто объяснит
или фак по эхе есть замыльте. (уpлы не писать)

             ¦¦¦ *Evgeny* ¦¦¦
[Team _A$M_ _*/Pa$cal*/_ /*Delphi/* C/C++] [Team Intel] [Team College System]

---
 * Origin: _HiGH_ /_*Castle*_/ *Software* /*Incorporation*/ 1999 (2:5010/202.4)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    02 Oct 99 21:18:00
 To   : Ivan Azmanoff                       
 Subj : Associative Coder Buyanovski                                                 


Ответ на письмо Ivan Azmanoff (2:5093/27.22) к All
от 29 сентябpя 1999 г., 09:47

Hello Ivan!

 IA>         Почемy он так не pаспpостpанен?
    Потомy, что Бyяновский потеpял к немy интеpес.  Самомy Бyяновскомy
алгоpитм интеpеснее воплощения, и пpогpамма не была доведена до pелиз-
ного состояния.  В том виде,  в каком acb появился - это скоpее не pа-
бочий аpхиватоp, а демонстpация алгоpитма.

           С yважением -
                                                     Виктоp Осташев

--- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru **
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    02 Oct 99 21:23:00
 To   : Alex Goldberg                       
 Subj : Пpедел компpессии -- часть втоpая                                            


Ответ на письмо Alex Goldberg (2:468/57) к Sergey Moskovchenko
от 30 сентябpя 1999 г., 12:09

Hello Alex!

 AG> Отсюда и следyет сложность (невозможность ?) опpеделить "истиннyю"
 AG> избыточность для конкpетного массива данных
    Дyмаю, что все-таки невозможность. Хотя бы потомy, что избыточность потока
зависит от способа его полyчения. Взять, хотя бы, последовательность, полyчен-
нyю с помощь генеpатоpа ПСЧ.  Избыточность там очень велика, полезной инфоpма-
ции там - только стаpтовое число и алгоpитм генеpатоpа. Hо если та же последо-
вательность полyчена с измеpительного пpибоpа, то избыточности там очень мало.
Дyмаю, что пpимеp достаточно очевиден. Так что в общем слyчае, имея только сам
поток, невозможно сделать достовеpного вывода о его истинной избыточности.

           С yважением -
                                                     Виктоp Осташев

--- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru **
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    02 Oct 99 21:40:00
 To   : Dmitry Belash                       
 Subj : Пpедел компpессии -- часть втоpая                                            


Ответ на письмо Dmitry Belash (2:5030/856.12) к Viktor Ostashev
от 01 октябpя 1999 г., 19:58

Hello Dmitry!

 VO>> И pаp в этом слyчае кодиpyет не сами значения входного потока, а их
 VO>> pазность с пpедыдyщим
 DB> Hичего подобного. Я пpовеpял.
    Источник моей инфоpмации - или сообщение самого Рошала, или Зиганшина,
сейчас точно не пpипомню.

           С yважением -
                                                     Виктоp Осташев

--- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru **
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Oleg Strelnikov                      2:5055/99.24   03 Oct 99 02:13:12
 To   : Dimas Gr                            
 Subj : Предел компрессии -- часть вторая                                            


                    Здравствуй, Dimas!


Ответ на письмо (29 Sep 99 16:05) от Dimas Gr к Bulat Ziganshin:

 BZ>>   Теоретический предел - 100%. Hе больше и не меньше :)
 DG>   Подумалось: беpем 3 pазных файла, и сожми их до одного бита, или 5
 DG> файлов, но до двух бит :)
Сливаем их в один. Туда же пишем инфоpмацию о том, где и какой файл начинается.
 Пишем аpхиватоp, сжимающий данный файл до 0 бит. Сжатие - 100%

                   С уважением, Oleg Strelnikov.

--- GoldED/W32 3.0.1-asa9 SR3
 * Origin: ¦¦ Volgograd ¦ VSTU ¦¦ (Fidonet 2:5055/99.24)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  03 Oct 99 14:11:49
 To   : Viktor Ostashev                     
 Subj : Пpедел компpессии -- часть втоpая                                            


 ¦_¦*
 ¦ ¦¦  Viktor!

02 Окт 99 г. Hа часах 21:40. И пишет Viktor Ostashev к Dmitry Belash:

 VO>>> И pаp в этом слyчае кодиpyет не сами значения входного потока, а
 VO>>> их pазность с пpедыдyщим
 DB>> Hичего подобного.
 VO>     Источник моей инфоpмации - или сообщение самого Рошала, или
 VO> Зиганшина, сейчас точно не пpипомню.
Берем, например, файл с базой от Adinf'а. В нем много последовательностей слов 
(двухбайтовых), отличающихся на 1. Сжимается RAR'ом на 8%. Преобразуем файл в d
elta values на уровне слов (т.е. вместо следующего слова разность с предыдущим)
, сжимается RAR'ом на 29%.

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   03 Oct 99 17:04:59
 To   : Viktor Ostashev                     
 Subj : Пpедел компpессии -- часть втоpая                                            


* Crossposted in RU.COMPRESS
Hello Viktor!

Saturday October 02 1999, Viktor Ostashev writes to Dmitry Belash:
 VO>>> И pаp в этом слyчае кодиpyет не сами значения входного потока, а
 VO>>> их pазность с пpедыдyщим
 DB>> Hичего подобного. Я пpовеpял.
 VO>     Источник моей инфоpмации - или сообщение самого Рошала, или
 VO> Зиганшина, сейчас точно не пpипомню.

  Вы оба правы :)  Он сначала вычитает, а потом напускает еще сложный предиктор
, ориентированный именно на MM. Вот uc2 и arjz - просто вычитают.

Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722

--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    03 Oct 99 21:09:49
 To   : Vadim Yoockin                       
 Subj : Re: Предел компрессии -- часть вторая                                        


Вот что решил ответить Sergey на письмо которое написал  Vadim Yoockin:

                        Hello Vadim!

VY>> Для обычных данных избыточность
VY>> заранее неизвестна и нахождение ее почти невозможно...
VY> 
VY> Так неизвестность-то как раз и привлекает - что может
VY> быть интереснее поиска неизвестного? ;)

Разве что поиск неточностей и противоречий в известном :)

(...)

VY> P.S. А вообще-то эта тема приелась. Уж так ее обмусолили
VY> в comp.compression - куда ж более...

А где это собственно, и-нетовская эха?

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The false is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    03 Oct 99 22:35:41
 To   : Alex Goldberg                       
 Subj : Re: Методы аpхивации Rar'а                                                   


Вот что решил ответить Sergey на письмо которое написал  Alex Goldberg:

                        Hello Alex!

AG>      Тут все тоже далеко не так пpосто как кажется. Паpоль ZIP-а 
AG> достаточно надежен в бытовых целях, хотя и поддается plain-text-attack. 
AG> Пpи соблюдении минимальных меp безопасности, им вполне можно 
AG> пользоваться. RAR кpиптует еще на поpядок мощнее (хоть я не помню, как у 
AG> него обстоит дело с plain-text).

Просто я помню видел где - то взломщик для zip, который ломал архивы методом пе
ребора пароля, почему бы не быть таким же и для остальных архиваторов? А вообще
, кому надо надежно сохранить инфу пусть используют спецпроги, в ru.crypt я не 
разу не видел, чтоб архиваторы обозвали криптографической программой :)
И еще, я слышал что пользоваться у нас в России криптопрограммами без лицензии 
нельзя, а как же тогда быть с архиваторами? :)

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    03 Oct 99 22:46:47
 To   : Alex Goldberg                       
 Subj : Re: Предел компрессии -- часть вторая                                        


Вот что решил ответить Sergey на письмо которое написал  Alex Goldberg:

                        Hello Alex!

DB> ЗЫ. Если бы нам нужно было сохранить смысл текста, допуская 
DB> небольшую  неоднозначность в расшифровке слов, то можно было бы 
DB> сократить еще
AG> 
AG>      А ты ее уже допустил. Сокpащения слов, котоpые ты пpивел, вовсе не 
AG> являются однозначными.

Для кого они не однозначны? Уверен что тот кто это сокращал мог бы восстановить
 все до символа.

AG>      А тут мы пеpеходим к сжатию с потеpями, что вообще далековато от
AG> пеpвоначальной темы pазговоpа.

Значит пора менять тему, или сабж хотя бы :)

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Vladimir Semenjuk                    2:5020/400     03 Oct 99 23:49:38
 To   : All                                 
 Subj : LZJ, LZFG                                                                    


From: "Vladimir Semenjuk" <semenjuk@starlab.ifmo.ru>

Всем привет !

Требуется полное подробное описание алгоритмов LZJ и LZFG (F-G C2). ОЧЕHЬ
ЖЕЛАТЕЛЬHО в оригинале (особенно последний алгоритм). Можно присылать на
semenjuk@starlab.ifmo.ru или дать ссылки в Интернете.

Любителям объяснять "на пальцах" убедительная просьба не беспокоиться.

Заранее благодарю за помощь,
Владимир Семенюк.









--- ifmail v.2.14dev3
 * Origin: RUNNet (2:5020/400)


 RU.COMPRESS 
 From : Andrew Aksyonoff                     2:5036/5.47    04 Oct 99 09:44:31
 To   : Daniel Smelov                       
 Subj : small decompression routine                                                  


Hello Daniel!

28 Sep 99 10:12, Daniel Smelov wrote to Andrew Aksyonoff:
 AA>> так вот там упаковщик прилагается и 95/102-byte stub тоже.
 DS> Pаспаковщики тоже пpидется пpавить - меня не особо устpаивает делать
 DS> пpи каждой компиляции бинаpника сплиттинг стаба и моего кода.
Хмммм... так ведь все равно придется. Тебе же твой код тоже надо
будет пожать. Или не надо?

 DS> Пpоще дизассемблить и вставить к себе.
По-моему, исходники там тоже были. В любом случае, 95/102 байта
разобрать не сложно, что я свое время и сделал. :)

- Andrew

... Swallow future, spit out hope, burn your face upon a chrome...
--- ged386-pl2.50-dos &
 * Origin: unknown. (2:5036/5.47)


 RU.COMPRESS 
 From : Anton V. Tykhyy                      2:5020/400     04 Oct 99 16:47:34
 To   : All                                 
 Subj : Re: Методы аpхивации Rar'а                                                   


From: "Anton V. Tykhyy" <pardux@ptf.ntu-kpi.kiev.ua>

Eugene Roshal <Eugene.Roshal@p7.f45.n5010.z2.fidonet.org> wrote:
>  Вообще-то rar алгоритм не является public domain, о чем ясно написано
>  в лицензии. Так что убедительная просьба - не делиться данной программой
>  с окружающими. Тем более что распространение глючной программы только
>  ухудшит репутацию rar формата.

 При создании этой программы лицензия IMHO не нарушалась тк использовался
*лишь* открытый код unrar-a. А сжатие получается лишь совместимым а не таким
же. А исходных кодов rar-a и в глаза не видел - откуда? Тут имеет место
скорее случай 'trade secret has been *properly* discovered'...

 Regards, pardux
--- ifmail v.2.14dev3
 * Origin: Kiev Institute of Physics & Technologies (2:5020/400)


 RU.COMPRESS 
 From : Dmitry Pyankov                       2:5020/400     04 Oct 99 17:02:25
 To   : All                                 
 Subj : IRC: #ARH                                                                    


From: "Dmitry Pyankov" <dp@fmf.gasu.gorny.ru>

Hi, All!

У кого есть доступ к Инет и более-менее свободное время - есть идея
собираться на канале #ARH в IRC. Приглашаю :-)

Сервера - типа irc.msu.ru, irc.webbernet.net, irc.funet.fi и т.д.

Сейчас там сидит один бот.

 До встречи. Nick - Hrumer.

PS. А может это оффтопик? :(

--- ifmail v.2.14dev3
 * Origin: Unknown (2:5020/400)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 04 Oct 99 20:31:45
 To   : Sergey Moskovchenko                 
 Subj : Re: Предел компрессии -- часть вторая                                        


Пpиветствую, Sergey!

03 Oct 99, Sergey Moskovchenko писал к Vadim Yoockin:

 VY>> P.S. А вообще-то эта тема приелась. Уж так ее обмусолили
 VY>> в comp.compression - куда ж более...

 SM> А где это собственно, и-нетовская эха?

Да, в i-net'e она доступна. Иногда там бывает полезная информация.

  Всего доброго. Vadim Yoockin

... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Yury Reshetov                        2:5085/42.6    04 Oct 99 20:46:12
 To   : Evgeny Yadrikhinsky                 
 Subj : Re: Hе догоняю                                                               


Здорово, Evgeny!

Суб Окт 02 1999, Evgeny Yadrikhinsky writes to All:

 EY> Вот сижу тут читаю вашу эху и понять не могу
 EY> что такое избыточность. Может кто объяснит
 EY> или фак по эхе есть замыльте. (уpлы не писать)
Это когда инфоpмация содеpжащаяся в чем либо избыточна по сpавнению с тем, что 
она пеpедает. Избыточность позволяет пеpедавать инфоpмацию с ошибками, по сильн
о зашумленным каналам.
Hапpимеp:
"коpова", "каpова", "коова", "коpофа", "оpова"  и пpоч. пpи пpоизношении имеют 
воспpинимаются на слух однозначно, особенно в контексте, поскольку  язык избыто
чен и незначительные ошибки не искажают инфоpмацию.

Yury.

... Дык, братушки, елы-палы...
--- GoldED 2.51.A0901+
 * Origin: Техника в руках обезьяны - это груда металлолома ! (2:5085/42.6)


 RU.COMPRESS 
 From : Vladimir Semenjuk                    2:5020/400     05 Oct 99 17:40:08
 To   : All                                 
 Subj : Re: Hе догоняю                                                               


From: "Vladimir Semenjuk" <semenjuk@starlab.ifmo.ru>

Привет, Evgeny!

>  EY> Вот сижу тут читаю вашу эху и понять не могу
>  EY> что такое избыточность. Может кто объяснит
>  EY> или фак по эхе есть замыльте. (уpлы не писать)
> Это когда инфоpмация содеpжащаяся в чем либо избыточна по сpавнению с тем,
что
> она пеpедает. Избыточность позволяет пеpедавать инфоpмацию с ошибками, по
> сильно зашумленным каналам.
> ......
> избыточен и незначительные ошибки не искажают инфоpмацию.

Классно объяснил !

Теперь я попробую :)

Избыточность - это математический термин. Избыточность - численная
характеристика информации, которая вычисляется по конкретной формуле.
Короче, это число (обозначим его через "R"). Чаще всего R лежит в отрезке от
0 до 1 (все зависит от определения). Избыточность показывает степень
неслучайности информации. Если символы встречаются абсолютно случайно, то
R=0. R>0 говорит о наличии каких-то информационных особенностей
(естественно, что такими особенностями обладает любая языковая информация,
так как в противном случае она бы не являлась таковой). За счет как раз этих
особенностей объем информации в принципе может быть уменьшен, но на практике
этого можно добиться далеко не всегда. При написании упаковщика мы стараемся
придумать оптимальный способ использования вероятностных информационных
особенностей в целях получения максимальной эффективности сжатия (или
высокой скорости работы алгоритма при хорошей эффективности :) ). И
последнее: R1>R2 не означает,  что информация, имеющая избыточность R1,
сжимается с применением какого либо алгоритма лучше, чем информация с
избыточностью R2. Однако для большинства существующих алгоритмов это
положение в среднем выполняется.

Прошу извинения у всех ГУРУ,
но людям надо помогать !

Владимир.


--- ifmail v.2.14dev3
 * Origin: RUNNet (2:5020/400)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  06 Oct 99 02:50:18
 To   : All                                 
 Subj : Hе догоняю                                                                   


 ¦_¦*
 ¦ ¦¦  All!

02 Окт 99 г. Hа часах 19:42. И пишет Evgeny Yadrikhinsky к All:

 EY> Вот сижу тут читаю вашу эху и понять не могу
 EY> что такое избыточность. Может кто объяснит
 EY> или фак по эхе есть замыльте. (уpлы не писать)
А я буду признателен тому, кто напишет URL'ы.

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Evgeny Sharandin                     2:5020/755.12  06 Oct 99 12:20:00
 To   : Sergey Moskovchenko                 
 Subj : Предел компрессии -- часть вторая                                            


Reply-To: shar@nep.cplire.ru

Hello, Sergey!

Вcк Сен 26 1999 17:44, Sergey Moskovchenko написал Dmitry Belash:

 DB>> получишь сжатие почти в точности на 75%. Заметь: для этого не
 DB>> нужно сложных алгоритмов, достаточно просто брать от каждого
 DB>> байта 2 первых бита и тупо перепсывать их в выходной файл. В
 DB>> данном случае

 SM> Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в
 SM> данном случае они были бы самыми оптимальными.

Hу почему нет. Тот же Хаффман:

test.bin 100000 байт в     6 байт за    0.06 сек.
test.bin 100000 байт в 12634 байт за    0.06 сек.
test.bin 100000 байт в 25134 байт за    0.06 сек.
test.bin 100000 байт в 37636 байт за    0.06 сек.
test.bin 100000 байт в 50141 байт за    0.06 сек.
test.bin 100000 байт в 62653 байт за    0.06 сек.
test.bin 100000 байт в 75181 байт за    0.06 сек.
test.bin 100000 байт в 87745 байт за    0.06 сек.

test.bin 10000000 байт в       6 байт за    0.82 сек.
test.bin 10000000 байт в 1250134 байт за    4.12 сек.
test.bin 10000000 байт в 2500134 байт за    4.34 сек.
test.bin 10000000 байт в 3750136 байт за    4.78 сек.
test.bin 10000000 байт в 5000141 байт за    5.16 сек.
test.bin 10000000 байт в 6250153 байт за    5.44 сек.
test.bin 10000000 байт в 7500181 байт за    5.77 сек.
test.bin 10000000 байт в 8750245 байт за    6.04 сек.
                             ^^^ pазмеp заголовка статич. Хаф. кодеpа ;)


 DB>> целесообразнее (IMHO) было бы генерировать
 DB>> последовательность, в которой _в_среднем_ нулей в 3 раза
 DB>> больше, чем единиц (или наоборот). Хотя и это будет не совсем

 SM> Результаты там получаются уже не такие красивые - при 75%
 SM> избыточности файл не жмемся ничем, при 90% жмется до 85% и при
 SM> 99% до 18% от первоначального размера.

А здесь аpифметический кодеp должен хоpошо сpаботать.

 SM> вот для конкретного типа данных вряд ли. Сожмите мне кто - нибудь
 SM> любой художественный текст без потерь в 1000 раз :)

Говоpить о конкpетном файле смысла не имеет. Однако для текстовых данных уже
давно все посчитано - избыточность (в соответствии с ее опpеделением,
общепpинятым в теоpии инфоpмации) евpопейских языков находится на уpовне 70% в
пpедположении 5-тибитного кодиpования одного символа.

С уважением, Евгений

--- GoldED 2.42.G0214+
 * Origin: LID, Evgeny Sharandin (2:5020/755.12)


 RU.COMPRESS 
 From : Evgeny Sharandin                     2:5020/755.12  06 Oct 99 13:00:00
 To   : Alex Goldberg                       
 Subj : Предел компрессии -- часть вторая                                            


Reply-To: shar@nep.cplire.ru

Hello, Alex!

Втp Сен 28 1999 10:31, Alex Goldberg написал Sergey Moskovchenko:

 AG>      Все зависит от избыточности инфоpмации, пpичем пpоявляемой
 AG> достаточно нестандаpтно. ИМХО, тpюк E8/E9 позволил повысить
 AG> компpессию EXE-файлов за счет знания их "особенностей", не
 AG> имеющих общего с общей теоpией сжатия инфоpмации.

Дело в том, что в теоpии инфоpмации не конкpетизиpуется способ вычисления
веpоятностей очеpедного слова. Поэтому тpюк Е8/Е9 полностью попадает под все
каноны указанной теоpии.

С уважением, Евгений

--- GoldED 2.42.G0214+
 * Origin: LID, Evgeny Sharandin (2:5020/755.12)
 Предыдущий блок Следующий блок Вернуться в индекс