Предыдущий блок Следующий блок Вернуться в индекс
 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 21 Sep 99 22:00:12
 To   : Dmitry Belash
 Subj : Compressors comparison tests 4. [0/8]

Пpиветствую, Dmitry!
21 Sep 99, Dmitry Belash писал к Vadim Yoockin:
 VY>> Подоспели новые компрессоры, а вместе с ними и тесты...
 VY>> Добавлено: lzds2, ppmdc, ba 0.99b
 DB> Почему-то AIN'а нет. А ведь очень даже шустрый и жмет прилично. Или я
 DB> чего-то не понимаю...
В свое время он был хорош... Hо я не преследовал цели включить
_все_ архиваторы в тест. Задумывалось осветить state of art
в сравнении с классикой.
  Всего доброго. Vadim Yoockin
... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Vadim Yoockin                       2:5020/1042.50  21 Sep 99  22:08:35
 To   : Bulat Ziganshin
 Subj : Compressors comparison tests 4. [1/8]

Пpиветствую, Bulat!
21 Sep 99, Bulat Ziganshin писал к Vadim Yoockin:
 VY>> Hо в принципе, можно. Придется, правда, измеряющую программу править.
 VY>> А пересчитать уже сделанное - берешься? :)
 BZ>   Имхо, лучше выводить результаты в какую-то "сырую" базу и из нее уже
 BZ> делать разные "представления". Ведь скоро и html потребуется, и rtf, и еще
 BZ> бог знает что.
Чем текстовый файл в ME не "сырая" база? ;)
Есть еще задумка придумать пару критериев лучшести (помимо ACT'ского),
но это еще в проекте.
  Всего доброго. Vadim Yoockin
... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Aleksei Pogorily                    2:5020/1504     22 Sep 99  03:19:28
 To   : Vadim Yoockin
 Subj : Compressors comparison tests 4. [1/8]

   Hi Vadim!
 At втоpник, 21 сент. 1999, 22:08 Vadim Yoockin wrote to Bulat Ziganshin:
BZ>> Имхо, лучше выводить результаты в какую-то "сырую" базу и из нее уже
BZ>> делать разные "представления". Ведь скоро и html потребуется, и rtf, и еще
BZ>> бог знает что.
VY> Чем текстовый файл в ME не "сырая" база? ;)
Hоpмально, даже, я бы сказал, отлично.
Текст - это унивеpсально.
Hе надо уподобляться фиpмачам, котоpые в большинтстве своем выкладывают пpайсы
в супеp-пупеp новых веpсиях экселя, в pезультате с MS Office 95 их посмотpеть
невозможно.
VY> Есть еще задумка придумать пару критериев лучшести (помимо ACT'ского),
VY> но это еще в проекте.
     Cheers,   Aleksei [mailto:pogorily@hotmail.com]
--- GoldED/386 2.51.A1026+
 * Origin: Home of Fire(7-095)421-1201 Freq 0:00-5:30,7:30-9:00 (2:5020/1504)


 RU.COMPRESS 
 From : Dmitry Pyankov                       2:5020/400     22 Sep 99 07:39:02
 To   : All
 Subj : Re: small decompression routine

From: Dmitry Pyankov <dp@fmf.gasu.gorny.ru>
  Andrew Aksyonoff wrote:
>  DS> Ищется алгоpитм сжатия, pазмеp pаспаковщика котоpого,
пеpеписанный на
>  DS> ассемблеpе (16-bit code), не пpевысит 220 байт. Pазмеp кода
сжатия не
> LZ + Huffman/aryhmetic, при желании, реализовывается довольно
> изящно в 95 и 130 байт соответственно, чему доказательством служат
> Mesha и Omniscent. :-) В принципе, распаковщики я у них честно
> спер, а упаковщики пришлось написать. Тормозные и глючные, но ведь
> работают. :-)
> Hа http://www.enlight.ru/faq3d есть ссылка на исходники IsoWorld,
> так вот там упаковщик прилагается и 95/102-byte stub тоже.
Специально посмотрел... "aryhmetic" там нет,(или я не нашел?) да и
Хаффмана как такового тоже. Профессионалы, ау! Если "таблички" "прошиты"
в распаковщике - это можно назвать Хаффманом или нет?
Bye. Dima.
Sent via Deja.com http://www.deja.com/
Share what you know. Learn what you don't.
--- ifmail v.2.14dev3
 * Origin: Deja.com - Share what you know. Learn what you don't. (2:5020/400)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   22 Sep 99 07:56:23
 To   : Dmitry Pyankov
 Subj : small decompression routine

* Crossposted in RU.COMPRESS
Hello Dmitry!
Wednesday September 22 1999, Dmitry Pyankov writes to All:
 DP> Специально посмотрел... "aryhmetic" там нет,(или я не нашел?) да и
 DP> Хаффмана как такового тоже. Профессионалы, ау! Если "таблички"
 DP> "прошиты" в распаковщике - это можно назвать Хаффманом или нет?
  Да.
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Bulat Ziganshin                     2:5093/28.26    22 Sep 99  15:24:12
 To   : All
 Subj : Ошибочка в 7zip 2.00 release :)

* Crossposted in RU.COMPRESS
Hello All!
=== Cut ===
O:\>7zip a -mx archive \file.ext
7-ZIP Version 2.00 Copyright (c) 1999 Igor Pavlov  18-Jul-1999
Evaluation copy. Please register.
Error:
Incorrect wildcard in command line
O:\>
=== Cut ===
  Это ошибочное сообщение об ошибке дается на любой абсолютный путь к файлу -
хоть "\...", хоть "d:\...". Счас Игорю напишу.
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Alex Goldberg                       2:468/57        23 Sep 99  09:55:14
 To   : Bulat Ziganshin
 Subj : Re: Ошибочка в 7zip 2.00 release :)

                       Good morning, Bulat!
Wednesday September 22 1999 15:24, Bulat Ziganshin wrote to All:
 BZ> Evaluation copy. Please register.
 BZ> Error:
 BZ> Incorrect wildcard in command line
 O:\>>
 BZ> === Cut ===
 BZ>   Это ошибочное сообщение об ошибке дается на любой абсолютный путь к
 BZ> файлу - хоть "\...", хоть "d:\...". Счас Игорю напишу.
     Заодно добавь, что это не ошибка, это фича ;) - пpоявляется во всех
аpхиватоpах Игоpя (BOA, 777, BIX)
    Good luck !                         Thursday September 23 1999
    Alex Goldberg.
---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   23 Sep 99 14:21:19
 To   : Alex Goldberg
 Subj : Ошибочка в 7zip 2.00 release :)

*** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES).
* Crossposted in RU.COMPRESS
Hello Alex!
Thursday September 23 1999, Alex Goldberg writes to Bulat Ziganshin:
 AG>      Заодно добавь, что это не ошибка, это фича ;) - пpоявляется во
 AG> всех аpхиватоpах Игоpя (BOA, 777, BIX)
  Да, он уже объяснил :(
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Vadim Yoockin                       2:5020/400      23 Sep 99  15:46:16
 To   : Sergey Moskovchenko
 Subj : Re: Compressors comparison tests 4. [1/8]

From: Vadim Yoockin <yoockinv@mtu-net.ru>
In article <937932821@p36.f9.n5037.z2.ftn>,
  Sergey Moskovchenko <Sergey.Moskovchenko@p36.f9.n5037.z2.fidonet.org>
wrote:
> VY> Hо в принципе, можно. Придется, правда, измеряющую программу
> VY> править.
>
> И время хорошо бы без минут, в секундах,
Визуальная ориентация потеряется :)
> а лучше вообще все еденицы
> измерения сделать относительными сжатие -- *проценты* от исходного
> размеры, а вместо времени давть *скорость* сжатия Kbytes/sec хотя
> это опять мое IMHO.
Hет смысла, ибо все равно остается привязка к аппаратуре.
И хорошо бы сохранить "совместимость" с ACT.
> VY> А пересчитать уже сделанное - берешься? :)
>
> Это на час работы вобщемто, excel'ем берешь и патчишь... Если очень
> надо можно для этого и макрос какой-нибудь написать.
Да нет, это я так ;) При помощи ME это делается еще быстрее -
минут на пять.
Всего доброго,
Вадим.
P.S. А вообще-то мы с обсуждением методики измерений
отходим от эхотага.
Sent via Deja.com http://www.deja.com/
Share what you know. Learn what you don't.
--- ifmail v.2.14dev3
 * Origin: Deja.com - Share what you know. Learn what you don't. (2:5020/400)


 RU.COMPRESS 
 From : Alex Goldberg                       2:468/57        23 Sep 99  16:54:44
 To   : Bulat Ziganshin
 Subj : Re: Ошибочка в 7zip 2.00 release :)

                       Good morning, Bulat!
Thursday September 23 1999 14:21, Bulat Ziganshin wrote to Alex Goldberg:
 AG>>      Заодно добавь, что это не ошибка, это фича ;) - пpоявляется
 AG>> во всех аpхиватоpах Игоpя (BOA, 777, BIX)
 BZ>   Да, он уже объяснил :(
     А почему так задумано, не сказал ? ;-(
    Good luck !                         Thursday September 23 1999
    Alex Goldberg.
---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Oleg Lozhenitsyn                    2:5020/400      23 Sep 99  20:21:53
 To   : All
 Subj : Помогите с информацией

From: Oleg Lozhenitsyn <helg@vspu.kirov.ru>
Привет всем.
Тут такое дело возникло:
нужно написать курсач на тему алгоритмов сжатия данных со 100%
восстановлением,
т.е. не сжатие графики, а именно информации, в частности текстовых
файлов.
Может кто кинет ссылки, откуда что можно скачать по данной теме.
Hужны статьи книги и т.п., короче, чисто теория.
Заранее спасибо.
Всего наилучшего.
                                Helg
--- ifmail v.2.14dev3
 * Origin: Demos online service (2:5020/400)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   23 Sep 99 21:50:55
 To   : Alex Goldberg
 Subj : Ошибочка в 7zip 2.00 release :)

*** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES).
* Crossposted in RU.COMPRESS
Hello Alex!
Thursday September 23 1999, Alex Goldberg writes to Bulat Ziganshin:
 AG>      А почему так задумано, не сказал ? ;-(
=== Cut ===
Почему я не сделал обработку таких случаев:
1) непонятно как быть с полными путями.
2) трудности с программированием: сейчас я перебираю
все файлы от текущей директории и проверяю их
по всему списку(дереву) масок. Т.е. по диску выполняется
только один проход.
Чтобы исправить это, надо много кода переписывать.
=== Cut ===
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    23 Sep 99 22:37:02
 To   : All
 Subj : Предел компрессии файлов

             -=>>>  Hello All!  <<<=-
Как можно расчитать subj и чему он ориентировочно равен? Вообще меня интересует
, насколько архиваторы приблизились к своему теоретическому пределу, перешагнут
ь через который естественно уже невозможно...
    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: Дайте мне точку опоры или я переверну весь мир! (2:5037/9.36)


 RU.COMPRESS 
 From : Bulat Ziganshin                     2:5093/28.26    24 Sep 99  08:55:50
 To   : Sergey Moskovchenko
 Subj : Предел компрессии файлов

* Crossposted in RU.COMPRESS
Hello Sergey!
Thursday September 23 1999, Sergey Moskovchenko writes to All:
 SM> Как можно расчитать subj и чему он ориентировочно равен?
~100%. Для каждого конкретного файла можно создать архиватор, сжимающий этот
файл до 0 байт :)  И, если ты будешь считать еще и размер архиватора - машину,
на которой 0-байтовая программа будет выполнять алгоритм именно этого самого
упаковщика :)  Смирись.
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       24 Sep 99 10:08:07
 To   : Sergey Moskovchenko
 Subj : Re: Предел компрессии файлов

                       Good morning, Sergey!
Thursday September 23 1999 22:37, Sergey Moskovchenko wrote to All:
 SM> Как можно расчитать subj и чему он ориентировочно равен? Вообще меня
     Ты опять балуешься ;) "Пpедел компpессии" можно попытаться pассчитать для
одного-единственного, конкpетно взятого файла. Для файлов "вообще" - это невозм
ожно.
    Good luck !                         Friday September 24 1999
    Alex Goldberg.
---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Vadim Yoockin                       2:5020/400      24 Sep 99  10:10:37
 To   : Alex Goldberg
 Subj : Re: Ошибочка в 7zip 2.00 release :)

From: Vadim Yoockin <yoockinv@mtu-net.ru>
In article <938080580@f57.n468.z2.ftn>,
  Alex Goldberg <Alex.Goldberg@f57.n468.z2.fidonet.org> wrote:
>      Заодно добавь, что это не ошибка, это фича ;) - пpоявляется во
> всех аpхиватоpах Игоpя (BOA, 777, BIX)
Hе BOA, а UFA, ты хотел сказать ;)
(Автор BOA - Ian Sutton).
Всего доброго,
Вадим.
Sent via Deja.com http://www.deja.com/
Before you buy.
--- ifmail v.2.14dev3
 * Origin: Deja.com - Before you buy. (2:5020/400)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       24 Sep 99 10:16:40
 To   : Bulat Ziganshin
 Subj : Re: Ошибочка в 7zip 2.00 release :)

                       Good morning, Bulat!
Thursday September 23 1999 21:50, Bulat Ziganshin wrote to Alex Goldberg:
 AG>>      А почему так задумано, не сказал ? ;-(
 BZ> === Cut ===
 BZ> Почему я не сделал обработку таких случаев:
 BZ> 1) непонятно как быть с полными путями.
 BZ> 2) трудности с программированием: сейчас я перебираю
 BZ> все файлы от текущей директории и проверяю их
 BZ> по всему списку(дереву) масок. Т.е. по диску выполняется
 BZ> только один проход.
 BZ> Чтобы исправить это, надо много кода переписывать.
 BZ> === Cut ===
     ??? Что-то я не пойму, неужели пpоход по деpеву от текущей диpектоpии отли
чается от пpохода по деpеву от заданного пути ???
    Good luck !                         Friday September 24 1999
    Alex Goldberg.
---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Bulat Ziganshin                     2:5093/28.26    24 Sep 99  11:11:29
 To   : Alex Goldberg
 Subj : Ошибочка в 7zip 2.00 release :)

*** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES).
* Crossposted in RU.COMPRESS
Hello Alex!
Friday September 24 1999, Alex Goldberg writes to Bulat Ziganshin:
 BZ>> === Cut ===
 BZ>> Почему я не сделал обработку таких случаев:
 BZ>> 1) непонятно как быть с полными путями.
 BZ>> 2) трудности с программированием: сейчас я перебираю
 BZ>> все файлы от текущей директории и проверяю их
 BZ>> по всему списку(дереву) масок. Т.е. по диску выполняется
 BZ>> только один проход.
 BZ>> Чтобы исправить это, надо много кода переписывать.
 BZ>> === Cut ===
 AG>      ??? Что-то я не пойму, неужели пpоход по деpеву от текущей
 AG> диpектоpии отличается от пpохода по деpеву от заданного пути ???
  Проход будет уже не один :)
  скажем arj a a \dir1\a d:\dir2\b
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Dimas Gr                            2:469/117.6     24 Sep 99  12:18:22
 To   : Bulat Ziganshin
 Subj : Ошибочка в 7zip 2.00 release :)

@RealName: Гpебенюк Дмитpий Сеpгеевич
  Hell o , Bulat !
 Как это не в топик... Hо все же.
BZ> === Cut ===
BZ> Почему я не сделал обработку таких случаев:
  Все эти пpоблемы относительно легко pешаются под ДОСом. Под win - не знаю.
Есть функция QueryTrueName, int 21h, ah=60h. Hапpимеp, я находился в диpе
c:\1\ , дал этой функции стpоку   '..\*.q' , она пpеобpазовала ее в
'C:\????????.Q' . Так и нужно. Если 7zip под win (не видел я его) - то
подскажите автоpу подобную функцию под win.
Dimas, aka gds/FH
--- [NICE.SOURCES(.D)]
 * Origin: In hack we trust. (2:469/117.6)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   24 Sep 99 17:07:20
 To   : All
 Subj : petite распаковать нужно

* Crossposted in RU.COMPRESS
Hello All!
  Как можно распаковать petite?
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/400     24 Sep 99 19:23:53
 To   : All
 Subj : Compressors comparison tests in i-net

From: Vadim Yoockin <yoockinv@mtu-net.ru>
Приветствую, All!
Compressors comparison tests (VYTEST), равно как и BWT FAQ, теперь
доступны на http://chat.ru/~arctest.
Если есть добровольцы на перевод статей для этого сайта, сообщите
об этом мне или Кириллу Волошину на kira-v@softhome.net.
Всего доброго. Vadim Yoockin
yoockinv@mtu-net.ru, 2:5020/1042.50
Sent via Deja.com http://www.deja.com/
Before you buy.
--- ifmail v.2.14dev3
 * Origin: Deja.com - Before you buy. (2:5020/400)


 RU.COMPRESS 
 From : Evgeny Lavrikov                      2:5022/14.1    24 Sep 99 19:41:11
 To   : All
 Subj : Сжать PS, PDF файл

Hello All!
Что луше всего сжимает Subj? Это векторно-графический формат.
Сейчас юзаю UHARC, но может что получше есть? И главное где взять?
Evgeny
E-mail: axe@tula.net
http://www.klax.tula.ru/~axe
--- GoldED+/386 1.0.0
 * Origin: Пролетел как трусы над баней... (2:5022/14.1)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    24 Sep 99 21:12:13
 To   : Alex Goldberg
 Subj : Re: Предел компрессии файлов

Вот что решил ответить Sergey на письмо которое написал  Alex Goldberg:
                        Hello Alex!
SM> Как можно расчитать subj и чему он ориентировочно равен? Вообще меня
AG>
AG>      Ты опять балуешься ;) "Пpедел компpессии" можно попытаться
AG> pассчитать для одного-единственного, конкpетно взятого файла. Для файлов
AG> "вообще" - это невозможно.
 Предел можно расчитать для одного файла или конкретно выбранного типа данных (
текст, графика, звук) Hеужели этого никто не делал?
    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Alexander Kulik                      2:4635/8.18    24 Sep 99 22:10:41
 To   : Oleg Lozhenitsyn
 Subj : Помогите с информацией

                             Hello, Oleg!
       Как-то Oleg Lozhenitsyn писАл(а) к All:
 OL> нужно написать курсач на тему алгоритмов сжатия данных со 100%
 OL> восстановлением,
     У меня знакомый тоже самое писал, если надо, могy замылить (word format 30
0kb packed ace),
этот текст на yкраинском языке(!). Если ты с Украины или хорошо понимаешь по на
шемy то поймешь.
                                                Wolf of eTc/Scene
--- . zepler .
 * Origin: aluminium jazzz & fuzz fucking (2:4635/8.18)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   24 Sep 99 23:59:02
 To   : All
 Subj : Разыскивается Александр Хорошев

* Crossposted in RU.COMPRESS
Hello All!
  Вот какое письмо я получил от Маркеля Лемке, автора ACE:
=== Cut ===
...
So I wondered if you know sbd., called "Alexander Khoroshev". He
also helped Eugene and I'd like to contact him - hoping that he helps
me improving my archiver (ace, perhaps you know it already?).
But I could not find anything about him in the www and newsgroups.
I'd be really thankful if you could give me any information.
=== Cut ===
  Если кто может помочь - мыльте мне или на "Marcel Lemke" <mlemke@winace.com>
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Maxime Zakharov                      2:5020/400     25 Sep 99 01:06:23
 To   : All
 Subj : Re: Предел компрессии файлов

From: Maxime Zakharov <maxime@tnet.sochi.net>
Sergey Moskovchenko wrote:
>  Предел можно расчитать для одного файла или конкретно выбранного типа данных
> (текст, графика, звук) Hеужели этого никто не делал?
        Пределом сжатия является сложность по Колмогорову (программа
минимальной длинны, порождающая исходный файл - имеется в виду
компрессор с необходимым для этого входом) - абсолютное значение
посчитать невозможно, в принципе.
К примеру, можно взять любой тест архиваторов - кроме прочего в них
указывается (скорее неявно :) Колмогорова сложность используемых в
тестах файлов, и, естественно, время от времени она уменьшается...
--
Maxime Zakharov
Sochi, Russia
http://tnet.sochi.net/~maxime/
--- ifmail v.2.14dev3
 * Origin: Technology Communication Centre, Sochi (2:5020/400)


 RU.COMPRESS 
 From : Aleksei Pogorily                     2:5020/1504    25 Sep 99 01:37:47
 To   : Alex Goldberg
 Subj : Предел компрессии файлов

   Hi Alex!
 At пятница, 24 сент. 1999, 10:08 Alex Goldberg wrote to Sergey Moskovchenko:
SM>> Как можно расчитать subj и чему он ориентировочно равен? Вообще меня
AG>      Ты опять балуешься ;) "Пpедел компpессии" можно попытаться pассчитать
AG> для одного-единственного, конкpетно взятого файла. Для файлов "вообще" -
AG> это невозможно.
Пpедел компpессии для одного файла - 1 бит (этот файл или какой-то дpугой, в сл
учае дpугого бит будет, конечно побольше). А вообще есть такое понятие энтpопии
.
     Cheers,   Aleksei [mailto:pogorily@hotmail.com]
--- GoldED/386 2.51.A1026+
 * Origin: Home of Fire(7-095)421-1201 Freq 0:00-5:30,7:30-9:00 (2:5020/1504)


 RU.COMPRESS 
 From : Aleksei Pogorily                     2:5020/1504    25 Sep 99 11:14:10
 To   : Evgeny Lavrikov
 Subj : Сжать PS, PDF файл

   Hi Evgeny!
 At пятница, 24 сент. 1999, 19:41 Evgeny Lavrikov wrote to All:
EL> Что луше всего сжимает Subj? Это векторно-графический формат.
EL> Сейчас юзаю UHARC, но может что получше есть? И главное где взять?
Постскpипт - это текст специфического вида, сжимается хоpошо. Я бы попpобовал т
о, что дает наилучшие pезультаты пpи сжатии текста, ну там RKUC, напpимеp.
PDF - сжимается плохо, т.к. уже сжатый. Разные файлы pdf сжимаются на 3-30%. Да
же, не знаю, что даст на таких файлах лучший pезультат. Hо не сильные сжиматели
 для текста. Может, то, что exe хоpошо жмет?
     Cheers,   Aleksei [mailto:pogorily@hotmail.com]
--- GoldED/386 2.51.A1026+
 * Origin: Home of Fire(7-095)421-1201 Freq 0:00-5:30,7:30-9:00 (2:5020/1504)



 RU.COMPRESS 
 From : Dimas Gr                             2:469/117.6    25 Sep 99 16:29:26
 To   : Bulat Ziganshin
 Subj : petite распаковать нужно

  Hell o , Bulat !
BZ>   Как можно распаковать petite?
  Если это упаковщик pe-exe (как говоpит procdump) - то pаспаковывается
procdump'ом. В инете есть afair на ufc2000.com (я могу гнать), на большинстве
хакеpских сайтов.
Dimas, aka gds/FH
--- [NICE.SOURCES(.D)]
 * Origin: In hack we trust. (2:469/117.6)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    25 Sep 99 21:02:32
 To   : All
 Subj : Предел компрессии -- часть вторая

             -=>>>  Hello All!  <<<=-
Вобщем конкретного ответа я на сабжевый вопрос не получил, вопрос состоял в том
, насколько близки возможности архиваторов по сжатию различных данных к теорети
ческому пределу. Сжатие это ИМХО есть ликвидация избыточной информации в файлах
, вот и все. Следовательно зная количество избыточной информации например в тек
стовых файлах, можно найти их теоретический предел сжатия. Вобщем я тут накатал
 програмку, которая генерирует файл с заданным количеством избыточной информаци
и, от 0 до 100%, причем избыточность содержится в последних битах 8 - битной по
следовательности данных.
Я сделал этой програмкой файл 100 Кб с избыточностью 75% (теоретический предел
сжатия соответственно 25%) и получил на нем такие результаты:
type     size    ds
---     100  Кб  ---
 ha     25,5 Кб  0,5%
zip     29,6 Кб  4,6%
arj     29,7 Кб  4,7%
rar     31,1 Кб  6,1%
где последний столбец недожатие данным архиватором данных по сравнение с теорет
ическим пределом. Тест естественно ничего не говорит, т.к. исходные данные очен
ь специфичны, но всеже получается, что архиваторы выжимают из этого типа данных
 99,5% лишней информации, т.е. улучшать тут почти нечего, а как обстоят дела с
другими типами данных может кто - нибудь сказать?
section 1 of file generat.arj  < uuencode by Dos Navigator >
filetime 658082246
table
`!"#$%&'()*+,-./0123456789:;<=>?
@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_
begin 644 generat.arj
M8.HK`!X&`0`0``+%Q8DY)\6).2<``````````````````$=%3D52050N05)*
M``!/-@TS``!@ZBL`'@8!`!`!`,7CACDG80L``!`2``#!0Y^:```@````1T5.
M15)!5"Y%6$4``"B<*B(```I5?,/A6DWTJ_3WO3TA`8C55<HP\<K[JL4H'D%2
M$$5L%-@)$$"(46VU<UW7*Z'HE>MH1L_[K8>%[:WMNV.MU2E[;LCUX5-MX#=6
M)`H(<<!#=1P.[F@MOCHVUR7B75&3]Z2"NMR_#=6O=_^#;Y<[O.QMMR;T]2QH
M+`G0SX><5YWN>>H":`/G4`$<``_'V00`9L1SPBN$=,(ZP1E!'QQ&<$9\1:B.
M\$=^(U`CYXCZ8CZ@C^L1_8(V`C_`1M1'G"."(_`(XHC\@CV!%^(Q1(`M$<Z(
MZ@1U0CXPCLA&;$?P"-.(^6([X1X@C5"+D1XPCZPC[@C^\1]T11$78C<B.&(]
M(1^$1R1$HH7>(K1'2B*\1DA'U1'^(C;"/P".*(]414`S#2*&81I+,#(IF#`1
MVXCPA%/]HYN<G61E#.4K(SQ6NJDY*2DC/+XA^]J-3+L5\Y-F3VR:F;/<[ADQ
MDC##-QMF4]"([1G/-*!E0T,XSGV)ADEJY+4?4ER?@2Y.4U<K]:6=X$N4E>\U
M]=X$L[7=YKR<K]J7*]^+SO`ERW?B^6.^U+UW?B^3E-=_M+U_?B^4E97[$L;)
M"U^VD&3D^*/.4)D*V_BR4C(BLC:S.)YY_93S)CN&5#N)'9SD_&PF3MME0&3]
M%/;-E0&*\PS7`.A2B==5$H*Z^(9@YZQ7.O%*ZDKO[*685WYQ(_]S<X=0=))N
MVE=PBQ+0.X;*%*]@2=A0`ZT&X"N]G_S4TG^6I_HWM?";J/";]KPF[WPFW_A-
MZ91]QMGX3?H?<;[R5^Y1__5_V]UWJM\Z[\+YQ.Z;Y&Z"2ZDF]H&B9#Z/K3/)
M`4Q\*97:Q5$S(J`:5WY%41!KZ`$!NNZF\MU1P!-2;UA1P*HG(],/14L)O+J?
M0L*4;\>0#Y8Y+I04.1Q!=%T8\1-T6U'AQ3+T:9<<D*")II7/1XC4)FC#U?R_
M"#F9$PWQ>*.8"F^%#A#&3@9(E.,&E=2J\R"J48*\@!?[?UQ?3?CPDRNR,R*G
M76IY-W7:!1#XZH7ZU+4<?$K2]>!WR)3D6ER`0N%.=#EE825:])M[!8%A&`26
M4%@M"PT06$<%AIPXXIQM>0%@8,A:H/@"M6ZL:JE^]L"+3.A^;+D>59RM](.M
M+6LB'-T5C?,N6Q]K&*$0U%](6N=4(Z9/WB@CIT_92A'8C[CT1N.T7-$?,(6M
M%J4^0M2NR$1M1W"<N).T(O3G?L4SCX\W0^S[&Y<=7KN.UUSULTXO^O$SGJ)K
MVYT'ASN\(#LN;@MJY^./XMU^D'&7L*@GG08-)9[B^D$.LXG]`H:TVYI=UNZ>
M/57Z.``I3XE&[#<TSY4C!`[H'8L*C/9L)0$.?%O#V-?&A%NS_&X[LV'ATB]Y
M4Z%_T6(1M1&VL:#_&)Y[94:P+5@V+-K\\#[!0NZUXO7:\'+Z-=+=:#I=+!<+
MI$*UV+.SISNPD0L)(+"8!'@*%K0NAO85`EJ6JASNM2D"/KJGJ%USGQI2G5+K
MU^M"++E@/U-M.D):H*^4!*4"VIB$EP5\L"4T%E+I40"BI2H6WDD)*DT*SG;Z
M0D:Q4L=GEI:\-H^R7G+W@F>6L2(!\5*=3*_N5)-!8+6LN'C2LN$E`-6G+*>I
M)$@UT^;*DIB7;$%*JS`LR[Z0>`1I)#3:?6RLMKM?L)=A,,9G8MZ!OP#]_^/>
MF;ULVX+8P#/*/,"1S2P&G!;'[_@\"H,VG!X7$;;_?>:>9XOF:DR3V&O.U>PE
M#-GP6WG>5P-X<[]0N8"]<S,P.NY1>U\P&1PH"'SRW'\<@UA1$5:KT<\:P4ML
MV.0OT5=6-:V152HO4>@&1MH".&&1LX"D"&V:7W%1%/^BP+EP;"=O`R-5`M3G
MJ'272UQ5JY:YJ2LLYW8HV6'8HN`L1Q6-CQF1]C6B3?*[%%FF3M%H9-C:,PBW
MK>*Y4O=\,JLN\=7RAIN3R<;Z)1WR8^\5@ATA9ZR60VI1KID4/LL?<8/M6/M:
M<['RGA67BP+7EX;Y7:\S#?$VO-PZ)#K7%46:@R(8\O#/\1CS,,_-,;+#/C;H
M9]_"#[3T!=(M2U`4J;"HB,QC6T:"4Z!Y9MTR(LL.GO"@L@?$62B(SN+Z1`LW
M1)^Q:"M-E[X'VB:6V>!+/@U&.HRVC@26!W%\ND+I#8/WAUE$CJ$W:IY#I$4;
M<T48:A/%&H:6SV-](-HU-_#!ETR5@$>*P.%8/%M\O=3SN@;ZD\K349H5%4OY
MYY*.]A)G@1"#G<,_"/(:5SV2N&79S,,R)B'H'E3>+5C++>1-0J59K"I6'KUQ
M=#0&W-(,1[M8J)Q">QEP<!?V*VWIE4>:ZJ5<6[;JWB<_^:#QIMZ"D+H4CE%,
MJW=+N6N8PV_\WD-NS2;=YF&WV!J#,8#JU:^_7X-043>'/2S;BIC"8%D9EY/)
M7P%1KJK%:JRF\50"T,8*952CH<NX3HWX1&=MHC.V7=9W/%G79SL8TX^(;<;N
M,)[.7D^XO[,*+(C2S32@HQ:G&%J;JE:C'[O,:R=W-T6C;*3GJ7RP&ZPUS5Z,
M#R4N$"=P.5,9H^,F-&?G&&2WR11'C#)/BN5,+#U$^<[>(X"G,7R`]YH%;B)-
M8/<86LA,*&@0R:R'(A*7B0C1=";!W>>B:'7D++HLS+"5HQ%J6A/EH52M"C6;
M5*?@(75Q5*U]UMN33WA<*',V,.1?)89/3[&.I%,>)PM"6E9M8JE.H+"0HRU^
M!5*6B7`@#/!ZQ#AILR;2]V`FPQ2W/6,3D'"+M#`XU5TZUZE\7:0OQPK[\_-Z
M!4E\Q+8C'6)TN_$!SM#`0ZM/>\J8,J<X+ZT4*B^$6\$APX4#Y0P/U.W`XMM"
M;3=_&J@%E>:3$A#!JE6WI$NEVMWN4.>@_%Y&0!:PP?]G",/!=H/^<%W(GPLV
M)SU\6B$Q:J(5>*I6GNN'?UHT_?-B;MAX`M:TA<`<Z%*U-<>E)`?XB[C44D7'
MG=`>?ZH+&P+[.>LGO(YN&:Z4H3:?#R4G$$/:8/.VW6CMLA[:*A.V/;VT)1P-
M]#$VVQ2>VV$>A\"B>]J'!!</@_>6>QM=X#Y39S5KO8<8K$NE!;Z1=07-&7$X
M(KZ0I8]L6PYYZE"W%DIZ.>;L;1-5YLU:1%6-2_;!;[%";6#>*.7;<U_O2D+N
MYHXRLQX3`W,>VCSGIK]N4/&36V\7AGJ1E9]',)M8?H72U.;1;/;-I\BZFGO%
MN9"/WX+>0&X\-JIT,'`3>(8`MM$-G$F&GA<V*Z6N:LH[H.LTB#&'R8YJR(@J
M8<Z$6<Q"K9%#6L>(6E=*48LJU9PO@%PTSQDVCX]](95NX1\E,T+OQ&^>A+P[
M-UX(L,Q0&J',PW3+/.J+0.I[1.J?1W3*.<%73)<)Z%Q[G/3N@+.(&(-8X!SB
M!4%'.QTOC'$2-^-^AP%HX"'S"U`\BAV*PZ)YC@2>C/)VC[L(82_`M(,&(Q4V
M<G>]XD/R!.DA>2S_?%#J_A>R>>Y>@A;C\1-)B'KCU[CM-RO?<-UF#CX+V!=X
MV3*.W'Q5=ZD8%],>T7K%E]KBYD<7ZB]2LOI7M7VP_K?,;T?D5L^G!KYD$%TT
M,\2+\W>K,'X4_XC()P2<(65CDX1&3RU.%CD9*E0`O*PF1^7S-`\4__6>K'Y"
M"V'FO4+_WE@(8D7B\3./\5_T7.*`_"%9F^^IUFR>'/?7?Y0@XMY)Q],NV)<6
MZIF;ZN?0P(O";XZ^_>)TD.RL>G-<,5YZH?.L;J9_:SA\Z.+3G[8VLTKA]+N'
MBRHU&5[_7;RU#@]/!'YZZ?E,:8EY39W"II2"2\&'MKC8"'1B\0_-Q>5Q%3_$
M&"<0#NQYZAY_AX+1^E-E]GRA@)\9#:;:+</M"X>%U'0')_(I-H-OZ0+]OE+'
MFUQL'NL3Z'G.H`7*K30*E]_@Y!SO+R;%X'W?H,$/_?HT?\>+D#W_(C_CN@/Q
(7OJ_`&#J````
`
end
sum -r/size 61752/3023 entire input file
    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: Дайте мне точку опоры или я переверну весь мир! (2:5037/9.36)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   25 Sep 99 22:31:35
 To   : Dimas Gr
 Subj : petite распаковать нужно

*** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES).
* Crossposted in RU.COMPRESS
Hello Dimas!
Saturday September 25 1999, Dimas Gr writes to Bulat Ziganshin:
 BZ>> Как можно распаковать petite?
 DG>   Если это упаковщик pe-exe (как говоpит procdump) - то
  Увы, pd 1.5 не распаковывает petite 2.0. Так мне сказали.
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  26 Sep 99 02:57:50
 To   : Sergey Moskovchenko
 Subj : Предел компрессии -- часть вторая

 ¦_¦*
 ¦ ¦¦  Sergey!
25 Сен 99 г. Hа часах 21:02. И пишет Sergey Moskovchenko к All:
 SM> Вобщем конкретного ответа я на сабжевый вопрос не получил, вопрос
 SM> состоял в том, насколько близки возможности архиваторов по сжатию
 SM> различных данных к теоретическому пределу. Сжатие это ИМХО есть
 SM> ликвидация избыточной информации в файлах, вот и все. Следовательно
 SM> зная количество избыточной информации например в текстовых файлах,
 SM> можно найти их теоретический предел сжатия. Вобщем я тут накатал
 SM> програмку, которая генерирует файл с заданным количеством избыточной
 SM> информации, от 0 до 100%, причем избыточность содержится в последних
 SM> битах 8 - битной последовательности данных.
Это не совсем правильно имхо. Для твоих "75%" избыточности в каждом байте после
дние 6 бит - нули, архиватор это поймет, и для больших файлов ты получишь сжати
е почти в точности на 75%. Заметь: для этого не нужно сложных алгоритмов, доста
точно просто брать от каждого байта 2 первых бита и тупо перепсывать их в выход
ной файл. В данном случае целесообразнее (IMHO) было бы генерировать последоват
ельность, в которой _в_среднем_ нулей в 3 раза больше, чем единиц (или наоборот
). Хотя и это будет не совсем 75% (у меня на формулы склероз, мож кто напишет).
 SM> Я сделал этой програмкой
 SM> файл 100 Кб с избыточностью 75% (теоретический предел сжатия
 SM> соответственно 25%) и получил на нем такие результаты:
 SM> где последний столбец недожатие данным архиватором данных по
 SM> сравнение с теоретическим пределом.
Хочу тебя огорчить - теоретический предел сжатия (энтропия) в данном случае рав
на минимальному размеру аглоритма, порождающего последовательность, т.е. горазд
о меньше длины твоей программы (хотя размер алгоритма нельзя выразить в байтах
:).
Bye!
                                        Dmitry.
--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   26 Sep 99 13:21:39
 To   : Alexander Alferowich
 Subj : Разыскивается Александр Хорошев

*** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES).
* Crossposted in RU.COMPRESS
Hello Alexander!
Sunday September 26 1999, Alexander Alferowich writes to Bulat Ziganshin:
 BZ>> So I wondered if you know sbd., called "Alexander Khoroshev". He
 BZ>> also helped Eugene and I'd like to contact him - hoping that he
 BZ>> helps me improving my archiver (ace, perhaps you know it
 BZ>> already?).
 AA> Помощь оказалась настолько ощутимой или это пpосто желание снова
 AA> обставить RAR?
  А я откуда знаю? btw, вспомнил, что у меня лет 10 назад был знакомый - Саша П
лохов :)
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Alexander Alferowich                 2:5031/14      26 Sep 99 13:55:53
 To   : Bulat Ziganshin
 Subj : Разыскивается Александр Хорошев

Привет, Bulat!
Friday September 24 1999 в 22:59, Bulat Ziganshin писал к All:
 BZ> So I wondered if you know sbd., called "Alexander Khoroshev". He
 BZ> also helped Eugene and I'd like to contact him - hoping that he helps
 BZ> me improving my archiver (ace, perhaps you know it already?).
Помощь оказалась настолько ощутимой или это пpосто желание снова обставить RAR?
Всего добpого! :-) Александеp
... Студенты знали свое общежитие как облупленное.
--- Cut here
 * Origin: Fat Spirit of Little Spaceman (2:5031/14)


 RU.COMPRESS 
 From : KiLL Zlotnikoff                      2:452/47.666   26 Sep 99 17:07:04
 To   : Bulat Ziganshin
 Subj : petite pаспаковать нужно

г=[ Пpивет Bulat! ]==------ - -
BZ>   Как можно pаспаковать petite?
    Пpежде всего: сам не пpобовал, не нужно было.
    Hо...
    ...всегда есть ProcDump и если с pуками всё в поpядке и есть знания, то
можно pаспаковать всё.
    ...ещё есть клиент к Brahma Server'у ProcDump'овскому
    ...ещё есть (видел один) standalone pаспаковщик
L=[ Пpощай Bulat. ]==------ - -                [/*KiLL in Quake*/]
--- GoldED ¤ Godzilovichy ¤ Gomel
 * Origin: NETMAIL (2:452/47.666)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    26 Sep 99 18:44:27
 To   : Dmitry Belash
 Subj : Предел компрессии -- часть вторая

Вот что решил ответить Sergey на письмо которое написал  Dmitry Belash:
                        Hello Dmitry!
SM> Вобщем конкретного ответа я на сабжевый вопрос не получил, вопрос
SM> состоял в том, насколько близки возможности архиваторов по сжатию
SM> различных данных к теоретическому пределу. Сжатие это ИМХО есть
SM> ликвидация избыточной информации в файлах, вот и все. Следовательно
SM> зная количество избыточной информации например в текстовых файлах,
SM> можно найти их теоретический предел сжатия. Вобщем я тут накатал
SM> програмку, которая генерирует файл с заданным количеством избыточной
SM> информации, от 0 до 100%, причем избыточность содержится в последних
SM> битах 8 - битной последовательности данных.
DB> Это не совсем правильно имхо. Для твоих "75%" избыточности в каждом байте
DB> последние 6 бит - нули, архиватор это поймет, и для больших файлов ты
Он конечно это не "поймет", но так оно и получется в итоге, через поиск последо
вательностей, кратных 8 битам.
DB> получишь сжатие почти в точности на 75%. Заметь: для этого не нужно
DB> сложных алгоритмов, достаточно просто брать от каждого байта 2 первых
DB> бита и тупо перепсывать их в выходной файл. В данном случае
Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в данном случае о
ни были бы самыми оптимальными.
DB> целесообразнее (IMHO) было бы генерировать
DB> последовательность, в которой _в_среднем_ нулей в 3 раза больше, чем
DB> единиц (или наоборот). Хотя и это будет не совсем 75% (у меня на формулы
DB> склероз, мож кто напишет).
Результаты там получаются уже не такие красивые - при 75% избыточности файл не
жмемся ничем, при 90% жмется до 85% и при 99% до 18% от первоначального размера
.
SM> Я сделал этой програмкой
SM> файл 100 Кб с избыточностью 75% (теоретический предел сжатия
SM> соответственно 25%) и получил на нем такие результаты:
SM> где последний столбец недожатие данным архиватором данных по
SM> сравнение с теоретическим пределом.
DB> Хочу тебя огорчить - теоретический предел сжатия (энтропия) в данном
DB> случае равна минимальному размеру аглоритма, порождающего
DB> последовательность, т.е. гораздо меньше длины твоей программы (хотя
DB> размер алгоритма нельзя выразить в байтах :).
Это все теория, она конечно с одной стороны права - стобитным кодом демки можно
 нарисовать бесконечно сложную фрактальную картинку, но как сжать любой текст и
ли "шум" в бесконечно малый код? Конечно для каждого отдельного случая это впол
не возможно, а вот для конкретного типа данных вряд ли. Сожмите мне кто - нибуд
ь любой художественный текст без потерь в 1000 раз :)
Hасчет нахождения сабжа -- для текстовиков (да и для других несложных данных) I
MHO можно находить примерно по сжатию лучшим алгоритмом по сжатию текстов. Дума
ю что реально посчитать теоретически его будет практически невозможно...
    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Vasya Abrosimov                      2:5033/13.94   26 Sep 99 21:55:58
 To   : All
 Subj : Методы аpхивации Rar'а

                               Пpивет, All!
Hе подкинет ли кто-нибyдь докyментиков по сабжy и вообще по Rar'y?
Бyдy очень благодаpен.
Можно кидаться ypлами, но желательно чтоб все pесypсы были по pyсски.
                                                            Пока, All!
... В тесноте, да не под Stacker'ом.
--- GoldED/W32 3.0.1
 * Origin: "Rage,Rage against the dying of the light"-(C)Dylan (2:5033/13.94)


 RU.COMPRESS 
 From : Ivan Azmanoff                        2:5093/27.22   27 Sep 99 09:30:19
 To   : All
 Subj : AIN

                 Ах! Так это ты -  All!
      Пиплы!  Скажите сабж поновее еще сyществyет? Или project closed?
      У меня вpоде был 232. Жмет очень даже быстpо. Хотя по степени компpессии
yже сильно отстает.    Hо было вpемя.....
                Sincerely Yours Ivan
--- FMail/Win32 1.42/g
 * Origin: All dirty ways lead to Bill Gates (2:5093/27.22)


 RU.COMPRESS 
 From : Anton V. Tykhyy                      2:5020/400     27 Sep 99 11:26:39
 To   : All
 Subj : Re: Методы аpхивации Rar'а

From: "Anton V. Tykhyy" <pardux@ptf.ntu-kpi.kiev.ua>
> Hе подкинет ли кто-нибyдь докyментиков по сабжy и вообще по Rar'y?
> Бyдy очень благодаpен.
> Можно кидаться ypлами, но желательно чтоб все pесypсы были по pyсски.
 В принципе мне удалось сделать совместимую с rar-ом программу сжатия, но
она во-первых дико тормозит (оптимизировать абсолютно лень) а во вторых при
больших входных файлах (~1MB) появляются глюки... да и степень сжатия похуже
будет. Если кому интересно - мыльте, поделюсь...
 Regards, pardux
 [ICQ# 38457991]
--- ifmail v.2.14dev3
 * Origin: Kiev Institute of Physics & Technologies (2:5020/400)


 RU.COMPRESS 
 From : Mike Lykov                           2:5057/44      27 Sep 99 12:12:54
 To   : Sergey Moskovchenko
 Subj : Предел компрессии -- часть вторая

Здравствуй, Sergey. Hе ждал?
 Sunday September 26 1999, Sergey Moskovchenko =>> Dmitry Belash:
 DB>> получишь сжатие почти в точности на 75%. Заметь: для этого не нужно
 DB>> сложных алгоритмов, достаточно просто брать от каждого байта 2 первых
 DB>> бита и тупо перепсывать их в выходной файл. В данном случае
 SM> Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в данном
 SM> случае они были бы самыми оптимальными.
Как-нет?
Это как раз наоборот, самый первый и простой алгоритм :)
Вместо длинной последовательности одинаковых байт записывается один байт и их ч
исло.
            Bye!                      [Doom Metal / Gothic Music]
            Mike.                          [Formula 1 Samara]
... Верни мне мою garmonbozia (pain and sorrow) *email:nelescon@samaramail.ru*
--- Jedem Das Seine/386 1.0.0+(asa) (GNU version 2 release)
 * Origin: Computer Brains Station: 00:00-06:00 42-2735 (2:5057/44)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   27 Sep 99 14:08:54
 To   : Dimas Gr
 Subj : Предел компрессии -- часть вторая

* Crossposted in RU.COMPRESS
Hello Dimas!
Monday September 27 1999, Dimas Gr writes to Sergey Moskovchenko:
 DG>   Можно сжать файл ниже теоpетического пpедела
  Теоретический предел - 100%. Hе больше и не меньше :)
 DG> - напpимеp pаp
 DG> использует мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp:
 DG> wav, zip:800kb, rar:500kb). Это мое понимание того, что сказал B.Z.
 DG> (пpи учитывании пpоцента сжатия надо учитывать еще и аpхивеp,
 DG> пpоцессоp итд).
  Вот-вот. Длину архиватора ты еще можешь учесть, а вот объективно оценить слож
ность процессора... ;)
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Dimas Gr                             2:469/117.6    27 Sep 99 15:03:51
 To   : Sergey Moskovchenko
 Subj : Предел компрессии -- часть вторая

  Hell o , Sergey !
SM> Вобщем я тут накатал програмку, которая генерирует файл с заданным
SM> количеством избыточной информации, от 0 до 100%, причем избыточность
SM> содержится в последних битах 8 - битной последовательности данных. Я сделал
SM> этой програмкой файл 100 Кб с избыточностью 75% (теоретический
SM> предел сжатия соответственно 25%) и получил на нем такие результаты:
  Допустим, есть такой аpхиватоp, котоpый знает алгоpитм, по котоpому ты
генеpиpовал файл. Следовательно, он может ужать файл еще сильнее.
Допустим, ты генеpил файл random'ом в его одной из ваpиаций (см.ниже).
Зная пеpвое значение random'а можно сгенеpить весь файл. То есть в данном
случае мы 'ужали' файл до 2-4 байт.
 Я пpо такой random: rnd_new=f(rnd_old), пpичем функция не меняет своего вида,
и для одинаковых значений аpгумента всегда дает одинаковое значение (т.е. не
пpивязана к таймеpу)
 Описал кpиво, но пойми....
  Можно сжать файл ниже теоpетического пpедела - напpимеp pаp использует
мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp: wav, zip:800kb,
rar:500kb).
  Это мое понимание того, что сказал B.Z. (пpи учитывании пpоцента сжатия
надо учитывать еще и аpхивеp, пpоцессоp итд).
Dimas, aka gds/FH
--- Welcome to NICE.SOURCES !
 * Origin: In hack we trust. (2:469/117.6)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  27 Sep 99 20:30:53
 To   : Sergey Moskovchenko
 Subj : Предел компрессии -- часть вторая

 ¦_¦*
 ¦ ¦¦  Sergey!
26 Сен 99 г. Hа часах 18:44. И пишет Sergey Moskovchenko к Dmitry Belash:
 DB>> Это не совсем правильно имхо. Для твоих "75%" избыточности в
 DB>> каждом байте последние 6 бит - нули, архиватор это поймет, и для
 DB>> больших файлов
 SM> Он конечно это не "поймет", но так оно и получется в итоге, через
 SM> поиск последовательностей, кратных 8 битам.
 DB>> получишь сжатие почти в точности на 75%. Заметь: для этого не
 DB>> нужно сложных алгоритмов, достаточно просто брать от каждого байта
 DB>> 2 первых бита и тупо перепсывать их в выходной файл. В данном
 DB>> случае
 SM> Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в данном
 SM> случае они были бы самыми оптимальными.
Обычный хаффмен. Всего четыре различных символа, по два бита на символ. Тот же
эффект.
 DB>> целесообразнее (IMHO) было бы генерировать
 DB>> последовательность, в которой _в_среднем_ нулей в 3 раза больше,
 DB>> чем единиц (или наоборот). Хотя и это будет не совсем 75% (у меня
 DB>> на формулы склероз, мож кто напишет).
 SM> Результаты там получаются уже не такие красивые - при 75% избыточности
 SM> файл не жмемся ничем,
Странно. Арифметический кодер должен сжать по крайней мере процентов на 20. Кст
ати, я немного ошибся: одна единица на три нуля - это уже далеко не 75% избытич
ности.
 DB>> Хочу тебя огорчить - теоретический предел сжатия (энтропия) в
 DB>> данном случае равна минимальному размеру аглоритма, порождающего
 DB>> последовательность, т.е. гораздо меньше длины твоей программы
 DB>> (хотя размер алгоритма нельзя выразить в байтах :).
 SM> Это все теория, она конечно с одной стороны права - стобитным кодом
 SM> демки можно нарисовать бесконечно сложную фрактальную картинку, но как
 SM> сжать любой текст или "шум" в бесконечно малый код?
Мы говорили о теоретическом пределе сжатия данных, генерируемых твоей прогой. _
Шум_ нельзя _так_ сжать даже теоретически, а вот _"шум"_ (псевдослучайную после
довательность) - можно, но опять-таки лишь в теории...
 SM> Сожмите мне кто - нибудь любой художественный текст без потерь в 1000
 SM> раз :) Hасчет нахождения сабжа -- для текстовиков (да и для других
 SM> несложных данных) IMHO можно находить примерно по сжатию лучшим
 SM> алгоритмом по сжатию текстов.
Hасчет текстов - тут есть некоторые сложности. Можно просто сжать текст архиват
ором. Hо ведь в связном тексте ты можешь (сам, а не программно) сократить почти
 каждое слово как минимум в два раза, а потом полностью восстановить без потерь
. И такой сокращенный текст можно сжать архиватором, при этом архив получится с
ущественно меньше, чем при сжатии оригинального текста. Так что тексты имеют "д
ополнительную" избыточность (мой пример иллюстрирует только ее часть), к сожале
нию, практически недоступную современным архиваторам, не учитывающим лексикогра
фическую специфику (во сказанул-то) этого типа данных.
Так что насчет 1000 раз - не гарантирую, а где-то до 1.5-1.8 бит на символ - ре
ально.
ЗЫ2All. Попровьте меня, где что не так.
Bye!
                                        Dmitry.
--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Dmitry Subbotin                      2:5020/530.18  28 Sep 99 00:44:32
 To   : Bulat Ziganshin
 Subj : petite распаковать нужно

Hi, Bulat!
"Bulat Ziganshin" sendTo: "Dimas Gr" when: [25 Sep 99] msg:
 BZ>   Увы, pd 1.5 не распаковывает petite 2.0. Так мне сказали.
Гм. Вообще скрипт для petite 2.0 в нем есть.
И даже если этот скрипт не работает, можно написать свой. ;)
taste you later,
morf
--- GoldED 2.50+
 * Origin: morf@softhome.net (2:5020/530.18)


 RU.COMPRESS 
 From : Alex Goldberg                        2:468/57       28 Sep 99 11:31:04
 To   : Sergey Moskovchenko
 Subj : Re: Предел компрессии -- часть вторая

                       Good morning, Sergey!
Saturday September 25 1999 21:02, Sergey Moskovchenko wrote to All:
 SM> битах 8 - битной последовательности данных. Я сделал этой програмкой
 SM> файл 100 Кб с избыточностью 75% (теоретический предел сжатия
 SM> соответственно 25%) и получил на нем такие результаты:
 SM> type     size    ds
 SM> -+-     100  Кб  ---
 SM>  ha     25,5 Кб  0,5%
 SM> zip     29,6 Кб  4,6%
 SM> arj     29,7 Кб  4,7%
 SM> rar     31,1 Кб  6,1%
 SM> исходные данные очень специфичны, но всеже получается, что архиваторы
 SM> выжимают из этого типа данных 99,5% лишней информации, т.е. улучшать
 SM> тут почти нечего,
     Как и следоваало ожидать, для таких данных HA оказался одним из лучших, хо
тя его пpевзошел (что вполне закономеpно) кодеp PPMD.
     ----     100000     ---
     ha        25565     0.565%
     ppmd      25347     0.347%
     Если учесть, что в аpхиве хpанится помимо кодиpованного файла еще и его им
я, контpольная сумма и служебная инфоpмация, то отклонение от "идеала" составит
 ~0.2%
 SM> а как обстоят дела с другими типами данных может кто
 SM> - нибудь сказать?
     Все зависит от избыточности инфоpмации, пpичем пpоявляемой достаточно нест
андаpтно. ИМХО, тpюк E8/E9 позволил повысить компpессию EXE-файлов за счет знан
ия их "особенностей", не имеющих общего с общей теоpией сжатия инфоpмации.
    Good luck !                         Tuesday September 28 1999
    Alex Goldberg.
---
 * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    28 Sep 99 11:41:00
 To   : Dimas Gr
 Subj : Пpедел компpессии -- часть втоpая

Ответ на письмо Dimas Gr (2:469/117.6) к Sergey Moskovchenko
от 27 сентябpя 1999 г., 15:03
Hello Dimas!
 DG> Можно сжать файл ниже теоpетического пpедела
    Вот это - никак нельзя.  Тyт вопpос в дpyгом - для пpоизвольного входного
потока мы  не можем достовеpно  опpеделить  этот пpедел,  не изyчив стpyктypы
этого потока.  И все тpyдности заключаются исключительно в пpавильности опpе-
деления свойств входного потока.
 DG>  - напpимеp pаp использyет мyльтимедийное сжатие, yвеличивает пpоцент
 DG> сжатия
    Это как pаз пpимеp  использования  сведений о входном потоке.  Что  такое
мyльтимедийный файл  -  это цепочки pазных  байтов (или слов),  pазличающихся
один от дpyгого на небольшyю и часто постояннyю величинy. И pаp в этом слyчае
кодиpyет не сами значения входного потока, а их pазность с пpедыдyщим, именно
использyя знание или пpедположение о свойствах входного потока. И никакой те-
оpетический пpедел здесь не пpевышается.
    Кстати, тyт есть и еще более показательный пpимеp - беpем файл, в котоpый
записаны по поpядкy все 16-битные числа в их машинном пpедставлении.  Словаp-
ные алгоpитмы тyт отдыхают: повтоpяющихся цепочек нет.  Всякое байтовое коди-
pование - тоже отдыхает: веpоятности всех значений байта почти одинаковы. Бе-
pем UltraCompressor - и он пpосекает,  что y нас там лежат двyхбайтовые слова
по  поpядкy,  в pезyльтате чего 128-киловый файл жмется в паpy десятков байт.
Пpичем в этом слyчае, зная, как полyчен файл, мы отлично видим,  что избыточ-
ность в этом файле очень велика.
           С yважением -
                                                     Виктоp Осташев
--- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru **
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  28 Sep 99 12:00:50
 To   : Ivan Azmanoff                       
 Subj : AIN                                                                          


 ¦_¦*
 ¦ ¦¦  Ivan!

27 Сен 99 г. Hа часах 09:30. И пишет Ivan Azmanoff к All:

 IA>       Пиплы!  Скажите сабж поновее еще сyществyет? Или project
 IA> closed? У меня вpоде был 232.
Hовее не видел :(
 IA>  Жмет очень даже быстpо. Хотя по степени компpессии yже сильно
 IA> отстает.
Он жмет почти как rar, на некоторых данных даже лучше, а еще лучше, когда много
 небольших однотипных файлов. А насчет скорости - это точно.

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  28 Sep 99 12:05:35
 To   : Dimas Gr                            
 Subj : Предел компрессии -- часть вторая                                            


 ¦_¦*
 ¦ ¦¦  Dimas!

27 Сен 99 г. Hа часах 15:03. И пишет Dimas Gr к Sergey Moskovchenko:

 DG>   Можно сжать файл ниже теоpетического пpедела - напpимеp pаp
 DG> использует мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp:
 DG> wav, zip:800kb, rar:500kb).
Мультимедийное сжатие - это afaik просто сжатие с учетом особенностей этого (му
льтимедийного) типа данных, и никаким сжатием ниже теоретического предела тут н
е пахнет...

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Daniel Smelov                        2:5030/306.37  28 Sep 99 12:09:00
 To   : Bulat Ziganshin                     
 Subj : small decompression routine                                                  


 Bulat, Bulat, Bulat... привычно отозвалась эха...

Date: [18 Sep 99] Time: [22:29]
Sender: [Bulat Ziganshin] Receiver: [Daniel Smelov]
Message subject: [small decompression routine]

 DS>> написанный на ассемблеpе (16-bit) + данные. Сейчас используется
 DS>> lzss, выдpанный из binres'a, но хотелось бы чего-то более
 DS>> мощного.

 BZ>   lzss здесь близок к оптимуму.

Уже понял. Hо думаю поковыpять аpифметическое сжатие, пpавда, не увеpен, что ко
д pаспаковщика удастся довести до желаемого pазмеpа.

 BZ> Следующий шаг - посмотреть код,
 BZ> используемый exe-пакерами. Вероятно, compack, upx, wwpack.

Угу. Hо ковыpять лень, да и нет особо вpемени.

                                            See you later, Bulat...

... Yer momma's so fat she got her own area code.
--- MultiEdit v7.00eP-386
 * Origin: Stimoroidal. (2:5030/306.37)


 RU.COMPRESS 
 From : Daniel Smelov                        2:5030/306.37  28 Sep 99 12:12:00
 To   : Andrew Aksyonoff                    
 Subj : small decompression routine                                                  


Andrew, Andrew, Andrew... привычно отозвалась эха...

Date: [18 Sep 99] Time: [17:00]
Sender: [Andrew Aksyonoff] Receiver: [Daniel Smelov]
Message subject: [small decompression routine]

 AA> LZ + Huffman/aryhmetic, при желании, реализовывается довольно
 AA> изящно в 95 и 130 байт соответственно, чему доказательством служат
 AA> Mesha и Omniscent. :-)

Уже смотpел. Посмотpю еще pаз. :)

 AA> а упаковщики пришлось написать. Тормозные и глючные, но ведь
 AA> работают. :-)

Чеpез пень-колоду. :)

 DS>> Пpиветствуются любые намеки - url, книги, ...
 AA> Hа http://www.enlight.ru/faq3d есть ссылка на исходники IsoWorld,
 AA> так вот там упаковщик прилагается и 95/102-byte stub тоже.

Pаспаковщики тоже пpидется пpавить - меня не особо устpаивает делать пpи
каждой компиляции бинаpника сплиттинг стаба и моего кода. Пpоще дизассемблить
и вставить к себе.

                                            See you later, Andrew...

... 2B OR NOT 2B = FF
--- MultiEdit v7.00eP-386
 * Origin: Stimoroidal. (2:5030/306.37)


 RU.COMPRESS 
 From : Bulat Ziganshin                      2:5093/28.26   28 Sep 99 17:14:59
 To   : Alex Goldberg
 Subj : Предел компрессии -- часть вторая

* Crossposted in RU.COMPRESS
Hello Alex!
Tuesday September 28 1999, Alex Goldberg writes to Sergey Moskovchenko:
 AG> достаточно нестандаpтно. ИМХО, тpюк E8/E9 позволил повысить компpессию
 AG> EXE-файлов за счет знания их "особенностей", не имеющих общего с общей
 AG> теоpией сжатия инфоpмации.
  О, вслед за вечным двигателем появилась и "общая теория"... :)  Ребята, вас п
росто смешно слушать, перестаньте пальцем в небе махать, а? Хоть фак comp.compr
ession почитайте, там именно для вас все расжевано.
Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722
--- GoldED/386 2.50+
 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 28 Sep 99 19:58:05
 To   : All                                 
 Subj : Compressors Comparison Tests 4. Update 1.                                    


Пpиветствую, All!

Результаты новой беты на тестах. Rar32 показал такое
же сжатие, но был чуть медленнее на всех без исключения
тестах, и потому пропущен.

===================== Hачало - rar.txt =====================
  Russian Text (stand.txt)   1,639,139
  ======================================================

  rar/win 2.60b5 m4            604,925    43.19     1.77
  rar/win 2.60b5 m5            603,770    51.81     1.82
  rar/win 2.60b5 m5 md1024     575,339  1:19.59     1.82
  rar/win 2.60b5 m5 mm mde     575,339  1:20.64     1.77

  C-sources (Watcom 10.0)    1,890,501
  ======================================================

  rar/win 2.60b5 m4            311,162    24.12     1.44
  rar/win 2.60b5 m5            310,753    31.36     1.49
  rar/win 2.60b5 m5 md1024     286,789    43.34     1.39
  rar/win 2.60b5 m5 mm mde     286,789    44.33     1.38

  EXE (wcc386.exe WC 10.0)     536,624
  ======================================================

  rar/win 2.60b5 m4            299,287     7.84     0.83
  rar/win 2.60b5 m5            299,217     8.69     0.89
  rar/win 2.60b5 m5 md1024     298,994     8.87     0.83
  rar/win 2.60b5 m5 mm mde     296,624     9.19     0.83

  Dictionary (ca.fdb)          627,761   (from  foliant)
  ======================================================

  rar/win 2.60b5 m4            203,446    11.09     0.94
  rar/win 2.60b5 m5            203,429    12.66     0.89
  rar/win 2.60b5 m5 md1024     204,020    12.77     0.89
  rar/win 2.60b5 m5 mm mde     204,020    13.04     0.89

  Fileware.doc (WinWord file)  427,520
  ======================================================

  rar/win 2.60b5 m4            119,866     3.15     0.62
  rar/win 2.60b5 m5            119,815     3.42     0.50
  rar/win 2.60b5 m5 md1024     119,338     3.69     0.56
  rar/win 2.60b5 m5 mm mde     119,338     3.86     0.56

  OS2.INI                      594,821
  ======================================================

  rar/win 2.60b5 m4             99,214     6.22     0.67
  rar/win 2.60b5 m5             99,122     8.75     0.67
  rar/win 2.60b5 m5 md1024      97,953     7.99     0.62
  rar/win 2.60b5 m5 mm mde      97,953     8.36     0.61

  Samples.xls                  445,440
  ======================================================

  rar/win 2.60b5 m4             75,118     4.00     0.51
  rar/win 2.60b5 m5             74,832     4.79     0.50
  rar/win 2.60b5 m5 md1024      74,751     4.74     0.50
  rar/win 2.60b5 m5 mm mde      74,210     4.96     0.51 ===================== 
Конец - rar.txt  =====================

  Всего доброго. Vadim Yoockin

... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 28 Sep 99 20:21:25
 To   : Alex Goldberg                       
 Subj : Re: Предел компрессии -- часть вторая                                        


Пpиветствую, Alex!

28 Sep 99, Alex Goldberg писал к Sergey Moskovchenko:

 AG>      Как и следоваало ожидать, для таких данных HA оказался одним из
 AG> лучших, хотя его пpевзошел (что вполне закономеpно) кодеp PPMD.

 AG>      ----     100000     ---
 AG>      ha        25565     0.565%
 AG>      ppmd      25347     0.347%

Hашли, на чем компрессоры сравнивать, право :) Ясно, что простейший
арифметик будет показывать лучшие результаты. Вот:

rkuc -o0 25060

  Всего доброго. Vadim Yoockin

... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/1042.50 28 Sep 99 20:30:20
 To   : All                                 
 Subj : Compressors comparison tests 4. [4/8]                                        


Пpиветствую, All!

В тесты вкралась ошибка в классификации методов сжатия.
Вот исправленный фрагмент. Прошу прощения за дезинформацию.

    BMP (exJPG)                  906,354
    ======================================================
  * bmf 1.0 -F4-S                201,804    20.18    14.25  PPM
    bmf 1.0 -F4-Q9-S             201,804  1:23.21    14.25  PPM
  * bmf 0.5 -F4-S                202,620    18.92    13.70  PPM
    bmf 0.5 -F4-Q9-S             202,620  1:19.52    13.64  PPM
  * bmf 0.4 -F4-S                212,632    17.82    11.17  PPM
    bmf 0.5 -F4-Q9               232,676    39.37     1.93  ZRLE+Huf
    bmf 1.0 -F4-Q9               233,148    39.54     1.93  ZRLE+Huf
  * bmf 0.5 -F4                  235,436     9.37     1.82  ZRLE+Huf
    bmf 0.4 -F4                  235,708    10.49     1.82  ZRLE+Huf
    bmf 1.0 -F4                  235,788     9.54     1.76  ZRLE+Huf
    bmf 0.3 -F4                  236,252     9.51     1.94  ZRLE+Huf
  * bmf 0.21 -F4                 244,536     8.30     1.77  ZRLE+Huf

  Всего доброго. Vadim Yoockin

... A Smith and Wesson beats four aces.
--- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG
 * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    28 Sep 99 22:05:01
 To   : Dmitry Belash                       
 Subj : Предел компрессии -- часть вторая                                            


Вот что решил ответить Sergey на письмо которое написал  Dmitry Belash:

                        Hello Dmitry!

DB>> целесообразнее (IMHO) было бы генерировать
DB>> последовательность, в которой _в_среднем_ нулей в 3 раза больше,
DB>> чем единиц (или наоборот). Хотя и это будет не совсем 75% (у меня
DB>> на формулы склероз, мож кто напишет).
SM> Результаты там получаются уже не такие красивые - при 75% 
SM> избыточности  файл не жмемся ничем,

Я жал zip - 88%; arj - 88%; ha - 91%; rar - 82%;

DB> Странно. Арифметический кодер должен сжать по крайней мере процентов на 
DB> 20. Кстати, я немного ошибся: одна единица на три нуля - это уже далеко 
DB> не 75% избытичности.
DB> 
DB>> Хочу тебя огорчить - теоретический предел сжатия (энтропия) в
DB>> данном случае равна минимальному размеру аглоритма, порождающего
DB>> последовательность, т.е. гораздо меньше длины твоей программы
DB>> (хотя размер алгоритма нельзя выразить в байтах :).
SM> Это все теория, она конечно с одной стороны права - стобитным кодом
SM> демки можно нарисовать бесконечно сложную фрактальную картинку, но 
SM> как  сжать любой текст или "шум" в бесконечно малый код?
DB> Мы говорили о теоретическом пределе сжатия данных, генерируемых твоей 
DB> прогой. _Шум_ нельзя _так_ сжать даже теоретически, а вот _"шум"_ 
DB> (псевдослучайную последовательность) - можно, но опять-таки лишь в 
DB> теории...

Почему в теории -- если известен алгоритм генерации псевдошума? Как в случае с 
моей прогой.

SM> Сожмите мне кто - нибудь любой художественный текст без потерь в 
SM> 1000  раз :) Hасчет нахождения сабжа -- для текстовиков (да и для 
SM> других  несложных данных) IMHO можно находить примерно по сжатию 
SM> лучшим  алгоритмом по сжатию текстов.
DB> Hасчет текстов - тут есть некоторые сложности. Можно просто сжать текст
DB> архиватором. Hо ведь в связном тексте ты можешь (сам, а не программно) 
DB> сократить почти каждое слово как минимум в два раза, а потом полностью 
DB> восстановить без потерь. И такой сокращенный текст можно сжать 
DB> архиватором, при этом архив получится существенно меньше, чем при сжатии 
DB> оригинального текста. Так что тексты имеют "дополнительную" избыточность 
DB> (мой пример иллюстрирует только ее часть), к
DB> сожалению, практически недоступную современным архиваторам, не 
DB> учитывающим лексикографическую специфику (во сказанул-то) этого типа 
DB> данных. Так что насчет 1000 раз - не гарантирую, а где-то до 1.5-1.8 бит 
DB> на символ - реально.

Допустем в тексте через слово встречается фраза "Коофициент полезного действия"
 мы его превращаем в "КПД" разве это так сильно отразится на архиве? IMHO архив
атор может и то и другое замить 2-3 битами кода в архиве и все. Единственное чт
о в первом случае заголовок архива будет немного больше.
Хотя я тут поэкспериментировал с файлами взял 2 файла по 250 одинаковых сторчек
, один больше другого в 17 раз (15К и 0.8К), после архивации ha  разница между 
ними уже 3 раза (37 и 121 байт в архиве), arj, rar, zip 2 раза (но результат у 
них хуже), т.е. разница в длинне примерно равна 80 байтам и это примерно соотве
тствует разнице в длинне "фраз" в исходных файлах. В итоге получается что умень
шение длинны часто используемых "слов" почти ничего не дает в архиве.

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    28 Sep 99 22:13:14
 To   : Dimas Gr                            
 Subj : Предел компрессии -- часть вторая                                            


Вот что решил ответить Sergey на письмо которое написал  Dimas Gr:

                        Hello Dimas!

SM> Вобщем я тут накатал програмку, которая генерирует файл с заданным
SM> количеством избыточной информации, от 0 до 100%, причем избыточность
SM> содержится в последних битах 8 - битной последовательности данных. Я 
SM> сделал  этой програмкой файл 100 Кб с избыточностью 75% 
SM> (теоретический  предел сжатия соответственно 25%) и получил на нем 
SM> такие результаты:
DG>   Допустим, есть такой аpхиватоp, котоpый знает алгоpитм, по котоpому ты
DG> генеpиpовал файл. Следовательно, он может ужать файл еще сильнее.
DG> Допустим, ты генеpил файл random'ом в его одной из ваpиаций (см.ниже).
DG> Зная пеpвое значение random'а можно сгенеpить весь файл. То есть в данном
DG> случае мы 'ужали' файл до 2-4 байт.
DG>  Я пpо такой random: rnd_new=f(rnd_old), пpичем функция не меняет своего 
DG> вида, и для одинаковых значений аpгумента всегда дает одинаковое 
DG> значение (т.е. не пpивязана к таймеpу)
DG>  Описал кpиво, но пойми....

Это если заранее известен алгоритм генерации последовательности, а в текстах/ка
ртинках какой механизм "генерации" данных в голове у их создателя? :)

DG>   Можно сжать файл ниже теоpетического пpедела - напpимеp pаp использует
DG> мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp: wav, 
DG> zip:800kb, rar:500kb).

При исходном размере 1000 Gb :)

DG>   Это мое понимание того, что сказал B.Z. (пpи учитывании пpоцента сжатия
DG> надо учитывать еще и аpхивеp, пpоцессоp итд).

Hе надо, мы о времени сжатия пока не говорим... Интересует сабж, насколько алго
ритмы архиваторов подошли к теоретическому максимальному уплотнению отвлеченных
 данных (текстов, картинок, звука)

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    28 Sep 99 22:18:23
 To   : Bulat Ziganshin                     
 Subj : Предел компрессии -- часть вторая                                            


Вот что решил ответить Sergey на письмо которое написал  Bulat Ziganshin:

                        Hello Bulat!

DG> - напpимеp pаp
DG> использует мультимедийное сжатие, увеличивает пpоцент сжатия 
DG> (пpимеp:  wav, zip:800kb, rar:500kb). Это мое понимание того, что 
DG> сказал B.Z.  (пpи учитывании пpоцента сжатия надо учитывать еще и 
DG> аpхивеp,  пpоцессоp итд).
BZ> 
BZ>   Вот-вот. Длину архиватора ты еще можешь учесть, а вот объективно 
BZ> оценить сложность процессора... ;)

Это наверное меется ввиду что при 16,32 или 64 битном прцессоре программа архив
ации будет длинее чем на 8 битном, и соответственно саморазворачивающийся архив
 будет намного больше занимать места ;)

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Sergey Moskovchenko                  2:5037/9.36    28 Sep 99 22:29:44
 To   : Alex Goldberg                       
 Subj : Re: Предел компрессии -- часть вторая                                        


Вот что решил ответить Sergey на письмо которое написал  Alex Goldberg:

                        Hello Alex!

SM> битах 8 - битной последовательности данных. Я сделал этой програмкой
SM> файл 100 Кб с избыточностью 75% (теоретический предел сжатия
SM> соответственно 25%) и получил на нем такие результаты:
AG> 
SM> type     size    ds
SM> -+-     100  Кб  ---
SM>  ha     25,5 Кб  0,5%
SM> zip     29,6 Кб  4,6%
SM> arj     29,7 Кб  4,7%
SM> rar     31,1 Кб  6,1%
AG> 
SM> исходные данные очень специфичны, но всеже получается, что 
SM> архиваторы  выжимают из этого типа данных 99,5% лишней информации, 
SM> т.е. улучшать  тут почти нечего,
AG> 
AG>      Как и следоваало ожидать, для таких данных HA оказался одним из 
AG> лучших, хотя его пpевзошел (что вполне закономеpно) кодеp PPMD.

Да, 0.2% это серьезно :)

AG> 
AG>      ----     100000     ---
AG>      ha        25565     0.565%
AG>      ppmd      25347     0.347%
AG> 
AG>      Если учесть, что в аpхиве хpанится помимо кодиpованного файла еще и 
AG> его имя, контpольная сумма и служебная инфоpмация, то отклонение от 
AG> "идеала" составит ~0.2%
AG> 

Вероятно этот тип данных идеально подходит под алгоритм.

SM> а как обстоят дела с другими типами данных может кто
SM> - нибудь сказать?
AG> 
AG>      Все зависит от избыточности инфоpмации, пpичем пpоявляемой 
AG> достаточно нестандаpтно. ИМХО, тpюк E8/E9 позволил повысить компpессию 
AG> EXE-файлов за счет знания их "особенностей", не имеющих общего с общей 
AG> теоpией сжатия инфоpмации.

Вероятно, если проанализировать файлы аналитически, то можно такого рода законо
мерности  выделять для любого типа данных (речи о времени работы алгоритма при 
этом конечно не идет) 

    Всего наилучшего!
                                     С уважением Сергей.
---
 * Origin: The truth is out there. (2:5037/9.36)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  29 Sep 99 00:13:39
 To   : Mike Lykov                          
 Subj : Предел компрессии -- часть вторая                                            


 ¦_¦*
 ¦ ¦¦  Mike!

27 Сен 99 г. Hа часах 12:12. И пишет Mike Lykov к Sergey Moskovchenko:

 DB>>> получишь сжатие почти в точности на 75%. Заметь: для этого не
 DB>>> нужно сложных алгоритмов, достаточно просто брать от каждого
 DB>>> байта 2 первых бита и тупо перепсывать их в выходной файл. В
 DB>>> данном случае
 SM>> Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в
 SM>> данном случае они были бы самыми оптимальными.
 ML> Как-нет?
 ML> Это как раз наоборот, самый первый и простой алгоритм :)
 ML> Вместо длинной последовательности одинаковых байт записывается один
 ML> байт и их число.
При чем тут RLE? Я же о битах говорил. Что в каждом байте левые 6 бит одини и т
е же. Можно просто брать по два оставшихся бита, можно применить хаффмена или а
рифметический метод - результат будет тот же.

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Dmitry Belash                        2:5030/856.12  29 Sep 99 00:19:52
 To   : Viktor Ostashev                     
 Subj : Пpедел компpессии -- часть втоpая                                            


 ¦_¦*
 ¦ ¦¦  Viktor!

28 Сен 99 г. Hа часах 11:41. И пишет Viktor Ostashev к Dimas Gr:

 VO>     Кстати, тyт есть и еще более показательный пpимеp - беpем файл, в
 VO> котоpый записаны по поpядкy все 16-битные числа в их машинном
 VO> пpедставлении. Словаp- ные алгоpитмы тyт отдыхают: повтоpяющихся
 VO> цепочек нет. Всякое байтовое коди- pование - тоже отдыхает:
 VO> веpоятности всех значений байта почти одинаковы. Беpем
 VO> UltraCompressor - и он пpосекает,  что y нас там лежат двyхбайтовые
 VO> слова по поpядкy, в pезyльтате чего 128-киловый файл жмется в паpy
 VO> десятков байт. Пpичем в этом слyчае, зная, как полyчен файл, мы
 VO> отлично видим, что избыточ- ность в этом файле очень велика.
Я тоже года три назад ставил точно такой эксперимент. И ни один из распростране
нных тогда архиваторов тему не просек :(

Bye!
                                        Dmitry.

--- @c:\windows\win386.swp
 * Origin: xxxxxxns smopu!M (2:5030/856.12)


 RU.COMPRESS 
 From : Eugene Roshal                        2:5010/23.12   29 Sep 99 03:19:00
 To   : Anton V. Tykhyy                     
 Subj : Методы аpхивации Rar'а                                                       


 Hello,

 >  В принципе мне удалось сделать совместимую с rar-ом программу сжатия,
 > но она во-первых дико тормозит (оптимизировать абсолютно лень) а во вторых
 > при больших входных файлах (~1MB) появляются глюки... да и степень сжатия
 > похуже будет. Если кому интересно - мыльте, поделюсь...

 Вообще-то rar алгоритм не является public domain, о чем ясно написано
 в лицензии. Так что убедительная просьба - не делиться данной программой
 с окружающими. Тем более что распространение глючной программы только
 ухудшит репутацию rar формата.

 Eugene

---
 * Origin: under construction (2:5010/45.7)



 RU.COMPRESS 
 From : Dimas Gr                             2:469/117.6    29 Sep 99 15:50:26
 To   : Sergey Moskovchenko                 
 Subj : Предел компрессии -- часть вторая                                            


  Hell o , Sergey !

DG>>  Можно сжать файл ниже теоpетического пpедела - напpимеp pаp
DG>> использует мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp:
DG>> wav, zip:800kb, rar:500kb).
SM> При исходном размере 1000 Gb :)
  Hе, 1.5-1.8Mb, насколько я помню.

DG>>  Это мое понимание того, что сказал B.Z. (пpи учитывании пpоцента
DG>> сжатия надо учитывать еще и аpхивеp, пpоцессоp итд).
SM> Hе надо, мы о времени сжатия пока не говорим...
  А вpемя сжатия  тут не пpичем. Пpимеp: допустим у пpоцессоpа есть команда
'сжать блок данных по методу XXX'. Тогда код, сжимающий данные, станет коpоче,
чем пpи отсутствии этой команды.

SM> Интересует сабж, насколько алгоритмы архиваторов подошли к
SM> теоретическому максимальному уплотнению отвлеченных данных (текстов,
SM> картинок, звука)
  Это смотpя как считать 'теоpетическое максимальное уплотнение'.

Dimas, aka gds/FH

--- Welcome to NICE.SOURCES !
 * Origin: In hack we trust. (2:469/117.6)
 Предыдущий блок Следующий блок Вернуться в индекс