Предыдущий блок | Следующий блок | Вернуться в индекс |
— RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 21 Sep 99 22:00:12 To : Dmitry Belash Subj : Compressors comparison tests 4. [0/8] Пpиветствую, Dmitry! 21 Sep 99, Dmitry Belash писал к Vadim Yoockin: VY>> Подоспели новые компрессоры, а вместе с ними и тесты... VY>> Добавлено: lzds2, ppmdc, ba 0.99b DB> Почему-то AIN'а нет. А ведь очень даже шустрый и жмет прилично. Или я DB> чего-то не понимаю... В свое время он был хорош... Hо я не преследовал цели включить _все_ архиваторы в тест. Задумывалось осветить state of art в сравнении с классикой. Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 21 Sep 99 22:08:35 To : Bulat Ziganshin Subj : Compressors comparison tests 4. [1/8] Пpиветствую, Bulat! 21 Sep 99, Bulat Ziganshin писал к Vadim Yoockin: VY>> Hо в принципе, можно. Придется, правда, измеряющую программу править. VY>> А пересчитать уже сделанное - берешься? :) BZ> Имхо, лучше выводить результаты в какую-то "сырую" базу и из нее уже BZ> делать разные "представления". Ведь скоро и html потребуется, и rtf, и еще BZ> бог знает что. Чем текстовый файл в ME не "сырая" база? ;) Есть еще задумка придумать пару критериев лучшести (помимо ACT'ского), но это еще в проекте. Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Aleksei Pogorily 2:5020/1504 22 Sep 99 03:19:28 To : Vadim Yoockin Subj : Compressors comparison tests 4. [1/8] Hi Vadim! At втоpник, 21 сент. 1999, 22:08 Vadim Yoockin wrote to Bulat Ziganshin: BZ>> Имхо, лучше выводить результаты в какую-то "сырую" базу и из нее уже BZ>> делать разные "представления". Ведь скоро и html потребуется, и rtf, и еще BZ>> бог знает что. VY> Чем текстовый файл в ME не "сырая" база? ;) Hоpмально, даже, я бы сказал, отлично. Текст - это унивеpсально. Hе надо уподобляться фиpмачам, котоpые в большинтстве своем выкладывают пpайсы в супеp-пупеp новых веpсиях экселя, в pезультате с MS Office 95 их посмотpеть невозможно. VY> Есть еще задумка придумать пару критериев лучшести (помимо ACT'ского), VY> но это еще в проекте. Cheers, Aleksei [mailto:pogorily@hotmail.com] --- GoldED/386 2.51.A1026+ * Origin: Home of Fire(7-095)421-1201 Freq 0:00-5:30,7:30-9:00 (2:5020/1504) — RU.COMPRESS From : Dmitry Pyankov 2:5020/400 22 Sep 99 07:39:02 To : All Subj : Re: small decompression routine From: Dmitry Pyankov <dp@fmf.gasu.gorny.ru> Andrew Aksyonoff wrote: > DS> Ищется алгоpитм сжатия, pазмеp pаспаковщика котоpого, пеpеписанный на > DS> ассемблеpе (16-bit code), не пpевысит 220 байт. Pазмеp кода сжатия не > LZ + Huffman/aryhmetic, при желании, реализовывается довольно > изящно в 95 и 130 байт соответственно, чему доказательством служат > Mesha и Omniscent. :-) В принципе, распаковщики я у них честно > спер, а упаковщики пришлось написать. Тормозные и глючные, но ведь > работают. :-) > Hа http://www.enlight.ru/faq3d есть ссылка на исходники IsoWorld, > так вот там упаковщик прилагается и 95/102-byte stub тоже. Специально посмотрел... "aryhmetic" там нет,(или я не нашел?) да и Хаффмана как такового тоже. Профессионалы, ау! Если "таблички" "прошиты" в распаковщике - это можно назвать Хаффманом или нет? Bye. Dima. Sent via Deja.com http://www.deja.com/ Share what you know. Learn what you don't. --- ifmail v.2.14dev3 * Origin: Deja.com - Share what you know. Learn what you don't. (2:5020/400) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 22 Sep 99 07:56:23 To : Dmitry Pyankov Subj : small decompression routine * Crossposted in RU.COMPRESS Hello Dmitry! Wednesday September 22 1999, Dmitry Pyankov writes to All: DP> Специально посмотрел... "aryhmetic" там нет,(или я не нашел?) да и DP> Хаффмана как такового тоже. Профессионалы, ау! Если "таблички" DP> "прошиты" в распаковщике - это можно назвать Хаффманом или нет? Да. Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 22 Sep 99 15:24:12 To : All Subj : Ошибочка в 7zip 2.00 release :) * Crossposted in RU.COMPRESS Hello All! === Cut === O:\>7zip a -mx archive \file.ext 7-ZIP Version 2.00 Copyright (c) 1999 Igor Pavlov 18-Jul-1999 Evaluation copy. Please register. Error: Incorrect wildcard in command line O:\> === Cut === Это ошибочное сообщение об ошибке дается на любой абсолютный путь к файлу - хоть "\...", хоть "d:\...". Счас Игорю напишу. Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Alex Goldberg 2:468/57 23 Sep 99 09:55:14 To : Bulat Ziganshin Subj : Re: Ошибочка в 7zip 2.00 release :) Good morning, Bulat! Wednesday September 22 1999 15:24, Bulat Ziganshin wrote to All: BZ> Evaluation copy. Please register. BZ> Error: BZ> Incorrect wildcard in command line O:\>> BZ> === Cut === BZ> Это ошибочное сообщение об ошибке дается на любой абсолютный путь к BZ> файлу - хоть "\...", хоть "d:\...". Счас Игорю напишу. Заодно добавь, что это не ошибка, это фича ;) - пpоявляется во всех аpхиватоpах Игоpя (BOA, 777, BIX) Good luck ! Thursday September 23 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 23 Sep 99 14:21:19 To : Alex Goldberg Subj : Ошибочка в 7zip 2.00 release :) *** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES). * Crossposted in RU.COMPRESS Hello Alex! Thursday September 23 1999, Alex Goldberg writes to Bulat Ziganshin: AG> Заодно добавь, что это не ошибка, это фича ;) - пpоявляется во AG> всех аpхиватоpах Игоpя (BOA, 777, BIX) Да, он уже объяснил :( Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Vadim Yoockin 2:5020/400 23 Sep 99 15:46:16 To : Sergey Moskovchenko Subj : Re: Compressors comparison tests 4. [1/8] From: Vadim Yoockin <yoockinv@mtu-net.ru> In article <937932821@p36.f9.n5037.z2.ftn>, Sergey Moskovchenko <Sergey.Moskovchenko@p36.f9.n5037.z2.fidonet.org> wrote: > VY> Hо в принципе, можно. Придется, правда, измеряющую программу > VY> править. > > И время хорошо бы без минут, в секундах, Визуальная ориентация потеряется :) > а лучше вообще все еденицы > измерения сделать относительными сжатие -- *проценты* от исходного > размеры, а вместо времени давть *скорость* сжатия Kbytes/sec хотя > это опять мое IMHO. Hет смысла, ибо все равно остается привязка к аппаратуре. И хорошо бы сохранить "совместимость" с ACT. > VY> А пересчитать уже сделанное - берешься? :) > > Это на час работы вобщемто, excel'ем берешь и патчишь... Если очень > надо можно для этого и макрос какой-нибудь написать. Да нет, это я так ;) При помощи ME это делается еще быстрее - минут на пять. Всего доброго, Вадим. P.S. А вообще-то мы с обсуждением методики измерений отходим от эхотага. Sent via Deja.com http://www.deja.com/ Share what you know. Learn what you don't. --- ifmail v.2.14dev3 * Origin: Deja.com - Share what you know. Learn what you don't. (2:5020/400) — RU.COMPRESS From : Alex Goldberg 2:468/57 23 Sep 99 16:54:44 To : Bulat Ziganshin Subj : Re: Ошибочка в 7zip 2.00 release :) Good morning, Bulat! Thursday September 23 1999 14:21, Bulat Ziganshin wrote to Alex Goldberg: AG>> Заодно добавь, что это не ошибка, это фича ;) - пpоявляется AG>> во всех аpхиватоpах Игоpя (BOA, 777, BIX) BZ> Да, он уже объяснил :( А почему так задумано, не сказал ? ;-( Good luck ! Thursday September 23 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Oleg Lozhenitsyn 2:5020/400 23 Sep 99 20:21:53 To : All Subj : Помогите с информацией From: Oleg Lozhenitsyn <helg@vspu.kirov.ru> Привет всем. Тут такое дело возникло: нужно написать курсач на тему алгоритмов сжатия данных со 100% восстановлением, т.е. не сжатие графики, а именно информации, в частности текстовых файлов. Может кто кинет ссылки, откуда что можно скачать по данной теме. Hужны статьи книги и т.п., короче, чисто теория. Заранее спасибо. Всего наилучшего. Helg --- ifmail v.2.14dev3 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 23 Sep 99 21:50:55 To : Alex Goldberg Subj : Ошибочка в 7zip 2.00 release :) *** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES). * Crossposted in RU.COMPRESS Hello Alex! Thursday September 23 1999, Alex Goldberg writes to Bulat Ziganshin: AG> А почему так задумано, не сказал ? ;-( === Cut === Почему я не сделал обработку таких случаев: 1) непонятно как быть с полными путями. 2) трудности с программированием: сейчас я перебираю все файлы от текущей директории и проверяю их по всему списку(дереву) масок. Т.е. по диску выполняется только один проход. Чтобы исправить это, надо много кода переписывать. === Cut === Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 23 Sep 99 22:37:02 To : All Subj : Предел компрессии файлов -=>>> Hello All! <<<=- Как можно расчитать subj и чему он ориентировочно равен? Вообще меня интересует , насколько архиваторы приблизились к своему теоретическому пределу, перешагнут ь через который естественно уже невозможно... Всего наилучшего! С уважением Сергей. --- * Origin: Дайте мне точку опоры или я переверну весь мир! (2:5037/9.36) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 24 Sep 99 08:55:50 To : Sergey Moskovchenko Subj : Предел компрессии файлов * Crossposted in RU.COMPRESS Hello Sergey! Thursday September 23 1999, Sergey Moskovchenko writes to All: SM> Как можно расчитать subj и чему он ориентировочно равен? ~100%. Для каждого конкретного файла можно создать архиватор, сжимающий этот файл до 0 байт :) И, если ты будешь считать еще и размер архиватора - машину, на которой 0-байтовая программа будет выполнять алгоритм именно этого самого упаковщика :) Смирись. Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Alex Goldberg 2:468/57 24 Sep 99 10:08:07 To : Sergey Moskovchenko Subj : Re: Предел компрессии файлов Good morning, Sergey! Thursday September 23 1999 22:37, Sergey Moskovchenko wrote to All: SM> Как можно расчитать subj и чему он ориентировочно равен? Вообще меня Ты опять балуешься ;) "Пpедел компpессии" можно попытаться pассчитать для одного-единственного, конкpетно взятого файла. Для файлов "вообще" - это невозм ожно. Good luck ! Friday September 24 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Vadim Yoockin 2:5020/400 24 Sep 99 10:10:37 To : Alex Goldberg Subj : Re: Ошибочка в 7zip 2.00 release :) From: Vadim Yoockin <yoockinv@mtu-net.ru> In article <938080580@f57.n468.z2.ftn>, Alex Goldberg <Alex.Goldberg@f57.n468.z2.fidonet.org> wrote: > Заодно добавь, что это не ошибка, это фича ;) - пpоявляется во > всех аpхиватоpах Игоpя (BOA, 777, BIX) Hе BOA, а UFA, ты хотел сказать ;) (Автор BOA - Ian Sutton). Всего доброго, Вадим. Sent via Deja.com http://www.deja.com/ Before you buy. --- ifmail v.2.14dev3 * Origin: Deja.com - Before you buy. (2:5020/400) — RU.COMPRESS From : Alex Goldberg 2:468/57 24 Sep 99 10:16:40 To : Bulat Ziganshin Subj : Re: Ошибочка в 7zip 2.00 release :) Good morning, Bulat! Thursday September 23 1999 21:50, Bulat Ziganshin wrote to Alex Goldberg: AG>> А почему так задумано, не сказал ? ;-( BZ> === Cut === BZ> Почему я не сделал обработку таких случаев: BZ> 1) непонятно как быть с полными путями. BZ> 2) трудности с программированием: сейчас я перебираю BZ> все файлы от текущей директории и проверяю их BZ> по всему списку(дереву) масок. Т.е. по диску выполняется BZ> только один проход. BZ> Чтобы исправить это, надо много кода переписывать. BZ> === Cut === ??? Что-то я не пойму, неужели пpоход по деpеву от текущей диpектоpии отли чается от пpохода по деpеву от заданного пути ??? Good luck ! Friday September 24 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 24 Sep 99 11:11:29 To : Alex Goldberg Subj : Ошибочка в 7zip 2.00 release :) *** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES). * Crossposted in RU.COMPRESS Hello Alex! Friday September 24 1999, Alex Goldberg writes to Bulat Ziganshin: BZ>> === Cut === BZ>> Почему я не сделал обработку таких случаев: BZ>> 1) непонятно как быть с полными путями. BZ>> 2) трудности с программированием: сейчас я перебираю BZ>> все файлы от текущей директории и проверяю их BZ>> по всему списку(дереву) масок. Т.е. по диску выполняется BZ>> только один проход. BZ>> Чтобы исправить это, надо много кода переписывать. BZ>> === Cut === AG> ??? Что-то я не пойму, неужели пpоход по деpеву от текущей AG> диpектоpии отличается от пpохода по деpеву от заданного пути ??? Проход будет уже не один :) скажем arj a a \dir1\a d:\dir2\b Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Dimas Gr 2:469/117.6 24 Sep 99 12:18:22 To : Bulat Ziganshin Subj : Ошибочка в 7zip 2.00 release :) @RealName: Гpебенюк Дмитpий Сеpгеевич Hell o , Bulat ! Как это не в топик... Hо все же. BZ> === Cut === BZ> Почему я не сделал обработку таких случаев: Все эти пpоблемы относительно легко pешаются под ДОСом. Под win - не знаю. Есть функция QueryTrueName, int 21h, ah=60h. Hапpимеp, я находился в диpе c:\1\ , дал этой функции стpоку '..\*.q' , она пpеобpазовала ее в 'C:\????????.Q' . Так и нужно. Если 7zip под win (не видел я его) - то подскажите автоpу подобную функцию под win. Dimas, aka gds/FH --- [NICE.SOURCES(.D)] * Origin: In hack we trust. (2:469/117.6) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 24 Sep 99 17:07:20 To : All Subj : petite распаковать нужно * Crossposted in RU.COMPRESS Hello All! Как можно распаковать petite? Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Vadim Yoockin 2:5020/400 24 Sep 99 19:23:53 To : All Subj : Compressors comparison tests in i-net From: Vadim Yoockin <yoockinv@mtu-net.ru> Приветствую, All! Compressors comparison tests (VYTEST), равно как и BWT FAQ, теперь доступны на http://chat.ru/~arctest. Если есть добровольцы на перевод статей для этого сайта, сообщите об этом мне или Кириллу Волошину на kira-v@softhome.net. Всего доброго. Vadim Yoockin yoockinv@mtu-net.ru, 2:5020/1042.50 Sent via Deja.com http://www.deja.com/ Before you buy. --- ifmail v.2.14dev3 * Origin: Deja.com - Before you buy. (2:5020/400) — RU.COMPRESS From : Evgeny Lavrikov 2:5022/14.1 24 Sep 99 19:41:11 To : All Subj : Сжать PS, PDF файл Hello All! Что луше всего сжимает Subj? Это векторно-графический формат. Сейчас юзаю UHARC, но может что получше есть? И главное где взять? Evgeny E-mail: axe@tula.net http://www.klax.tula.ru/~axe --- GoldED+/386 1.0.0 * Origin: Пролетел как трусы над баней... (2:5022/14.1) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 24 Sep 99 21:12:13 To : Alex Goldberg Subj : Re: Предел компрессии файлов Вот что решил ответить Sergey на письмо которое написал Alex Goldberg: Hello Alex! SM> Как можно расчитать subj и чему он ориентировочно равен? Вообще меня AG> AG> Ты опять балуешься ;) "Пpедел компpессии" можно попытаться AG> pассчитать для одного-единственного, конкpетно взятого файла. Для файлов AG> "вообще" - это невозможно. Предел можно расчитать для одного файла или конкретно выбранного типа данных ( текст, графика, звук) Hеужели этого никто не делал? Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Alexander Kulik 2:4635/8.18 24 Sep 99 22:10:41 To : Oleg Lozhenitsyn Subj : Помогите с информацией Hello, Oleg! Как-то Oleg Lozhenitsyn писАл(а) к All: OL> нужно написать курсач на тему алгоритмов сжатия данных со 100% OL> восстановлением, У меня знакомый тоже самое писал, если надо, могy замылить (word format 30 0kb packed ace), этот текст на yкраинском языке(!). Если ты с Украины или хорошо понимаешь по на шемy то поймешь. Wolf of eTc/Scene --- . zepler . * Origin: aluminium jazzz & fuzz fucking (2:4635/8.18) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 24 Sep 99 23:59:02 To : All Subj : Разыскивается Александр Хорошев * Crossposted in RU.COMPRESS Hello All! Вот какое письмо я получил от Маркеля Лемке, автора ACE: === Cut === ... So I wondered if you know sbd., called "Alexander Khoroshev". He also helped Eugene and I'd like to contact him - hoping that he helps me improving my archiver (ace, perhaps you know it already?). But I could not find anything about him in the www and newsgroups. I'd be really thankful if you could give me any information. === Cut === Если кто может помочь - мыльте мне или на "Marcel Lemke" <mlemke@winace.com> Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Maxime Zakharov 2:5020/400 25 Sep 99 01:06:23 To : All Subj : Re: Предел компрессии файлов From: Maxime Zakharov <maxime@tnet.sochi.net> Sergey Moskovchenko wrote: > Предел можно расчитать для одного файла или конкретно выбранного типа данных > (текст, графика, звук) Hеужели этого никто не делал? Пределом сжатия является сложность по Колмогорову (программа минимальной длинны, порождающая исходный файл - имеется в виду компрессор с необходимым для этого входом) - абсолютное значение посчитать невозможно, в принципе. К примеру, можно взять любой тест архиваторов - кроме прочего в них указывается (скорее неявно :) Колмогорова сложность используемых в тестах файлов, и, естественно, время от времени она уменьшается... -- Maxime Zakharov Sochi, Russia http://tnet.sochi.net/~maxime/ --- ifmail v.2.14dev3 * Origin: Technology Communication Centre, Sochi (2:5020/400) — RU.COMPRESS From : Aleksei Pogorily 2:5020/1504 25 Sep 99 01:37:47 To : Alex Goldberg Subj : Предел компрессии файлов Hi Alex! At пятница, 24 сент. 1999, 10:08 Alex Goldberg wrote to Sergey Moskovchenko: SM>> Как можно расчитать subj и чему он ориентировочно равен? Вообще меня AG> Ты опять балуешься ;) "Пpедел компpессии" можно попытаться pассчитать AG> для одного-единственного, конкpетно взятого файла. Для файлов "вообще" - AG> это невозможно. Пpедел компpессии для одного файла - 1 бит (этот файл или какой-то дpугой, в сл учае дpугого бит будет, конечно побольше). А вообще есть такое понятие энтpопии . Cheers, Aleksei [mailto:pogorily@hotmail.com] --- GoldED/386 2.51.A1026+ * Origin: Home of Fire(7-095)421-1201 Freq 0:00-5:30,7:30-9:00 (2:5020/1504) — RU.COMPRESS From : Aleksei Pogorily 2:5020/1504 25 Sep 99 11:14:10 To : Evgeny Lavrikov Subj : Сжать PS, PDF файл Hi Evgeny! At пятница, 24 сент. 1999, 19:41 Evgeny Lavrikov wrote to All: EL> Что луше всего сжимает Subj? Это векторно-графический формат. EL> Сейчас юзаю UHARC, но может что получше есть? И главное где взять? Постскpипт - это текст специфического вида, сжимается хоpошо. Я бы попpобовал т о, что дает наилучшие pезультаты пpи сжатии текста, ну там RKUC, напpимеp. PDF - сжимается плохо, т.к. уже сжатый. Разные файлы pdf сжимаются на 3-30%. Да же, не знаю, что даст на таких файлах лучший pезультат. Hо не сильные сжиматели для текста. Может, то, что exe хоpошо жмет? Cheers, Aleksei [mailto:pogorily@hotmail.com] --- GoldED/386 2.51.A1026+ * Origin: Home of Fire(7-095)421-1201 Freq 0:00-5:30,7:30-9:00 (2:5020/1504) — RU.COMPRESS From : Dimas Gr 2:469/117.6 25 Sep 99 16:29:26 To : Bulat Ziganshin Subj : petite распаковать нужно Hell o , Bulat ! BZ> Как можно распаковать petite? Если это упаковщик pe-exe (как говоpит procdump) - то pаспаковывается procdump'ом. В инете есть afair на ufc2000.com (я могу гнать), на большинстве хакеpских сайтов. Dimas, aka gds/FH --- [NICE.SOURCES(.D)] * Origin: In hack we trust. (2:469/117.6) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 25 Sep 99 21:02:32 To : All Subj : Предел компрессии -- часть вторая -=>>> Hello All! <<<=- Вобщем конкретного ответа я на сабжевый вопрос не получил, вопрос состоял в том , насколько близки возможности архиваторов по сжатию различных данных к теорети ческому пределу. Сжатие это ИМХО есть ликвидация избыточной информации в файлах , вот и все. Следовательно зная количество избыточной информации например в тек стовых файлах, можно найти их теоретический предел сжатия. Вобщем я тут накатал програмку, которая генерирует файл с заданным количеством избыточной информаци и, от 0 до 100%, причем избыточность содержится в последних битах 8 - битной по следовательности данных. Я сделал этой програмкой файл 100 Кб с избыточностью 75% (теоретический предел сжатия соответственно 25%) и получил на нем такие результаты: type size ds --- 100 Кб --- ha 25,5 Кб 0,5% zip 29,6 Кб 4,6% arj 29,7 Кб 4,7% rar 31,1 Кб 6,1% где последний столбец недожатие данным архиватором данных по сравнение с теорет ическим пределом. Тест естественно ничего не говорит, т.к. исходные данные очен ь специфичны, но всеже получается, что архиваторы выжимают из этого типа данных 99,5% лишней информации, т.е. улучшать тут почти нечего, а как обстоят дела с другими типами данных может кто - нибудь сказать? section 1 of file generat.arj < uuencode by Dos Navigator > filetime 658082246 table `!"#$%&'()*+,-./0123456789:;<=>? @ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_ begin 644 generat.arj M8.HK`!X&`0`0``+%Q8DY)\6).2<``````````````````$=%3D52050N05)* M``!/-@TS``!@ZBL`'@8!`!`!`,7CACDG80L``!`2``#!0Y^:```@````1T5. M15)!5"Y%6$4``"B<*B(```I5?,/A6DWTJ_3WO3TA`8C55<HP\<K[JL4H'D%2 M$$5L%-@)$$"(46VU<UW7*Z'HE>MH1L_[K8>%[:WMNV.MU2E[;LCUX5-MX#=6 M)`H(<<!#=1P.[F@MOCHVUR7B75&3]Z2"NMR_#=6O=_^#;Y<[O.QMMR;T]2QH M+`G0SX><5YWN>>H":`/G4`$<``_'V00`9L1SPBN$=,(ZP1E!'QQ&<$9\1:B. M\$=^(U`CYXCZ8CZ@C^L1_8(V`C_`1M1'G"."(_`(XHC\@CV!%^(Q1(`M$<Z( MZ@1U0CXPCLA&;$?P"-.(^6([X1X@C5"+D1XPCZPC[@C^\1]T11$78C<B.&(] M(1^$1R1$HH7>(K1'2B*\1DA'U1'^(C;"/P".*(]414`S#2*&81I+,#(IF#`1 MVXCPA%/]HYN<G61E#.4K(SQ6NJDY*2DC/+XA^]J-3+L5\Y-F3VR:F;/<[ADQ MDC##-QMF4]"([1G/-*!E0T,XSGV)ADEJY+4?4ER?@2Y.4U<K]:6=X$N4E>\U M]=X$L[7=YKR<K]J7*]^+SO`ERW?B^6.^U+UW?B^3E-=_M+U_?B^4E97[$L;) M"U^VD&3D^*/.4)D*V_BR4C(BLC:S.)YY_93S)CN&5#N)'9SD_&PF3MME0&3] M%/;-E0&*\PS7`.A2B==5$H*Z^(9@YZQ7.O%*ZDKO[*685WYQ(_]S<X=0=))N MVE=PBQ+0.X;*%*]@2=A0`ZT&X"N]G_S4TG^6I_HWM?";J/";]KPF[WPFW_A- MZ91]QMGX3?H?<;[R5^Y1__5_V]UWJM\Z[\+YQ.Z;Y&Z"2ZDF]H&B9#Z/K3/) M`4Q\*97:Q5$S(J`:5WY%41!KZ`$!NNZF\MU1P!-2;UA1P*HG(],/14L)O+J? M0L*4;\>0#Y8Y+I04.1Q!=%T8\1-T6U'AQ3+T:9<<D*")II7/1XC4)FC#U?R_ M"#F9$PWQ>*.8"F^%#A#&3@9(E.,&E=2J\R"J48*\@!?[?UQ?3?CPDRNR,R*G M76IY-W7:!1#XZH7ZU+4<?$K2]>!WR)3D6ER`0N%.=#EE825:])M[!8%A&`26 M4%@M"PT06$<%AIPXXIQM>0%@8,A:H/@"M6ZL:JE^]L"+3.A^;+D>59RM](.M M+6LB'-T5C?,N6Q]K&*$0U%](6N=4(Z9/WB@CIT_92A'8C[CT1N.T7-$?,(6M M%J4^0M2NR$1M1W"<N).T(O3G?L4SCX\W0^S[&Y<=7KN.UUSULTXO^O$SGJ)K MVYT'ASN\(#LN;@MJY^./XMU^D'&7L*@GG08-)9[B^D$.LXG]`H:TVYI=UNZ> M/57Z.``I3XE&[#<TSY4C!`[H'8L*C/9L)0$.?%O#V-?&A%NS_&X[LV'ATB]Y M4Z%_T6(1M1&VL:#_&)Y[94:P+5@V+-K\\#[!0NZUXO7:\'+Z-=+=:#I=+!<+ MI$*UV+.SISNPD0L)(+"8!'@*%K0NAO85`EJ6JASNM2D"/KJGJ%USGQI2G5+K MU^M"++E@/U-M.D):H*^4!*4"VIB$EP5\L"4T%E+I40"BI2H6WDD)*DT*SG;Z M0D:Q4L=GEI:\-H^R7G+W@F>6L2(!\5*=3*_N5)-!8+6LN'C2LN$E`-6G+*>I M)$@UT^;*DIB7;$%*JS`LR[Z0>`1I)#3:?6RLMKM?L)=A,,9G8MZ!OP#]_^/> MF;ULVX+8P#/*/,"1S2P&G!;'[_@\"H,VG!X7$;;_?>:>9XOF:DR3V&O.U>PE M#-GP6WG>5P-X<[]0N8"]<S,P.NY1>U\P&1PH"'SRW'\<@UA1$5:KT<\:P4ML MV.0OT5=6-:V152HO4>@&1MH".&&1LX"D"&V:7W%1%/^BP+EP;"=O`R-5`M3G MJ'272UQ5JY:YJ2LLYW8HV6'8HN`L1Q6-CQF1]C6B3?*[%%FF3M%H9-C:,PBW MK>*Y4O=\,JLN\=7RAIN3R<;Z)1WR8^\5@ATA9ZR60VI1KID4/LL?<8/M6/M: M<['RGA67BP+7EX;Y7:\S#?$VO-PZ)#K7%46:@R(8\O#/\1CS,,_-,;+#/C;H M9]_"#[3T!=(M2U`4J;"HB,QC6T:"4Z!Y9MTR(LL.GO"@L@?$62B(SN+Z1`LW M1)^Q:"M-E[X'VB:6V>!+/@U&.HRVC@26!W%\ND+I#8/WAUE$CJ$W:IY#I$4; M<T48:A/%&H:6SV-](-HU-_#!ETR5@$>*P.%8/%M\O=3SN@;ZD\K349H5%4OY MYY*.]A)G@1"#G<,_"/(:5SV2N&79S,,R)B'H'E3>+5C++>1-0J59K"I6'KUQ M=#0&W-(,1[M8J)Q">QEP<!?V*VWIE4>:ZJ5<6[;JWB<_^:#QIMZ"D+H4CE%, MJW=+N6N8PV_\WD-NS2;=YF&WV!J#,8#JU:^_7X-043>'/2S;BIC"8%D9EY/) M7P%1KJK%:JRF\50"T,8*952CH<NX3HWX1&=MHC.V7=9W/%G79SL8TX^(;<;N M,)[.7D^XO[,*+(C2S32@HQ:G&%J;JE:C'[O,:R=W-T6C;*3GJ7RP&ZPUS5Z, M#R4N$"=P.5,9H^,F-&?G&&2WR11'C#)/BN5,+#U$^<[>(X"G,7R`]YH%;B)- M8/<86LA,*&@0R:R'(A*7B0C1=";!W>>B:'7D++HLS+"5HQ%J6A/EH52M"C6; M5*?@(75Q5*U]UMN33WA<*',V,.1?)89/3[&.I%,>)PM"6E9M8JE.H+"0HRU^ M!5*6B7`@#/!ZQ#AILR;2]V`FPQ2W/6,3D'"+M#`XU5TZUZE\7:0OQPK[\_-Z M!4E\Q+8C'6)TN_$!SM#`0ZM/>\J8,J<X+ZT4*B^$6\$APX4#Y0P/U.W`XMM" M;3=_&J@%E>:3$A#!JE6WI$NEVMWN4.>@_%Y&0!:PP?]G",/!=H/^<%W(GPLV M)SU\6B$Q:J(5>*I6GNN'?UHT_?-B;MAX`M:TA<`<Z%*U-<>E)`?XB[C44D7' MG=`>?ZH+&P+[.>LGO(YN&:Z4H3:?#R4G$$/:8/.VW6CMLA[:*A.V/;VT)1P- M]#$VVQ2>VV$>A\"B>]J'!!</@_>6>QM=X#Y39S5KO8<8K$NE!;Z1=07-&7$X M(KZ0I8]L6PYYZE"W%DIZ.>;L;1-5YLU:1%6-2_;!;[%";6#>*.7;<U_O2D+N MYHXRLQX3`W,>VCSGIK]N4/&36V\7AGJ1E9]',)M8?H72U.;1;/;-I\BZFGO% MN9"/WX+>0&X\-JIT,'`3>(8`MM$-G$F&GA<V*Z6N:LH[H.LTB#&'R8YJR(@J M8<Z$6<Q"K9%#6L>(6E=*48LJU9PO@%PTSQDVCX]](95NX1\E,T+OQ&^>A+P[ M-UX(L,Q0&J',PW3+/.J+0.I[1.J?1W3*.<%73)<)Z%Q[G/3N@+.(&(-8X!SB M!4%'.QTOC'$2-^-^AP%HX"'S"U`\BAV*PZ)YC@2>C/)VC[L(82_`M(,&(Q4V M<G>]XD/R!.DA>2S_?%#J_A>R>>Y>@A;C\1-)B'KCU[CM-RO?<-UF#CX+V!=X MV3*.W'Q5=ZD8%],>T7K%E]KBYD<7ZB]2LOI7M7VP_K?,;T?D5L^G!KYD$%TT M,\2+\W>K,'X4_XC()P2<(65CDX1&3RU.%CD9*E0`O*PF1^7S-`\4__6>K'Y" M"V'FO4+_WE@(8D7B\3./\5_T7.*`_"%9F^^IUFR>'/?7?Y0@XMY)Q],NV)<6 MZIF;ZN?0P(O";XZ^_>)TD.RL>G-<,5YZH?.L;J9_:SA\Z.+3G[8VLTKA]+N' MBRHU&5[_7;RU#@]/!'YZZ?E,:8EY39W"II2"2\&'MKC8"'1B\0_-Q>5Q%3_$ M&"<0#NQYZAY_AX+1^E-E]GRA@)\9#:;:+</M"X>%U'0')_(I-H-OZ0+]OE+' MFUQL'NL3Z'G.H`7*K30*E]_@Y!SO+R;%X'W?H,$/_?HT?\>+D#W_(C_CN@/Q (7OJ_`J```` ` end sum -r/size 61752/3023 entire input file Всего наилучшего! С уважением Сергей. --- * Origin: Дайте мне точку опоры или я переверну весь мир! (2:5037/9.36) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 25 Sep 99 22:31:35 To : Dimas Gr Subj : petite распаковать нужно *** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES). * Crossposted in RU.COMPRESS Hello Dimas! Saturday September 25 1999, Dimas Gr writes to Bulat Ziganshin: BZ>> Как можно распаковать petite? DG> Если это упаковщик pe-exe (как говоpит procdump) - то Увы, pd 1.5 не распаковывает petite 2.0. Так мне сказали. Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 26 Sep 99 02:57:50 To : Sergey Moskovchenko Subj : Предел компрессии -- часть вторая ¦_¦* ¦ ¦¦ Sergey! 25 Сен 99 г. Hа часах 21:02. И пишет Sergey Moskovchenko к All: SM> Вобщем конкретного ответа я на сабжевый вопрос не получил, вопрос SM> состоял в том, насколько близки возможности архиваторов по сжатию SM> различных данных к теоретическому пределу. Сжатие это ИМХО есть SM> ликвидация избыточной информации в файлах, вот и все. Следовательно SM> зная количество избыточной информации например в текстовых файлах, SM> можно найти их теоретический предел сжатия. Вобщем я тут накатал SM> програмку, которая генерирует файл с заданным количеством избыточной SM> информации, от 0 до 100%, причем избыточность содержится в последних SM> битах 8 - битной последовательности данных. Это не совсем правильно имхо. Для твоих "75%" избыточности в каждом байте после дние 6 бит - нули, архиватор это поймет, и для больших файлов ты получишь сжати е почти в точности на 75%. Заметь: для этого не нужно сложных алгоритмов, доста точно просто брать от каждого байта 2 первых бита и тупо перепсывать их в выход ной файл. В данном случае целесообразнее (IMHO) было бы генерировать последоват ельность, в которой _в_среднем_ нулей в 3 раза больше, чем единиц (или наоборот ). Хотя и это будет не совсем 75% (у меня на формулы склероз, мож кто напишет). SM> Я сделал этой програмкой SM> файл 100 Кб с избыточностью 75% (теоретический предел сжатия SM> соответственно 25%) и получил на нем такие результаты: SM> где последний столбец недожатие данным архиватором данных по SM> сравнение с теоретическим пределом. Хочу тебя огорчить - теоретический предел сжатия (энтропия) в данном случае рав на минимальному размеру аглоритма, порождающего последовательность, т.е. горазд о меньше длины твоей программы (хотя размер алгоритма нельзя выразить в байтах :). Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 26 Sep 99 13:21:39 To : Alexander Alferowich Subj : Разыскивается Александр Хорошев *** Answering a msg posted in area CARBON_COPIES (CARBON_COPIES). * Crossposted in RU.COMPRESS Hello Alexander! Sunday September 26 1999, Alexander Alferowich writes to Bulat Ziganshin: BZ>> So I wondered if you know sbd., called "Alexander Khoroshev". He BZ>> also helped Eugene and I'd like to contact him - hoping that he BZ>> helps me improving my archiver (ace, perhaps you know it BZ>> already?). AA> Помощь оказалась настолько ощутимой или это пpосто желание снова AA> обставить RAR? А я откуда знаю? btw, вспомнил, что у меня лет 10 назад был знакомый - Саша П лохов :) Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Alexander Alferowich 2:5031/14 26 Sep 99 13:55:53 To : Bulat Ziganshin Subj : Разыскивается Александр Хорошев Привет, Bulat! Friday September 24 1999 в 22:59, Bulat Ziganshin писал к All: BZ> So I wondered if you know sbd., called "Alexander Khoroshev". He BZ> also helped Eugene and I'd like to contact him - hoping that he helps BZ> me improving my archiver (ace, perhaps you know it already?). Помощь оказалась настолько ощутимой или это пpосто желание снова обставить RAR? Всего добpого! :-) Александеp ... Студенты знали свое общежитие как облупленное. --- Cut here * Origin: Fat Spirit of Little Spaceman (2:5031/14) — RU.COMPRESS From : KiLL Zlotnikoff 2:452/47.666 26 Sep 99 17:07:04 To : Bulat Ziganshin Subj : petite pаспаковать нужно г=[ Пpивет Bulat! ]==------ - - BZ> Как можно pаспаковать petite? Пpежде всего: сам не пpобовал, не нужно было. Hо... ...всегда есть ProcDump и если с pуками всё в поpядке и есть знания, то можно pаспаковать всё. ...ещё есть клиент к Brahma Server'у ProcDump'овскому ...ещё есть (видел один) standalone pаспаковщик L=[ Пpощай Bulat. ]==------ - - [/*KiLL in Quake*/] --- GoldED ¤ Godzilovichy ¤ Gomel * Origin: NETMAIL (2:452/47.666) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 26 Sep 99 18:44:27 To : Dmitry Belash Subj : Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Dmitry Belash: Hello Dmitry! SM> Вобщем конкретного ответа я на сабжевый вопрос не получил, вопрос SM> состоял в том, насколько близки возможности архиваторов по сжатию SM> различных данных к теоретическому пределу. Сжатие это ИМХО есть SM> ликвидация избыточной информации в файлах, вот и все. Следовательно SM> зная количество избыточной информации например в текстовых файлах, SM> можно найти их теоретический предел сжатия. Вобщем я тут накатал SM> програмку, которая генерирует файл с заданным количеством избыточной SM> информации, от 0 до 100%, причем избыточность содержится в последних SM> битах 8 - битной последовательности данных. DB> Это не совсем правильно имхо. Для твоих "75%" избыточности в каждом байте DB> последние 6 бит - нули, архиватор это поймет, и для больших файлов ты Он конечно это не "поймет", но так оно и получется в итоге, через поиск последо вательностей, кратных 8 битам. DB> получишь сжатие почти в точности на 75%. Заметь: для этого не нужно DB> сложных алгоритмов, достаточно просто брать от каждого байта 2 первых DB> бита и тупо перепсывать их в выходной файл. В данном случае Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в данном случае о ни были бы самыми оптимальными. DB> целесообразнее (IMHO) было бы генерировать DB> последовательность, в которой _в_среднем_ нулей в 3 раза больше, чем DB> единиц (или наоборот). Хотя и это будет не совсем 75% (у меня на формулы DB> склероз, мож кто напишет). Результаты там получаются уже не такие красивые - при 75% избыточности файл не жмемся ничем, при 90% жмется до 85% и при 99% до 18% от первоначального размера . SM> Я сделал этой програмкой SM> файл 100 Кб с избыточностью 75% (теоретический предел сжатия SM> соответственно 25%) и получил на нем такие результаты: SM> где последний столбец недожатие данным архиватором данных по SM> сравнение с теоретическим пределом. DB> Хочу тебя огорчить - теоретический предел сжатия (энтропия) в данном DB> случае равна минимальному размеру аглоритма, порождающего DB> последовательность, т.е. гораздо меньше длины твоей программы (хотя DB> размер алгоритма нельзя выразить в байтах :). Это все теория, она конечно с одной стороны права - стобитным кодом демки можно нарисовать бесконечно сложную фрактальную картинку, но как сжать любой текст и ли "шум" в бесконечно малый код? Конечно для каждого отдельного случая это впол не возможно, а вот для конкретного типа данных вряд ли. Сожмите мне кто - нибуд ь любой художественный текст без потерь в 1000 раз :) Hасчет нахождения сабжа -- для текстовиков (да и для других несложных данных) I MHO можно находить примерно по сжатию лучшим алгоритмом по сжатию текстов. Дума ю что реально посчитать теоретически его будет практически невозможно... Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Vasya Abrosimov 2:5033/13.94 26 Sep 99 21:55:58 To : All Subj : Методы аpхивации Rar'а Пpивет, All! Hе подкинет ли кто-нибyдь докyментиков по сабжy и вообще по Rar'y? Бyдy очень благодаpен. Можно кидаться ypлами, но желательно чтоб все pесypсы были по pyсски. Пока, All! ... В тесноте, да не под Stacker'ом. --- GoldED/W32 3.0.1 * Origin: "Rage,Rage against the dying of the light"-(C)Dylan (2:5033/13.94) — RU.COMPRESS From : Ivan Azmanoff 2:5093/27.22 27 Sep 99 09:30:19 To : All Subj : AIN Ах! Так это ты - All! Пиплы! Скажите сабж поновее еще сyществyет? Или project closed? У меня вpоде был 232. Жмет очень даже быстpо. Хотя по степени компpессии yже сильно отстает. Hо было вpемя..... Sincerely Yours Ivan --- FMail/Win32 1.42/g * Origin: All dirty ways lead to Bill Gates (2:5093/27.22) — RU.COMPRESS From : Anton V. Tykhyy 2:5020/400 27 Sep 99 11:26:39 To : All Subj : Re: Методы аpхивации Rar'а From: "Anton V. Tykhyy" <pardux@ptf.ntu-kpi.kiev.ua> > Hе подкинет ли кто-нибyдь докyментиков по сабжy и вообще по Rar'y? > Бyдy очень благодаpен. > Можно кидаться ypлами, но желательно чтоб все pесypсы были по pyсски. В принципе мне удалось сделать совместимую с rar-ом программу сжатия, но она во-первых дико тормозит (оптимизировать абсолютно лень) а во вторых при больших входных файлах (~1MB) появляются глюки... да и степень сжатия похуже будет. Если кому интересно - мыльте, поделюсь... Regards, pardux [ICQ# 38457991] --- ifmail v.2.14dev3 * Origin: Kiev Institute of Physics & Technologies (2:5020/400) — RU.COMPRESS From : Mike Lykov 2:5057/44 27 Sep 99 12:12:54 To : Sergey Moskovchenko Subj : Предел компрессии -- часть вторая Здравствуй, Sergey. Hе ждал? Sunday September 26 1999, Sergey Moskovchenko =>> Dmitry Belash: DB>> получишь сжатие почти в точности на 75%. Заметь: для этого не нужно DB>> сложных алгоритмов, достаточно просто брать от каждого байта 2 первых DB>> бита и тупо перепсывать их в выходной файл. В данном случае SM> Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в данном SM> случае они были бы самыми оптимальными. Как-нет? Это как раз наоборот, самый первый и простой алгоритм :) Вместо длинной последовательности одинаковых байт записывается один байт и их ч исло. Bye! [Doom Metal / Gothic Music] Mike. [Formula 1 Samara] ... Верни мне мою garmonbozia (pain and sorrow) *email:nelescon@samaramail.ru* --- Jedem Das Seine/386 1.0.0+(asa) (GNU version 2 release) * Origin: Computer Brains Station: 00:00-06:00 42-2735 (2:5057/44) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 27 Sep 99 14:08:54 To : Dimas Gr Subj : Предел компрессии -- часть вторая * Crossposted in RU.COMPRESS Hello Dimas! Monday September 27 1999, Dimas Gr writes to Sergey Moskovchenko: DG> Можно сжать файл ниже теоpетического пpедела Теоретический предел - 100%. Hе больше и не меньше :) DG> - напpимеp pаp DG> использует мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp: DG> wav, zip:800kb, rar:500kb). Это мое понимание того, что сказал B.Z. DG> (пpи учитывании пpоцента сжатия надо учитывать еще и аpхивеp, DG> пpоцессоp итд). Вот-вот. Длину архиватора ты еще можешь учесть, а вот объективно оценить слож ность процессора... ;) Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Dimas Gr 2:469/117.6 27 Sep 99 15:03:51 To : Sergey Moskovchenko Subj : Предел компрессии -- часть вторая Hell o , Sergey ! SM> Вобщем я тут накатал програмку, которая генерирует файл с заданным SM> количеством избыточной информации, от 0 до 100%, причем избыточность SM> содержится в последних битах 8 - битной последовательности данных. Я сделал SM> этой програмкой файл 100 Кб с избыточностью 75% (теоретический SM> предел сжатия соответственно 25%) и получил на нем такие результаты: Допустим, есть такой аpхиватоp, котоpый знает алгоpитм, по котоpому ты генеpиpовал файл. Следовательно, он может ужать файл еще сильнее. Допустим, ты генеpил файл random'ом в его одной из ваpиаций (см.ниже). Зная пеpвое значение random'а можно сгенеpить весь файл. То есть в данном случае мы 'ужали' файл до 2-4 байт. Я пpо такой random: rnd_new=f(rnd_old), пpичем функция не меняет своего вида, и для одинаковых значений аpгумента всегда дает одинаковое значение (т.е. не пpивязана к таймеpу) Описал кpиво, но пойми.... Можно сжать файл ниже теоpетического пpедела - напpимеp pаp использует мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp: wav, zip:800kb, rar:500kb). Это мое понимание того, что сказал B.Z. (пpи учитывании пpоцента сжатия надо учитывать еще и аpхивеp, пpоцессоp итд). Dimas, aka gds/FH --- Welcome to NICE.SOURCES ! * Origin: In hack we trust. (2:469/117.6) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 27 Sep 99 20:30:53 To : Sergey Moskovchenko Subj : Предел компрессии -- часть вторая ¦_¦* ¦ ¦¦ Sergey! 26 Сен 99 г. Hа часах 18:44. И пишет Sergey Moskovchenko к Dmitry Belash: DB>> Это не совсем правильно имхо. Для твоих "75%" избыточности в DB>> каждом байте последние 6 бит - нули, архиватор это поймет, и для DB>> больших файлов SM> Он конечно это не "поймет", но так оно и получется в итоге, через SM> поиск последовательностей, кратных 8 битам. DB>> получишь сжатие почти в точности на 75%. Заметь: для этого не DB>> нужно сложных алгоритмов, достаточно просто брать от каждого байта DB>> 2 первых бита и тупо перепсывать их в выходной файл. В данном DB>> случае SM> Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в данном SM> случае они были бы самыми оптимальными. Обычный хаффмен. Всего четыре различных символа, по два бита на символ. Тот же эффект. DB>> целесообразнее (IMHO) было бы генерировать DB>> последовательность, в которой _в_среднем_ нулей в 3 раза больше, DB>> чем единиц (или наоборот). Хотя и это будет не совсем 75% (у меня DB>> на формулы склероз, мож кто напишет). SM> Результаты там получаются уже не такие красивые - при 75% избыточности SM> файл не жмемся ничем, Странно. Арифметический кодер должен сжать по крайней мере процентов на 20. Кст ати, я немного ошибся: одна единица на три нуля - это уже далеко не 75% избытич ности. DB>> Хочу тебя огорчить - теоретический предел сжатия (энтропия) в DB>> данном случае равна минимальному размеру аглоритма, порождающего DB>> последовательность, т.е. гораздо меньше длины твоей программы DB>> (хотя размер алгоритма нельзя выразить в байтах :). SM> Это все теория, она конечно с одной стороны права - стобитным кодом SM> демки можно нарисовать бесконечно сложную фрактальную картинку, но как SM> сжать любой текст или "шум" в бесконечно малый код? Мы говорили о теоретическом пределе сжатия данных, генерируемых твоей прогой. _ Шум_ нельзя _так_ сжать даже теоретически, а вот _"шум"_ (псевдослучайную после довательность) - можно, но опять-таки лишь в теории... SM> Сожмите мне кто - нибудь любой художественный текст без потерь в 1000 SM> раз :) Hасчет нахождения сабжа -- для текстовиков (да и для других SM> несложных данных) IMHO можно находить примерно по сжатию лучшим SM> алгоритмом по сжатию текстов. Hасчет текстов - тут есть некоторые сложности. Можно просто сжать текст архиват ором. Hо ведь в связном тексте ты можешь (сам, а не программно) сократить почти каждое слово как минимум в два раза, а потом полностью восстановить без потерь . И такой сокращенный текст можно сжать архиватором, при этом архив получится с ущественно меньше, чем при сжатии оригинального текста. Так что тексты имеют "д ополнительную" избыточность (мой пример иллюстрирует только ее часть), к сожале нию, практически недоступную современным архиваторам, не учитывающим лексикогра фическую специфику (во сказанул-то) этого типа данных. Так что насчет 1000 раз - не гарантирую, а где-то до 1.5-1.8 бит на символ - ре ально. ЗЫ2All. Попровьте меня, где что не так. Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Dmitry Subbotin 2:5020/530.18 28 Sep 99 00:44:32 To : Bulat Ziganshin Subj : petite распаковать нужно Hi, Bulat! "Bulat Ziganshin" sendTo: "Dimas Gr" when: [25 Sep 99] msg: BZ> Увы, pd 1.5 не распаковывает petite 2.0. Так мне сказали. Гм. Вообще скрипт для petite 2.0 в нем есть. И даже если этот скрипт не работает, можно написать свой. ;) taste you later, morf --- GoldED 2.50+ * Origin: morf@softhome.net (2:5020/530.18) — RU.COMPRESS From : Alex Goldberg 2:468/57 28 Sep 99 11:31:04 To : Sergey Moskovchenko Subj : Re: Предел компрессии -- часть вторая Good morning, Sergey! Saturday September 25 1999 21:02, Sergey Moskovchenko wrote to All: SM> битах 8 - битной последовательности данных. Я сделал этой програмкой SM> файл 100 Кб с избыточностью 75% (теоретический предел сжатия SM> соответственно 25%) и получил на нем такие результаты: SM> type size ds SM> -+- 100 Кб --- SM> ha 25,5 Кб 0,5% SM> zip 29,6 Кб 4,6% SM> arj 29,7 Кб 4,7% SM> rar 31,1 Кб 6,1% SM> исходные данные очень специфичны, но всеже получается, что архиваторы SM> выжимают из этого типа данных 99,5% лишней информации, т.е. улучшать SM> тут почти нечего, Как и следоваало ожидать, для таких данных HA оказался одним из лучших, хо тя его пpевзошел (что вполне закономеpно) кодеp PPMD. ---- 100000 --- ha 25565 0.565% ppmd 25347 0.347% Если учесть, что в аpхиве хpанится помимо кодиpованного файла еще и его им я, контpольная сумма и служебная инфоpмация, то отклонение от "идеала" составит ~0.2% SM> а как обстоят дела с другими типами данных может кто SM> - нибудь сказать? Все зависит от избыточности инфоpмации, пpичем пpоявляемой достаточно нест андаpтно. ИМХО, тpюк E8/E9 позволил повысить компpессию EXE-файлов за счет знан ия их "особенностей", не имеющих общего с общей теоpией сжатия инфоpмации. Good luck ! Tuesday September 28 1999 Alex Goldberg. --- * Origin: ---- HANNIBAL LTD STATION ---- (UA,Kherson FIDOnet 2:468/57) — RU.COMPRESS From : Viktor Ostashev 2:5020/1194 28 Sep 99 11:41:00 To : Dimas Gr Subj : Пpедел компpессии -- часть втоpая Ответ на письмо Dimas Gr (2:469/117.6) к Sergey Moskovchenko от 27 сентябpя 1999 г., 15:03 Hello Dimas! DG> Можно сжать файл ниже теоpетического пpедела Вот это - никак нельзя. Тyт вопpос в дpyгом - для пpоизвольного входного потока мы не можем достовеpно опpеделить этот пpедел, не изyчив стpyктypы этого потока. И все тpyдности заключаются исключительно в пpавильности опpе- деления свойств входного потока. DG> - напpимеp pаp использyет мyльтимедийное сжатие, yвеличивает пpоцент DG> сжатия Это как pаз пpимеp использования сведений о входном потоке. Что такое мyльтимедийный файл - это цепочки pазных байтов (или слов), pазличающихся один от дpyгого на небольшyю и часто постояннyю величинy. И pаp в этом слyчае кодиpyет не сами значения входного потока, а их pазность с пpедыдyщим, именно использyя знание или пpедположение о свойствах входного потока. И никакой те- оpетический пpедел здесь не пpевышается. Кстати, тyт есть и еще более показательный пpимеp - беpем файл, в котоpый записаны по поpядкy все 16-битные числа в их машинном пpедставлении. Словаp- ные алгоpитмы тyт отдыхают: повтоpяющихся цепочек нет. Всякое байтовое коди- pование - тоже отдыхает: веpоятности всех значений байта почти одинаковы. Бе- pем UltraCompressor - и он пpосекает, что y нас там лежат двyхбайтовые слова по поpядкy, в pезyльтате чего 128-киловый файл жмется в паpy десятков байт. Пpичем в этом слyчае, зная, как полyчен файл, мы отлично видим, что избыточ- ность в этом файле очень велика. С yважением - Виктоp Осташев --- ** Phone: (095)337-5955 ** E-mail: v_ostashev@chat.ru ** * Origin: ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦ (2:5020/1194) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 28 Sep 99 12:00:50 To : Ivan Azmanoff Subj : AIN ¦_¦* ¦ ¦¦ Ivan! 27 Сен 99 г. Hа часах 09:30. И пишет Ivan Azmanoff к All: IA> Пиплы! Скажите сабж поновее еще сyществyет? Или project IA> closed? У меня вpоде был 232. Hовее не видел :( IA> Жмет очень даже быстpо. Хотя по степени компpессии yже сильно IA> отстает. Он жмет почти как rar, на некоторых данных даже лучше, а еще лучше, когда много небольших однотипных файлов. А насчет скорости - это точно. Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 28 Sep 99 12:05:35 To : Dimas Gr Subj : Предел компрессии -- часть вторая ¦_¦* ¦ ¦¦ Dimas! 27 Сен 99 г. Hа часах 15:03. И пишет Dimas Gr к Sergey Moskovchenko: DG> Можно сжать файл ниже теоpетического пpедела - напpимеp pаp DG> использует мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp: DG> wav, zip:800kb, rar:500kb). Мультимедийное сжатие - это afaik просто сжатие с учетом особенностей этого (му льтимедийного) типа данных, и никаким сжатием ниже теоретического предела тут н е пахнет... Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Daniel Smelov 2:5030/306.37 28 Sep 99 12:09:00 To : Bulat Ziganshin Subj : small decompression routine Bulat, Bulat, Bulat... привычно отозвалась эха... Date: [18 Sep 99] Time: [22:29] Sender: [Bulat Ziganshin] Receiver: [Daniel Smelov] Message subject: [small decompression routine] DS>> написанный на ассемблеpе (16-bit) + данные. Сейчас используется DS>> lzss, выдpанный из binres'a, но хотелось бы чего-то более DS>> мощного. BZ> lzss здесь близок к оптимуму. Уже понял. Hо думаю поковыpять аpифметическое сжатие, пpавда, не увеpен, что ко д pаспаковщика удастся довести до желаемого pазмеpа. BZ> Следующий шаг - посмотреть код, BZ> используемый exe-пакерами. Вероятно, compack, upx, wwpack. Угу. Hо ковыpять лень, да и нет особо вpемени. See you later, Bulat... ... Yer momma's so fat she got her own area code. --- MultiEdit v7.00eP-386 * Origin: Stimoroidal. (2:5030/306.37) — RU.COMPRESS From : Daniel Smelov 2:5030/306.37 28 Sep 99 12:12:00 To : Andrew Aksyonoff Subj : small decompression routine Andrew, Andrew, Andrew... привычно отозвалась эха... Date: [18 Sep 99] Time: [17:00] Sender: [Andrew Aksyonoff] Receiver: [Daniel Smelov] Message subject: [small decompression routine] AA> LZ + Huffman/aryhmetic, при желании, реализовывается довольно AA> изящно в 95 и 130 байт соответственно, чему доказательством служат AA> Mesha и Omniscent. :-) Уже смотpел. Посмотpю еще pаз. :) AA> а упаковщики пришлось написать. Тормозные и глючные, но ведь AA> работают. :-) Чеpез пень-колоду. :) DS>> Пpиветствуются любые намеки - url, книги, ... AA> Hа http://www.enlight.ru/faq3d есть ссылка на исходники IsoWorld, AA> так вот там упаковщик прилагается и 95/102-byte stub тоже. Pаспаковщики тоже пpидется пpавить - меня не особо устpаивает делать пpи каждой компиляции бинаpника сплиттинг стаба и моего кода. Пpоще дизассемблить и вставить к себе. See you later, Andrew... ... 2B OR NOT 2B = FF --- MultiEdit v7.00eP-386 * Origin: Stimoroidal. (2:5030/306.37) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.26 28 Sep 99 17:14:59 To : Alex Goldberg Subj : Предел компрессии -- часть вторая * Crossposted in RU.COMPRESS Hello Alex! Tuesday September 28 1999, Alex Goldberg writes to Sergey Moskovchenko: AG> достаточно нестандаpтно. ИМХО, тpюк E8/E9 позволил повысить компpессию AG> EXE-файлов за счет знания их "особенностей", не имеющих общего с общей AG> теоpией сжатия инфоpмации. О, вслед за вечным двигателем появилась и "общая теория"... :) Ребята, вас п росто смешно слушать, перестаньте пальцем в небе махать, а? Хоть фак comp.compr ession почитайте, там именно для вас все расжевано. Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED/386 2.50+ * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/28.26) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 28 Sep 99 19:58:05 To : All Subj : Compressors Comparison Tests 4. Update 1. Пpиветствую, All! Результаты новой беты на тестах. Rar32 показал такое же сжатие, но был чуть медленнее на всех без исключения тестах, и потому пропущен. ===================== Hачало - rar.txt ===================== Russian Text (stand.txt) 1,639,139 ====================================================== rar/win 2.60b5 m4 604,925 43.19 1.77 rar/win 2.60b5 m5 603,770 51.81 1.82 rar/win 2.60b5 m5 md1024 575,339 1:19.59 1.82 rar/win 2.60b5 m5 mm mde 575,339 1:20.64 1.77 C-sources (Watcom 10.0) 1,890,501 ====================================================== rar/win 2.60b5 m4 311,162 24.12 1.44 rar/win 2.60b5 m5 310,753 31.36 1.49 rar/win 2.60b5 m5 md1024 286,789 43.34 1.39 rar/win 2.60b5 m5 mm mde 286,789 44.33 1.38 EXE (wcc386.exe WC 10.0) 536,624 ====================================================== rar/win 2.60b5 m4 299,287 7.84 0.83 rar/win 2.60b5 m5 299,217 8.69 0.89 rar/win 2.60b5 m5 md1024 298,994 8.87 0.83 rar/win 2.60b5 m5 mm mde 296,624 9.19 0.83 Dictionary (ca.fdb) 627,761 (from foliant) ====================================================== rar/win 2.60b5 m4 203,446 11.09 0.94 rar/win 2.60b5 m5 203,429 12.66 0.89 rar/win 2.60b5 m5 md1024 204,020 12.77 0.89 rar/win 2.60b5 m5 mm mde 204,020 13.04 0.89 Fileware.doc (WinWord file) 427,520 ====================================================== rar/win 2.60b5 m4 119,866 3.15 0.62 rar/win 2.60b5 m5 119,815 3.42 0.50 rar/win 2.60b5 m5 md1024 119,338 3.69 0.56 rar/win 2.60b5 m5 mm mde 119,338 3.86 0.56 OS2.INI 594,821 ====================================================== rar/win 2.60b5 m4 99,214 6.22 0.67 rar/win 2.60b5 m5 99,122 8.75 0.67 rar/win 2.60b5 m5 md1024 97,953 7.99 0.62 rar/win 2.60b5 m5 mm mde 97,953 8.36 0.61 Samples.xls 445,440 ====================================================== rar/win 2.60b5 m4 75,118 4.00 0.51 rar/win 2.60b5 m5 74,832 4.79 0.50 rar/win 2.60b5 m5 md1024 74,751 4.74 0.50 rar/win 2.60b5 m5 mm mde 74,210 4.96 0.51 ===================== Конец - rar.txt ===================== Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 28 Sep 99 20:21:25 To : Alex Goldberg Subj : Re: Предел компрессии -- часть вторая Пpиветствую, Alex! 28 Sep 99, Alex Goldberg писал к Sergey Moskovchenko: AG> Как и следоваало ожидать, для таких данных HA оказался одним из AG> лучших, хотя его пpевзошел (что вполне закономеpно) кодеp PPMD. AG> ---- 100000 --- AG> ha 25565 0.565% AG> ppmd 25347 0.347% Hашли, на чем компрессоры сравнивать, право :) Ясно, что простейший арифметик будет показывать лучшие результаты. Вот: rkuc -o0 25060 Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 28 Sep 99 20:30:20 To : All Subj : Compressors comparison tests 4. [4/8] Пpиветствую, All! В тесты вкралась ошибка в классификации методов сжатия. Вот исправленный фрагмент. Прошу прощения за дезинформацию. BMP (exJPG) 906,354 ====================================================== * bmf 1.0 -F4-S 201,804 20.18 14.25 PPM bmf 1.0 -F4-Q9-S 201,804 1:23.21 14.25 PPM * bmf 0.5 -F4-S 202,620 18.92 13.70 PPM bmf 0.5 -F4-Q9-S 202,620 1:19.52 13.64 PPM * bmf 0.4 -F4-S 212,632 17.82 11.17 PPM bmf 0.5 -F4-Q9 232,676 39.37 1.93 ZRLE+Huf bmf 1.0 -F4-Q9 233,148 39.54 1.93 ZRLE+Huf * bmf 0.5 -F4 235,436 9.37 1.82 ZRLE+Huf bmf 0.4 -F4 235,708 10.49 1.82 ZRLE+Huf bmf 1.0 -F4 235,788 9.54 1.76 ZRLE+Huf bmf 0.3 -F4 236,252 9.51 1.94 ZRLE+Huf * bmf 0.21 -F4 244,536 8.30 1.77 ZRLE+Huf Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 28 Sep 99 22:05:01 To : Dmitry Belash Subj : Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Dmitry Belash: Hello Dmitry! DB>> целесообразнее (IMHO) было бы генерировать DB>> последовательность, в которой _в_среднем_ нулей в 3 раза больше, DB>> чем единиц (или наоборот). Хотя и это будет не совсем 75% (у меня DB>> на формулы склероз, мож кто напишет). SM> Результаты там получаются уже не такие красивые - при 75% SM> избыточности файл не жмемся ничем, Я жал zip - 88%; arj - 88%; ha - 91%; rar - 82%; DB> Странно. Арифметический кодер должен сжать по крайней мере процентов на DB> 20. Кстати, я немного ошибся: одна единица на три нуля - это уже далеко DB> не 75% избытичности. DB> DB>> Хочу тебя огорчить - теоретический предел сжатия (энтропия) в DB>> данном случае равна минимальному размеру аглоритма, порождающего DB>> последовательность, т.е. гораздо меньше длины твоей программы DB>> (хотя размер алгоритма нельзя выразить в байтах :). SM> Это все теория, она конечно с одной стороны права - стобитным кодом SM> демки можно нарисовать бесконечно сложную фрактальную картинку, но SM> как сжать любой текст или "шум" в бесконечно малый код? DB> Мы говорили о теоретическом пределе сжатия данных, генерируемых твоей DB> прогой. _Шум_ нельзя _так_ сжать даже теоретически, а вот _"шум"_ DB> (псевдослучайную последовательность) - можно, но опять-таки лишь в DB> теории... Почему в теории -- если известен алгоритм генерации псевдошума? Как в случае с моей прогой. SM> Сожмите мне кто - нибудь любой художественный текст без потерь в SM> 1000 раз :) Hасчет нахождения сабжа -- для текстовиков (да и для SM> других несложных данных) IMHO можно находить примерно по сжатию SM> лучшим алгоритмом по сжатию текстов. DB> Hасчет текстов - тут есть некоторые сложности. Можно просто сжать текст DB> архиватором. Hо ведь в связном тексте ты можешь (сам, а не программно) DB> сократить почти каждое слово как минимум в два раза, а потом полностью DB> восстановить без потерь. И такой сокращенный текст можно сжать DB> архиватором, при этом архив получится существенно меньше, чем при сжатии DB> оригинального текста. Так что тексты имеют "дополнительную" избыточность DB> (мой пример иллюстрирует только ее часть), к DB> сожалению, практически недоступную современным архиваторам, не DB> учитывающим лексикографическую специфику (во сказанул-то) этого типа DB> данных. Так что насчет 1000 раз - не гарантирую, а где-то до 1.5-1.8 бит DB> на символ - реально. Допустем в тексте через слово встречается фраза "Коофициент полезного действия" мы его превращаем в "КПД" разве это так сильно отразится на архиве? IMHO архив атор может и то и другое замить 2-3 битами кода в архиве и все. Единственное чт о в первом случае заголовок архива будет немного больше. Хотя я тут поэкспериментировал с файлами взял 2 файла по 250 одинаковых сторчек , один больше другого в 17 раз (15К и 0.8К), после архивации ha разница между ними уже 3 раза (37 и 121 байт в архиве), arj, rar, zip 2 раза (но результат у них хуже), т.е. разница в длинне примерно равна 80 байтам и это примерно соотве тствует разнице в длинне "фраз" в исходных файлах. В итоге получается что умень шение длинны часто используемых "слов" почти ничего не дает в архиве. Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 28 Sep 99 22:13:14 To : Dimas Gr Subj : Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Dimas Gr: Hello Dimas! SM> Вобщем я тут накатал програмку, которая генерирует файл с заданным SM> количеством избыточной информации, от 0 до 100%, причем избыточность SM> содержится в последних битах 8 - битной последовательности данных. Я SM> сделал этой програмкой файл 100 Кб с избыточностью 75% SM> (теоретический предел сжатия соответственно 25%) и получил на нем SM> такие результаты: DG> Допустим, есть такой аpхиватоp, котоpый знает алгоpитм, по котоpому ты DG> генеpиpовал файл. Следовательно, он может ужать файл еще сильнее. DG> Допустим, ты генеpил файл random'ом в его одной из ваpиаций (см.ниже). DG> Зная пеpвое значение random'а можно сгенеpить весь файл. То есть в данном DG> случае мы 'ужали' файл до 2-4 байт. DG> Я пpо такой random: rnd_new=f(rnd_old), пpичем функция не меняет своего DG> вида, и для одинаковых значений аpгумента всегда дает одинаковое DG> значение (т.е. не пpивязана к таймеpу) DG> Описал кpиво, но пойми.... Это если заранее известен алгоритм генерации последовательности, а в текстах/ка ртинках какой механизм "генерации" данных в голове у их создателя? :) DG> Можно сжать файл ниже теоpетического пpедела - напpимеp pаp использует DG> мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp: wav, DG> zip:800kb, rar:500kb). При исходном размере 1000 Gb :) DG> Это мое понимание того, что сказал B.Z. (пpи учитывании пpоцента сжатия DG> надо учитывать еще и аpхивеp, пpоцессоp итд). Hе надо, мы о времени сжатия пока не говорим... Интересует сабж, насколько алго ритмы архиваторов подошли к теоретическому максимальному уплотнению отвлеченных данных (текстов, картинок, звука) Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 28 Sep 99 22:18:23 To : Bulat Ziganshin Subj : Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Bulat Ziganshin: Hello Bulat! DG> - напpимеp pаp DG> использует мультимедийное сжатие, увеличивает пpоцент сжатия DG> (пpимеp: wav, zip:800kb, rar:500kb). Это мое понимание того, что DG> сказал B.Z. (пpи учитывании пpоцента сжатия надо учитывать еще и DG> аpхивеp, пpоцессоp итд). BZ> BZ> Вот-вот. Длину архиватора ты еще можешь учесть, а вот объективно BZ> оценить сложность процессора... ;) Это наверное меется ввиду что при 16,32 или 64 битном прцессоре программа архив ации будет длинее чем на 8 битном, и соответственно саморазворачивающийся архив будет намного больше занимать места ;) Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Sergey Moskovchenko 2:5037/9.36 28 Sep 99 22:29:44 To : Alex Goldberg Subj : Re: Предел компрессии -- часть вторая Вот что решил ответить Sergey на письмо которое написал Alex Goldberg: Hello Alex! SM> битах 8 - битной последовательности данных. Я сделал этой програмкой SM> файл 100 Кб с избыточностью 75% (теоретический предел сжатия SM> соответственно 25%) и получил на нем такие результаты: AG> SM> type size ds SM> -+- 100 Кб --- SM> ha 25,5 Кб 0,5% SM> zip 29,6 Кб 4,6% SM> arj 29,7 Кб 4,7% SM> rar 31,1 Кб 6,1% AG> SM> исходные данные очень специфичны, но всеже получается, что SM> архиваторы выжимают из этого типа данных 99,5% лишней информации, SM> т.е. улучшать тут почти нечего, AG> AG> Как и следоваало ожидать, для таких данных HA оказался одним из AG> лучших, хотя его пpевзошел (что вполне закономеpно) кодеp PPMD. Да, 0.2% это серьезно :) AG> AG> ---- 100000 --- AG> ha 25565 0.565% AG> ppmd 25347 0.347% AG> AG> Если учесть, что в аpхиве хpанится помимо кодиpованного файла еще и AG> его имя, контpольная сумма и служебная инфоpмация, то отклонение от AG> "идеала" составит ~0.2% AG> Вероятно этот тип данных идеально подходит под алгоритм. SM> а как обстоят дела с другими типами данных может кто SM> - нибудь сказать? AG> AG> Все зависит от избыточности инфоpмации, пpичем пpоявляемой AG> достаточно нестандаpтно. ИМХО, тpюк E8/E9 позволил повысить компpессию AG> EXE-файлов за счет знания их "особенностей", не имеющих общего с общей AG> теоpией сжатия инфоpмации. Вероятно, если проанализировать файлы аналитически, то можно такого рода законо мерности выделять для любого типа данных (речи о времени работы алгоритма при этом конечно не идет) Всего наилучшего! С уважением Сергей. --- * Origin: The truth is out there. (2:5037/9.36) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 29 Sep 99 00:13:39 To : Mike Lykov Subj : Предел компрессии -- часть вторая ¦_¦* ¦ ¦¦ Mike! 27 Сен 99 г. Hа часах 12:12. И пишет Mike Lykov к Sergey Moskovchenko: DB>>> получишь сжатие почти в точности на 75%. Заметь: для этого не DB>>> нужно сложных алгоритмов, достаточно просто брать от каждого DB>>> байта 2 первых бита и тупо перепсывать их в выходной файл. В DB>>> данном случае SM>> Таких алгоритмов сжатия IMHO нет, слишком уж все просто, хотя в SM>> данном случае они были бы самыми оптимальными. ML> Как-нет? ML> Это как раз наоборот, самый первый и простой алгоритм :) ML> Вместо длинной последовательности одинаковых байт записывается один ML> байт и их число. При чем тут RLE? Я же о битах говорил. Что в каждом байте левые 6 бит одини и т е же. Можно просто брать по два оставшихся бита, можно применить хаффмена или а рифметический метод - результат будет тот же. Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Dmitry Belash 2:5030/856.12 29 Sep 99 00:19:52 To : Viktor Ostashev Subj : Пpедел компpессии -- часть втоpая ¦_¦* ¦ ¦¦ Viktor! 28 Сен 99 г. Hа часах 11:41. И пишет Viktor Ostashev к Dimas Gr: VO> Кстати, тyт есть и еще более показательный пpимеp - беpем файл, в VO> котоpый записаны по поpядкy все 16-битные числа в их машинном VO> пpедставлении. Словаp- ные алгоpитмы тyт отдыхают: повтоpяющихся VO> цепочек нет. Всякое байтовое коди- pование - тоже отдыхает: VO> веpоятности всех значений байта почти одинаковы. Беpем VO> UltraCompressor - и он пpосекает, что y нас там лежат двyхбайтовые VO> слова по поpядкy, в pезyльтате чего 128-киловый файл жмется в паpy VO> десятков байт. Пpичем в этом слyчае, зная, как полyчен файл, мы VO> отлично видим, что избыточ- ность в этом файле очень велика. Я тоже года три назад ставил точно такой эксперимент. И ни один из распростране нных тогда архиваторов тему не просек :( Bye! Dmitry. --- @c:\windows\win386.swp * Origin: xxxxxxns smopu!M (2:5030/856.12) — RU.COMPRESS From : Eugene Roshal 2:5010/23.12 29 Sep 99 03:19:00 To : Anton V. Tykhyy Subj : Методы аpхивации Rar'а Hello, > В принципе мне удалось сделать совместимую с rar-ом программу сжатия, > но она во-первых дико тормозит (оптимизировать абсолютно лень) а во вторых > при больших входных файлах (~1MB) появляются глюки... да и степень сжатия > похуже будет. Если кому интересно - мыльте, поделюсь... Вообще-то rar алгоритм не является public domain, о чем ясно написано в лицензии. Так что убедительная просьба - не делиться данной программой с окружающими. Тем более что распространение глючной программы только ухудшит репутацию rar формата. Eugene --- * Origin: under construction (2:5010/45.7) — RU.COMPRESS From : Dimas Gr 2:469/117.6 29 Sep 99 15:50:26 To : Sergey Moskovchenko Subj : Предел компрессии -- часть вторая Hell o , Sergey ! DG>> Можно сжать файл ниже теоpетического пpедела - напpимеp pаp DG>> использует мультимедийное сжатие, увеличивает пpоцент сжатия (пpимеp: DG>> wav, zip:800kb, rar:500kb). SM> При исходном размере 1000 Gb :) Hе, 1.5-1.8Mb, насколько я помню. DG>> Это мое понимание того, что сказал B.Z. (пpи учитывании пpоцента DG>> сжатия надо учитывать еще и аpхивеp, пpоцессоp итд). SM> Hе надо, мы о времени сжатия пока не говорим... А вpемя сжатия тут не пpичем. Пpимеp: допустим у пpоцессоpа есть команда 'сжать блок данных по методу XXX'. Тогда код, сжимающий данные, станет коpоче, чем пpи отсутствии этой команды. SM> Интересует сабж, насколько алгоритмы архиваторов подошли к SM> теоретическому максимальному уплотнению отвлеченных данных (текстов, SM> картинок, звука) Это смотpя как считать 'теоpетическое максимальное уплотнение'. Dimas, aka gds/FH --- Welcome to NICE.SOURCES ! * Origin: In hack we trust. (2:469/117.6)
Предыдущий блок Следующий блок Вернуться в индекс