Предыдущий блок | Следующий блок | Вернуться в индекс |
— RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 07 Feb 00 15:43:50 To : All Subj : Re: my metod 1 From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Привет, Вадим ! Меня всегда очень раздражали выпады против ACB Буяновского, дескать "у тебя есть шанс догнать по тормознутости ACB". Как ни странно, ты первый, кому удалось этого добиться. Hо пойдем по порядку: > Я нашел (в 1993 году) универсальный метод (алгоритм) поиска > повторяющихся последовательностей для последующего Lсжатия¦ данных без > потерь. Hасколько мне известно, до сего времени не было публикаций о > таком методе поиска повторяющихся последовательностей. Отсутствие публикаций, как правило, означает одно из трех: (1) ты сделал великое открытие, (2) ты плохо искал, (3) это такая фигня, что и без публикаций всем было все ясно. :) Тем не менее, я склоняюсь ко второму пункту. > Поэтому, если использовать этот метод для Lсжатия¦ данных, то > оно будет самым максимальным, насколько это вообще возможно (очевидно, > что начиная с некоторой длины файла в нем будут присутствовать > повторяющиеся последовательности длины n. Во-первых, словарные методы уже давно не являются самыми эффективными, ибо ссылочное кодирование в чистом виде не может соперничать с оценочным. Во-вторых, для большинства словарных методов достаточным является нахождение только наибольшего (или достаточно большого) совпадения со строкой, а этого можно добиться не за N^2 (об этом еще пойдет речь). > Если подходить с точки зрения теории информации, то мой алгоритм > относится к теории кодирования, так как он находит избыточность в > последовательности символов и в дальнейшем возможна замена повторяющихся > символов ссылками на предыдущие. Это в каком-то смысле философский вопрос: любой алгоритм сжатия можно отнести к теории кодирования; однако в прочитанных мною книжках по теории кодирования я очень редко встречал упоминания об алгоритмах сжатия. > В настоящий момент наиболее широкое распространение для Їсжатия¦ > данных получили методы А. Лемпела и Дж. Зива. Это в первой половине 90х они получили широкое распространение. >Алгоритм: > ... > Эта схему, где ищутся совпадения для нового документа по имеющемуся >набору старых документов (словарю), выгодно применять в коммуникациях, >вместо стандарта V.42bis. Я тут некоторое время назад изучал проблему сжатия при передачи информации. Так вот, в телекоммуникационных технологиях востребованы алгоритмы, очень непритязательные к машинным ресурсам (процессор+память). Если бы эти ресурсы не имели такого значения, то все бы с радостью забабахали в модем алгоритм Буяновского (он так и предлагал) и, тем самым, увеличили бы пропускную способность канала связи в 1.5-2 раза (по сравнению с современным подходом, подразумевающим использование MNP5, MNP7 и V.42bis). >Пример на C: > ... Скомпилировал я его на VC 6.0, предварительно выкинув весь вывод в файл. Конституцию РФ (83 Кб) обработать не удалось, так как через полторы минуты у меня кончилось терпение. Тогда я взял файл размером 15 Кб. Твой алгоритм работал со скоростью 2 Кб/сек, тогда как ACB в режиме, дающем максимальную эффективность сжатия, сжимал со скоростью 10 Кб/сек. Замечу, что ACB на текстовых фалах очень заметно (иногда в полтора раза) обгоняет все словарные алгоритмы. Попытка произвести оптимальный разбор в словарном алгоритме вряд ли принесет более 5%. Однако для того, чтобы понять все недостатки предложенного метода, можно было и не проводить тест. Сложность твоего алгоритма N^2. Современные словарные алгоритмы часто имеют сложность O(N log N). Можно добиться и линейной сложности. Так, одним из вариантов реализации поиска в словарном алгоритме является использование в нем преобразования Барроуза-Уилера. Это преобразование может быть выполнено за O(N log N) или за O(N) (правда, в последнем случае может получиться очень весомый коэффициент). Хороший упаковщик сегодня имеет скорость сжатия текстовой информации >100 Kб/сек (Pentium 166, 32 Mb). Как видно, предложенный алгоритм ну никак не укладывается в эти рамки (O(N^2) это далеко не O(N log N)). С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Bulat Ziganshin 2:5093/27.61 07 Feb 00 19:08:20 To : All Subj : еще один mm compressor Hello All! http://www.melodymachine.com/sfark.htm на 10-20% лучше rar2. увы, пока пакует только .sf2 файлы, но они обещают сделать другую программу, которая будет паковать все. там же есть ссылка на wavearc и хвалится sfpack (тоже sf2-only). Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED+/W32 1.1.2 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/27.61) — RU.COMPRESS From : Max Smirnov 2:5030/706.11 07 Feb 00 20:20:02 To : Yury Reshetov Subj : Re: Арифмитическое кодирование в проге! Hello Yury! Wed Feb 02 2000, Yury Reshetov writes to ZAB: YR> UPDATE. То бишь апдейт можно фоpмулиpовать напpямую и задавать в виде YR> жесткой фоpмулы, можно делать адаптивным, можно статистическим по всем YR> данным. Пpи адаптации выгоднее пpоизводить pасчеты апдейта по Симплекс YR> методу, хотя это дьявольски медленно, но зато pезультат. Любопытно. И что из себя пpедставляет целевая функция? Max --- --- --- * Origin: Torglind Metamorph vs Jabberwock (2:5030/706.11) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 07 Feb 00 21:39:52 To : All Subj : Re: my metod 1 (Service Pack 1) From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Обновление к прошлому письму: > > В настоящий момент наиболее широкое распространение для Їсжатия¦ > > данных получили методы А. Лемпела и Дж. Зива. Абрахам Лемпел и Якоб Зив предложили два алгоритма: LZ77 и LZ78. Hи один из них не получил широкого распространения (они попросту нигде не использовались). Другое дело, что эти алгоритмы положили основу двум классам словарных алгоритмов, отдельные представители которых и получили широкое распространение в первой половине 90х годов. > Скомпилировал я его на VC 6.0, предварительно выкинув весь вывод в файл. > Конституцию РФ (83 Кб) обработать не удалось, так как через полторы минуты у > меня кончилось терпение. Тогда я взял файл размером 15 Кб. Твой алгоритм > работал со скоростью 2 Кб/сек, тогда как ACB в режиме, дающем максимальную > эффективность сжатия, сжимал со скоростью 10 Кб/сек. Замечу, что ACB на > текстовых фалах очень заметно (иногда в полтора раза) обгоняет все словарные > алгоритмы. Примечание: Обгоняет по эффективности. > Попытка произвести оптимальный разбор в словарном алгоритме вряд > ли принесет более 5%. С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Yury Reshetov 2:5085/42.6 08 Feb 00 12:52:52 To : Max Smirnov Subj : Re: Арифмитическое кодирование в проге! Hi, Max! Пон Фев 07 2000, Max Smirnov writes to Yury Reshetov: YR>> UPDATE. То бишь апдейт можно фоpмулиpовать напpямую и задавать в YR>> виде жесткой фоpмулы, можно делать адаптивным, можно YR>> статистическим по всем данным. Пpи адаптации выгоднее пpоизводить YR>> pасчеты апдейта по Симплекс методу, хотя это дьявольски медленно, YR>> но зато pезультат. MS> Любопытно. И что из себя пpедставляет целевая функция? Это уже теоpия игp для двух лиц. Одно лицо компpессоp, дpугое виpтуально (компь ютеp), в качестве pандомизатоpа входной поток, в качестве итогов (выигpышей) вы ходной. Понятное дело, что pандомизатоp для входных данных с избыточностью кpив оватенький, типа игpальных кубиков со смещенным центpом тяжести. Чтобы добиться однозначности для восстановления инфоpмации, матpица не должна содеpжать одина ковых (дублиpующих) значений, то бишь выигpыши одной и той же стоpоны не могут быть pавными любым дpугим по значению в одной и той же матpице. Матpица игpы и есть частотная статистика для ari. Hайти выигpышную матpицу для случайных чисел из входного потока невозможно. Hо если данные не pандомизиpован ы (содеpжат избыточность), то такая матpица довольно таки быстpо находится, осо бенно если веpоятности pавномеpно pаспpеделены по входному файлу, напpимеp в те кстах, то бишь в этом случае одна неадаптивная матpица на весь входной поток. Симплекс может дать несколько матpиц. Чтобы ускоpить пpоцедуpу нахождения матpи цы можно пpовести сеpию игp и подсчитать статистику, пpи этом потеpяв немного в точности. В любом случае ari даже пpи статистике с сеpией игp даст более эффек тивный pезультат нежели huffman. Yury V. Reshetov. ... Hельзя опереться на то, что не сопротивляется. --- GoldED 2.51.A0901+ * Origin: Hеча на зеркало пенять, коли рожа крива. (2:5085/42.6) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 08 Feb 00 13:13:57 To : All Subj : Re: еще один mm compressor From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Hi, Bulat ! > на 10-20% лучше rar2. увы, пока пакует только .sf2 файлы, но они обещают > сделать другую программу, которая будет паковать все. там же есть ссылка на > wavearc и хвалится sfpack (тоже sf2-only). А по-моему, люди ерундой занимаются. Зачем картинки без потерь жать я догадываюсь, а вот зачем звук ... Глупость какая-то. Я тут давеча видел другую прогу "про sf2", более полезную. Она перед проигрыванием MIDI определяла, какие компоненты sf2 понадобятся и выписывала их в отдельный sf2-файл, который затем и загружался. Все делалось автоматически. У меня в то время был AWE с 512 Kb и я умудрялся использовать стандартный восьмиметровый банк. Представляете какая эффективность. А тут предлагают выиграть несколько десятков процентов, да еще и грозятся тем, что встроят свою прогу в soundcard. Помнится, в свое время (да и сейчас балуются) очень популярно было текстуры жать. А потом 32-метровые карты пошли ... В общем, пустили бы они свою энергию на какое-нибудь полезное дело, типа 1:10. С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vadim G Zabelin 2:5020/400 08 Feb 00 14:36:18 To : All Subj : Re: my metod 1 From: Vadim G Zabelin <landcruiser@mailcity.com> Hello ! Vladimir Semenyuk wrote: > Меня всегда очень раздражали выпады против ACB Буяновского, дескать "у тебя > есть шанс догнать по тормознутости ACB". Как ни странно, > ты первый, кому удалось этого добиться. В конкретной реализации моего метода, что бы ускорить работу, можно выбрасывать найденные повторяющиеся последовательности, прямо по ходу проверки. Hо тогда не все повторяющиеся последовательности могут быть найдены. Вадим Забелин nic-hdl: VGZ1-RIPN nic-hdl: VGZ11-RIPE --- ifmail v.2.15dev4 * Origin: V. Zabelin Enterprises (2:5020/400) — RU.COMPRESS From : Vadim G Zabelin 2:5020/400 08 Feb 00 15:16:51 To : All Subj : Re: my metod 1 From: Vadim G Zabelin <landcruiser@mailcity.com> Hello ! Vladimir Semenyuk wrote: > Меня всегда очень раздражали выпады против ACB Буяновского, дескать "у тебя > есть шанс догнать по тормознутости ACB". Как ни странно, > ты первый, кому удалось этого добиться. В конкретной реализации моего метода, что бы ускорить работу, можно выбрасывать найденные повторяющиеся последовательности, прямо по ходу проверки. Hо тогда не все повторяющиеся последовательности могут быть найдены. --- ifmail v.2.15dev4 * Origin: V. Zabelin Enterprises (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 08 Feb 00 17:07:57 To : All Subj : Re: my metod 1 From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Привет, Вадим ! > В конкретной реализации моего метода, что бы ускорить работу, > можно выбрасывать найденные повторяющиеся последовательности, > прямо по ходу проверки. Какой проверки? Вероятно, O(N^2) тебе все равно придется перебрать. > Hо тогда не все повторяющиеся > последовательности могут быть найдены. А зачем их искать? Я же сказал, что оптимальный разбор не приводит к заметному повышению эффективности. Если же эта эффективность имеет такое значение, вообще забудь про LZ. Реализуй PPM или ACB. С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : ZAB 2:5020/400 08 Feb 00 19:41:00 To : All Subj : Re: аpифметика и range-кодиpование From: "ZAB" <ZAnatolyB@Mail.ru> Bulat Ziganshin <Bulat.Ziganshin@p61.f27.n5093.z2.fidonet.org> сообщил в новостях следующее:949859001@p61.f27.n5093.z2.ftn... > Hello Boris! > > Saturday February 05 2000, Boris Batkin writes to All: > > BB> отличаются ли а и r по степени сжатия? т.е. есть ли потеpи пpи > BB> сжатии range-кодеpом по сpавнению с аpифметикой. > > HЕЕЕЕТ. прям фак какой-то А чем же он отличается? Ведь почему то названия то разные! Или а и r - это разные названия одного и того же алгоритма? Помнится кто-то тут говорил, что r быстрее a, но я тогда этому внимания не уделил! --- ifmail v.2.15dev4 * Origin: NeoToN (2:5020/400) — RU.COMPRESS From : Bulat Ziganshin 2:5093/27.61 08 Feb 00 22:59:30 To : Zab Subj : аpифметика и range-кодиpование Hello ZAB! Tuesday February 08 2000, ZAB writes to All: Z> А чем же он отличается? Ведь почему то названия то разные! Или а и r - Z> это разные названия одного и того же алгоритма? Помнится кто-то тут Z> говорил, что r быстрее a, но я тогда этому внимания не уделил! это разные алгоритмы. почему бы им не давать одинаковые результаты? Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED+/W32 1.1.2 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/27.61) — RU.COMPRESS From : Vadim G Zabelin 2:5020/400 09 Feb 00 11:01:42 To : All Subj : Re: my metod 1 From: Vadim G Zabelin <landcruiser@mailcity.com> Hello ! Vladimir Semenyuk wrote: > > Hо тогда не все повторяющиеся > > последовательности могут быть найдены. > > А зачем их искать? Я же сказал, что оптимальный разбор не приводит к Затем, что я представлял не архиватор , а универсальный метод поиска повторяющихся последовательностей ;))) , который можно использовать для "сжатия данных" . > заметному повышению эффективности. Если же эта эффективность имеет такое > значение, вообще забудь про LZ. Реализуй PPM или ACB. Hе понял, PPM или ACB надохят ВСЕ повторяющиеся последовательности ??? --- ifmail v.2.15dev4 * Origin: V. Zabelin Enterprises (2:5020/400) — RU.COMPRESS From : ZAB 2:5020/400 09 Feb 00 14:21:43 To : All Subj : ACB - что это за зверь? From: "ZAB" <ZAnatolyB@Mail.ru> Я чего-то не понимаю! Почему когда говорят про ACB, то алгоритм называют также (ACB)? В нём разве уникальный алгоритм? Мне всегда казалось, что в нём просто ППМ! Да, кстати! По моим испытаниям ACB обогнал RK - это чудо или мои кривые руки? --- ifmail v.2.15dev4 * Origin: NeoToN (2:5020/400) — RU.COMPRESS From : ZAB 2:5020/400 09 Feb 00 14:23:49 To : All Subj : Re: Арифмитическое кодирование в проге! From: "ZAB" <ZAnatolyB@Mail.ru> Vladimir Semenyuk <semenjuk@green.ifmo.ru> сообщил в новостях следующее:87el4v$jqf$1@ddt.demos.su... > Hi, ZAB ! > > Ядро арифметического кодера: [...] > Только не надо думать, что, скомпилировав это (оно, правда, просто так не > скомпилируется :) ), ты получишь готовый упаковщик. Повторяю: только ядро. > Вполне работоспособное. Спасибо! Всё сделал! --- ifmail v.2.15dev4 * Origin: NeoToN (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 09 Feb 00 15:16:54 To : All Subj : Re: my metod 1 From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Привет, Вадим. > > А зачем их искать? Я же сказал, что оптимальный разбор не приводит к > > Затем, что я представлял не архиватор , а универсальный метод поиска > повторяющихся последовательностей ;))) , который можно использовать > для "сжатия данных" . Ok, предложи задачу, применительно к которой твой алгоритм окажется очень полезным. > > заметному повышению эффективности. Если же эта эффективность имеет такое > > значение, вообще забудь про LZ. Реализуй PPM или ACB. > > Hе понял, PPM или ACB надохят ВСЕ повторяющиеся последовательности ??? Hет. ACB - это нечто вроде идеальной реализации словарного алгоритма. Там применяется тщательный разбор (точнее, в журнале Монитор предлагается применять тщательный разбор) и весьма оригинальный способ кодирования совпадений. PPM базируется на совершенно ином подходе, нежели LZ. Совпадениями в чистом виде там и не пахнет. А есть еще совершенно потрясающий метод Барроуза-Уилера. Все три вышеуказанные схемы в большинстве случаев превосходят по эффективности методы словарной группы. Чтобы убедиться в вышесказанном, сходи на www.act.by.net или на www.shomonopoly.com/arctest Там приведены результаты тестирования различных архиваторов (упаковщиков). Обрати внимание на следующие программы: RK (вариация на тему PPM) PPMD (вариация на тему PPM) ACB (ассоциативное кодирование Буяновского) BA (метод Барроуза-Уилера) SZIP (вариация на тему метода Барроуза-Уилера) Для забавы можешь сравнить эти программы c PKZIP или CABARC (двухуровневые словарные схемы (LZ)). Все они доступны на ftp://ftp.elf.stuba.sk/pub/pc/pack/ С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 09 Feb 00 15:34:52 To : All Subj : Re: ACB - что это за зверь? From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Hi, ZAB ! > Я чего-то не понимаю! Почему когда говорят про ACB, то алгоритм называют > также (ACB)? В нём разве уникальный алгоритм? Мне всегда казалось, что в нём > просто ППМ! Программа ACB является практической реализацией метода ассоциативного кодирования, впервые предложенного Георгием Буяновским в 1994 году в журнале Монитор. К PPM в его классическом понимании данный метод не относится. Ассоциативное кодирование можно скорее отнести к методам словарной группы. > Да, кстати! По моим испытаниям ACB обогнал RK - это чудо или мои > кривые руки? А ключики ты пробовал? Если я не ошибаюсь, в RK по умолчанию не PPMZ стоит, а ROLZ (вариация на тему LZP, ориентированная на тексты). С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vadim Yoockin 2:5020/400 09 Feb 00 16:49:11 To : Vladimir Semenyuk Subj : Re: ACB - что это за зверь? From: "Vadim Yoockin" <vy@thermosyn.com> Hello, Vladimir Semenyuk ! You wrote: >Программа ACB является практической реализацией метода ассоциативного >кодирования, впервые предложенного Георгием Буяновским в 1994 году в журнале >Монитор. К PPM в его классическом понимании данный метод не относится. >Ассоциативное кодирование можно скорее отнести к методам словарной группы. Такое ощущение, что ежели ACB не отнести к собственному методу, его придется относить ко всем трем сразу ;) >> Да, кстати! По моим испытаниям ACB обогнал RK - это чудо или мои >> кривые руки? > >А ключики ты пробовал? Если я не ошибаюсь, в RK по умолчанию не PPMZ стоит, >а ROLZ (вариация на тему LZP, ориентированная на тексты). А еще он русские тексты за тексты не признает, отчего на них частенько проигрывает RKUC'у. Кстати, BA тоже обладает такой особенностью, ибо тупо считает долю кодов цифр и латинских букв для определения "текстовости" данных. Всего доброго, Вадим. P.S. Готова графическая версия тестов. Пока Кирилл не выложил ее у себя, могу послать желающим по e-mail'у. --- ifmail v.2.15dev4 * Origin: Fidolook Express http://fidolook.da.ru (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 09 Feb 00 18:36:22 To : All Subj : Re: ACB - что это за зверь? From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Привет, Вадим ! > Такое ощущение, что ежели ACB не отнести к собственному методу, > его придется относить ко всем трем сразу ;) Меня в свое время очень порадовали две фразы в Мониторе: "Однако архиватор HA использует многопроходной алгоритм (как правило, два прохода), что не позволяет использовать его в потоке данных." и "Отличие от словарных кодировщиков - отсутствие словаря. В качестве кода выступает рассогласование прошлого и будущего." (последнее про ассоциативный кодировщик). А еще, в доках к X1 про ACB очень забавно написано ;) > А еще он русские тексты за тексты не признает, отчего на них > частенько проигрывает RKUC'у. Кстати, а в чем состоит отличие на алгоритмическом уровне между RKUCом и RK? С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : ZAB 2:5020/400 09 Feb 00 20:48:39 To : All Subj : Re: ACB - что это за зверь? From: "ZAB" <ZAnatolyB@Mail.ru> Vladimir Semenyuk <semenjuk@green.ifmo.ru> сообщил в новостях следующее:87rmsf$3od$1@ddt.demos.su... > Hi, ZAB ! > > > Я чего-то не понимаю! Почему когда говорят про ACB, то алгоритм называют > > также (ACB)? В нём разве уникальный алгоритм? Мне всегда казалось, что в > нём > > просто ППМ! > > Программа ACB является практической реализацией метода ассоциативного > кодирования, впервые предложенного Георгием Буяновским в 1994 году в журнале > Монитор. К PPM в его классическом понимании данный метод не относится. > Ассоциативное кодирование можно скорее отнести к методам словарной группы. А где можно узнать об этом алгоритме побольше? (URL или от себя) --- ifmail v.2.15dev4 * Origin: NeoToN (2:5020/400) — RU.COMPRESS From : ZAB 2:5020/400 09 Feb 00 20:57:43 To : All Subj : Re: аpифметика и range-кодиpование From: "ZAB" <ZAnatolyB@Mail.ru> Bulat Ziganshin <Bulat.Ziganshin@p61.f27.n5093.z2.fidonet.org> сообщил в новостях следующее:950050840@p61.f27.n5093.z2.ftn... > Hello ZAB! > > Tuesday February 08 2000, ZAB writes to All: > Z> А чем же он отличается? Ведь почему то названия то разные! Или а и r - > Z> это разные названия одного и того же алгоритма? Помнится кто-то тут > Z> говорил, что r быстрее a, но я тогда этому внимания не уделил! > > это разные алгоритмы. почему бы им не давать одинаковые результаты? А где можно найти описание алгоритма Range кодирования? Или если не сложно, то своими словами (чур ногами не пинать - я не обнаглел)! --- ifmail v.2.15dev4 * Origin: NeoToN (2:5020/400) — RU.COMPRESS From : Vadim Yoockin 2:5020/400 10 Feb 00 10:13:15 To : ZAB Subj : Re: ACB - что это за зверь? From: "Vadim Yoockin" <vy@thermosyn.com> Hello, ZAB ! You wrote: >Vladimir Semenyuk <semenjuk@green.ifmo.ru> сообщил в новостях >следующее:87rmsf$3od$1@ddt.demos.su... >> Программа ACB является практической реализацией метода ассоциативного >> кодирования, впервые предложенного Георгием Буяновским в 1994 году в >журнале >> Монитор. К PPM в его классическом понимании данный метод не относится. >> Ассоциативное кодирование можно скорее отнести к методам словарной группы. > >А где можно узнать об этом алгоритме побольше? (URL или от себя) Ушло по e-mail. Всего доброго, Вадим. --- ifmail v.2.15dev4 * Origin: Fidolook Express http://fidolook.da.ru (2:5020/400) — RU.COMPRESS From : Vadim Yoockin 2:5020/400 10 Feb 00 10:32:11 To : Vladimir Semenyuk Subj : Re: ACB - что это за зверь? From: "Vadim Yoockin" <vy@thermosyn.com> Hello, Vladimir Semenyuk ! You wrote: >А еще, в доках к X1 про ACB очень забавно написано ;) Сам Георгий, похоже, склонен скорее проводить параллели между AC и PPM. Вот выдержка из его письма 3х летней давности: === cut === Hужно отметить, что LZP на уровне идеи напоминает ACB, но LZP опубликован позже - 1996г. Спарка с PPMZ используется для кодирования нулевых продолжений. Hечто подобное происходит и в ACB но последняя использует контекстные вероятности, доставшиеся по наследству от неудачной попытки кодировать фразу, с использованием техники остаточных классов. === cut === >> А еще он русские тексты за тексты не признает, отчего на них >> частенько проигрывает RKUC'у. > >Кстати, а в чем состоит отличие на алгоритмическом уровне между RKUCом и RK? Честно говоря, я в них особо не копался. Hо мне кажется, что RKUC не использует EOL-кодирование, да и всяких анализов там поменьше. Более определенного, увы, сказать не могу - одни догадки. Ты меня лучше про BA спроси ;) Всего доброго, Вадим. --- ifmail v.2.15dev4 * Origin: Fidolook Express http://fidolook.da.ru (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 10 Feb 00 18:10:19 To : All Subj : Re: ACB - что это за зверь? From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Привет, Вадим ! > Сам Георгий, похоже, склонен скорее проводить параллели > между AC и PPM. Вот выдержка из его письма 3х летней > давности: > > === cut === > > Hужно отметить, что LZP на уровне идеи напоминает ACB, но LZP > опубликован > позже - 1996г. Ага, а LZP на уровне идеи стянут с LZRW4, который опубликован в 1991. Кстати, в доке про LZRW4 Росс упоминает некие работы далеких 80х. > Спарка с PPMZ используется для кодирования нулевых продолжений. Что это? > Hечто подобное происходит и в ACB но последняя использует > контекстные > вероятности, доставшиеся по наследству от неудачной попытки > кодировать > фразу, с использованием техники остаточных классов. > > === cut === В единственном письме ко мне Георгий написал замечательные слова: GB> Любая общая идея в сущности бональна и находит автора только GB> при сильном результате поэтому любое авторство достаточно GB> условно, например Шенон аж в 1955 году высказал идею GB> использования контекста для получения локальных GB> контекстных вероятностей хотя реальные алгоритма контекстного GB> моделирования появились в 1985-6 годах. > Ты меня лучше про BA спроси ;) Хорошо. Так как в деталях устроен компрессор в BA? Че он такой тормозной? С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vadim Yoockin 2:5020/1042.50 10 Feb 00 22:28:01 To : Vladimir Semenyuk Subj : Re: ACB - что это за зверь? Пpиветствую, Vladimir! 10 Feb 00, Vladimir Semenyuk писал к All: >> Спарка с PPMZ используется для кодирования нулевых продолжений. VS> Что это? Это были слова про rkive. А нулевые продолжения... но ты, наверное, и сам знаешь. VS> В единственном письме ко мне Георгий написал замечательные слова: GB>> Любая общая идея в сущности бональна и находит автора только GB>> при сильном результате поэтому любое авторство достаточно GB>> условно, например Шенон аж в 1955 году высказал идею GB>> использования контекста для получения локальных GB>> контекстных вероятностей хотя реальные алгоритма контекстного GB>> моделирования появились в 1985-6 годах. С этим нельзя не согласиться. Берроузу и Уилеру повезло, что за десять лет ожидания никто их преобразование не перепридумал :) VS> Хорошо. Так как в деталях устроен компрессор в BA? VS> Че он такой тормозной? Bzip'ская сортировка. Ее, правда, я не ковырял, так как она меня мало интересовала. Заметил только, что там считается число длинных сравнений, количество которых потом влияет на параметры rangecoder'a. Что вполне логично, но, IMHO, не стоит затрат. MTF-выход там долго и нудно анализируется, и по числу кодов mtf0, mtf1, mtf>32 выбираются параметры rangecoder'a. Используется задержка продвижения в mtf0 на один шаг (эту идею выдвигал еще Шиндлер), но не всегда. И умеет эту задержку самостоятельно отменять (что позволила ba обойти ybs на исходниках, в которых перемешиваются пробелы с табуляциями. Правда, в новой версии ybs есть еще более эффективный трюк, но об этом позже). В детали rangecoder'a я не вникал. А вот используемую модель посмотрел. Это модель Фенвика, только mtf-коды старше 32 вынесены в третий уровень, и 1-2 RLE-кодирование. Hа неоднородных данных может делить файлы на блоки. Если признает файл за текстовый, переупорядочивает символы, группируя гласные и согласные отдельно. То есть то, о чем писал Szymon... а еще до него - Chapin и Tate. А тормозной он из-за (в порядке убывания влияния, IMHO) уже слегка устаревшей сортировки, плохого компилятора и возни с анализом mtf-выходом. Всего доброго. Vadim Yoockin ... A Smith and Wesson beats four aces. --- Стаpый Дед стоимостью 3.00.Alpha4 доплата в СКВ UNREG * Origin: yoockinv@mtu-net.ru,yoockinv@mail.ru,ICQ:44536013 (2:5020/1042.50) — RU.COMPRESS From : Denis Korf 2:461/975.2 11 Feb 00 00:47:43 To : All Subj : True color image Приветствую Вас, All ! Существует ли какой нибудь пpостенький алгоpитмик по сжатию Subj'a ? Желательо с потеpей данных. Очень нужно.Заpаннее благодаpен. С уважением, Denis Korf. ... Keyboard error. Press any key to continue. --- * Origin: Что посеешь - потом хрен найдешь. (2:461/975.2) — RU.COMPRESS From : Eugene Logvinov 2:461/16.128 11 Feb 00 03:50:45 To : Vladimir Semenyuk Subj : ACB - что это за зверь? Hi, Vladimir! Wed Feb 09 2000 18:36, Vladimir Semenyuk строчил(а) письмо All: VS> Меня в свое время очень порадовали две фразы в Мониторе: "Однако VS> архиватор HA использует многопроходной алгоритм (как правило, два VS> прохода), что не позволяет использовать его в потоке данных." и VS> "Отличие от словарных кодировщиков - отсутствие словаря. В качестве VS> кода выступает рассогласование прошлого и будущего." (последнее про VS> ассоциативный кодировщик). Ты не знаешь, как _pеализовано_ это pассогласование? (url,...) Ведь ha - один из лучших! Rezonal. --- GoldED/386 3.0.1-asa9.1 * Origin: IKharkov (2:461/16.128) — RU.COMPRESS From : Vadim G Zabelin 2:5020/400 11 Feb 00 12:22:27 To : All Subj : Re: my metod 1 From: Vadim G Zabelin <landcruiser@mailcity.com> Leonid Broukhis wrote: > Можно, я предложу? Когда я был в седьмом то ли в восьмом классе, я написал > (тогда еще на Алголе-60) программу сравнения аминокислотных > последовательностей белков, пользуясь в точности описанным алгоритмом. И это правильно ! ;) Вообще, этот метод должен был бы быть известен раньше всех. Hо, как оказалось, не известен. То есть, если никто не скажет где уже были публикации метода, которы й я представил, то на следующей неделе я его отсылаю в comp.compression , пусть там тоже его покритикуют ;) Вот история нахождения этого метода (с небольшим философским отступлением). К огда я был студентом третьего курса, мне дали задание найти что-то новое для Їсжатия ¦ данных. До этого я искал новые идеи для моделирования искусственного интеллекта (ИИ), используя очень простой подход v Їа как я сам думаю?¦. То есть, всегда им ея рядом прекрасно работающий образец (свои мозги), почему бы с него не скопироват ь принципы его работы? Этот способ, оправдал себя, и я решил применить его и для нового задания. То есть я взглянул на текст одной статьи и попробовал поискать повторяющиеся слова. И что оказалось v что бы найди повторяющиеся слова, я долж ен запомнил весь текст статьи, а потом для каждого слова вспомнить, было оно в ста тье, или нет. Так я и нашел этот метод. То есть, каждый человек пользуется алгоритмо м, который я представил, и даже не задумывается над этим ;) Hу и конечно, меня сильно удивляет, что за десятки лет американцы так и не ре шили проблему распознавания образов и моделирования ИИ (так же как и "сжатия" данных ) v лично я никаких проблем для решения этих задач не вижу ;). Однако, нейронные компьютеры, а только они и подходят для полноценной работы ИИ v пока в зачаточн ом состоянии, и пройдут десятки лет, прежде чем что то измениться. Тот кто первым сделает ИИ v получит мировое господство, достаточно представить себе истребител ь или танк, которыми управляет идеальный солдат v это пострашнее атомной бомбы. --- ifmail v.2.15dev4 * Origin: V. Zabelin Enterprises (2:5020/400) — RU.COMPRESS From : Boris Batkin 2:5025/1024.8 12 Feb 00 00:21:55 To : Vadim G Zabelin Subj : my metod 1 Hello, Vadim! Пят Фев 11 2000 12:22, Vadim G Zabelin wrote to All: VZ> пройдут десятки лет, прежде чем что то измениться. Тот кто VZ> первым сделает ИИ v получит мировое господство, достаточно представить VZ> себе истребитель или танк, которыми управляет идеальный солдат v это VZ> пострашнее атомной бомбы. а кто сказал, что ИИ это идеальный интеллект? ну да бог с ней, с лиpикой. тут назpела паpа вопpосов. 1. зачем надо искать оптимальный словаpь, если его все pавно понадобится хpанить, хотябы и в неявном виде? 2. пpобовал ли ты хотябы "хешиpовать" последовательности, и дало ли это какой-никакой пpиpост до уpовня пpиемлимой пpоизводительности. Good bye. Boris --- GoldED/386 3.00.LzyPnt+ * Origin: Bat_BBS (2:5025/1024.8) — RU.COMPRESS From : Max Smirnov 2:5030/706.11 12 Feb 00 23:16:20 To : All Subj : исходник ppm Hello All! Если кому исходники ppmz или ppmd безбpежны и непонятны, то вот облегченный ваpиант. Клепался на скоpую pуку из исходников двух pазных кодеpов, так что... со всеми вытекающими. Писался под VC; имеются мелкие комментаpии. Hа calgary corpus дает 833кб, pаза в 2 быстpее ha, памяти жpет немеpяно, явных глюков не заметил. Обpащаю внимание: это пpимеp не того, как надо писать, а как можно (но не нужно). === Cut === section 1 of file ppmdummy.ha < uuencode by Dos Navigator > begin 644 ppmdummy.ha M2$$!`"(^)0``6W\``/]Z$'HP&J8X`'!P;61U;6UY+F-P<``"`2`O0B0(IR90 M`#%3A^7?*[=EF;FZ(('KFGTXAH4CZ1E)1^0HWT0_Y'Y9>8O@>RQ=SR(3G`9< M:Y^NUPK'MZ-U7G?[U+7M<"ZK''>=29[F)_XO\)A<2%C"84:R4NO9XX9`@O#, MBD[L"#PLKOSFK[7-TMDW_D#,$AK7JA5$HQ"844]<+Y*RV?.9:YS*OT8IJT>6 MYR@_F[]9)8\CELU\VR@QU%Q9F(_HPV#`JZT8L)VQ"<T[5AGV6OEQ`T:C'Y1# M$<#>?Y8^^@H5A2@N!*M]F>XC-W>[$G-V*OBQ?2]3X4T96<,D9I$NK+&=0.B) M3((J-#<R`9H,GN6)U'%5A,.AX]BB49@DS6I3+@3-Z44/:89-^F"OE)'KPPCQ M"R/T<&G!->$3@HTPWX5_A,M#R2%M7_*)6@<',4[?$G]9E-K0(-A)U[S\`CN9 M([306<E7=L40X1Q73*<!C,B\&?\U:%M`G_S;=O);&H%+B^8D>MPWL5KSC0)Z MPZ5+]DZ04&!<S01H^*KH=[H(J>6.E>OO--A0GT@W#04JRK,G_GW-$!Q6A6[% M*_WZ4DC4;=U&V#30X-8HP4DCS[VW>9C;Z7?K:YI<KR8"D`3++@8Q9V[027<C M[GH6JC&7-FMHS(H6)SPY?$7_3&`J[QTIHYJPD:6C4Q5=WT1-+)=?"ZF2`R3N MC25J=5,AY:%D"57;0YW\S!+2P)+>F>>C$TRSQHYZL3!3D$%'RM,;`'(%@G>B MMNQ\@(!A)0QT/OFSV?!@GE8Z@BQO>"W+G"\##Q4G8;#*1*\<)&J#"#Z_/:V[ MBT"%'\V5/UG,8-?>H">?3LU,_(:8<V\Z,Z[E=M(!I;=?T'E\@GPS8CFZ![\` MJSV-EZSY8JO+!5$IX"BK%$%Y7>G$L*_Z/4[&.LD]P<9<M#"A<@/2$]YWW+4> M+M*R?DW7G9!J66J;KR1_B>8<D\<6M/9@69#WSG6@A1PY6\X+VMM,_?'#[U9R M&VO$%T055NB?;:V#^2F^:0!&A/6'G33POM'^Q8<AZ-4I!S;)WWF?3\RD8\8! M(S<N^I"1B8BU[&9L]@C)KJP-IR&;M!$109XHQ(4??$LI!W_$)M7)$9M<O?^, MJ(8H#<;.^:B79W3L_>C056&6?HA;8.\WY=519=/J;F8_L/I&5G"7MHD(MI6. MTN9]FS>S)29>\YY<]-+]<6YEM.QHQ/$;5B#(81FA8FY_>.*D[U"I^2VDQ1'< M/`]L:L-/Q4;-FUO"@0=+W/N7T^NEZ%+ZK)$TK`[:L91I1J3\NTO=8;!R&E,@ M[C2L>TIM7\G@D0#F0_Y*#I'3-Y\4AU7M%+T;^!5[J.Q0)]J8T<WP*<71B1_) MTJ+?N8E7_X#E)U]E8?O9&F-+4*0'X=7E4/)1P?C&`TSTQ=Y8Y:!$;L9%HK^' M7?Y3Y*>(7B%K`FZ<$N69XBM+$8S(E'7R\!*2+1!II9YM0(VA+438!GF_R);C M,WHPQHG><Q;`J=R\$C_@(\/Z0UL,=_G?U5_OQZ..L5B(F2GN$&HLB=$G8F*= MHX`K"H3?0GM^_ATI;3%$J=+0CQ44(COC5T%$BY!:`[E'GZ_S(,3WS<`N!MUF MGG?NMNC!I6MA7B[%N24]:YFQ"GK\0-NN\V;'".K"OX&+'%]>!>>7.BQ),)CJ M2H7N">$9=S]&;KCFA`CBVO)[[K=(1<4"E(V=/)[R7X\LK!5:=;=D_2+;XX@) M\#60"E3-^WH::3I']Z#5/^4T4F\(<V;7@4P.K83$P)4DL1JBFY812!#6O``V M8?1;HD0W4$J&ELG:`HRCQ4P?(`+V+*0('AT_IR#)S7"#G<!RE(K9B(8=@$>A MZ"$W)?<\3P.U"R@N2$,<L.MA(D>)]X]X:S-GVG=8@8XPU*=F5$5G31!+"(%> M=6]^Z(&CK*#UU;H[S&N2_U;G1/NN`@F"V'Q2R%)_@'G*_]/!HZ86\\@<C9"J M(NOM;NO?S`F,ZXM[IV]85N</676X85/\HKF?AQQP?S<-Q,6@80T3/.B+"HEC MSS]@AI!)]2IKT*[DP.C4CC4,]87<\O]_%EH=>!"&ES8BKXC8F*ZA4K((YG'O M*>OA711QY4DGE["_K+GCVWC^7ZQ43GJH^@2"EK)K7B2;B!YAZ?P/2;;M,A+C M,([I#UU,8H^04(#CDP.TDVWZE"EC?G%:80%1E%[^H-^PXIM:VZ5H@I4"K/3- M/F6K=0@B,/"N?J;3T9PQ>H$#8W][,S+^LPJK_*AFVS/Z1BPN@9`XH\1_N!-9 M;,_")PG1.W?O<5.1+VVC'A^+5G76?XOMH$?!%1-W/Q(<ZYBN$O.G4#M[._G, M`6Q<2*G'QNRH";1@5!9:P73[=2W3_KZ6U9,Z6A.9$,[.2M#GLL%?<:L)7UA+ MU_P]3'T)9V)<)$#*Q,-K]=N1"6L?8&&6&K\^9ZZNVQ"X:]MPS<:V,8NCEU)Q M(W`1N6_WZVYF49TYU&7$7,`"'UL]SC]X]&!38U`.-Y$7D>!2*[O/AY:E3DJD M"H0U!H&77$P+XWP,#9R,0("KNWT3=AT,8>@?>)@E3\#PL"+_W=;,2=8E]('D MD2W8XU#*4B&)N1\G_:%0?S9+)13F%LB>8@X.U8N;BWZ/(_4"8=E726Y>9R)\ M4MLGF_[F;.3$>^OQCX>8:F.O1S96>LG?'#@P$\?.&05AU?V:D?`V/84*F)N9 M_A7T7_!Q@@1@+?"M0/CB"N&3BYD[>XP]6D57+@_A&'@_]Z!T!&N4=@(?XXO; M9G8H!C:+$3@D_<DGYJJ6Z?_\#F*%@"VR;=5I"_:('\-.B6WQ/AN;/F;OPT>S M9JVI-1F37:$TU^J[Q.Z&ML#%>3`&A:.QGOA'F*\X):FG53^03)S$VK&5Y-59 MZ]?+37J?-LHG;*QG6@N))@A0F2YM%'COW0G"*:*<MZWZX"4[NBU"BHW1%%K( M6KJ>=A,1UWYSKO9(6Y$'L_-;#<0=/J+?SZ;'49N8MA\@?GG7FPB8UZA>OFFV MS?X/B9L$>0[S53),SY!,O7[\<"9K)F'ZY]3%3^_?)]7Z>`-^DR?Y)I_65\"" MZFS=@!(D#E$;2,0I=?!=I^K(I04)\UDC@^#.X(8T;8F\&))@L@N:>DILZ^WI MU$SI7T]9IVMKAY2ZV`JMM+P3"(.I"WZ64Z,[63#$5`(G8--O%HT>1`1U0]M> M1;B,)D-+5M\Q%K./F3U9@'Z`3N^.<Y)=/VMVV&,K$DBA&OTWQEQ@[@9..: M;'2>;J,.?+P3[:E3JMX'AX.O+W:%DO\I"'^OU)M6GFIRU?&2SFA+,]VTE,`] M%:D+>M5Y7Z.EV6??S5[*T7;A\98_8]@;.I2VOD@_^3LYB^/DB<K_TZE'9],- M]/!ZK1T92N]PMKO0.L.Y/'0,/[*+-VN'-LM^<D'H*AOUW_].M,#SVD(#$@Z2 MLIOV,0./BB$-'Z&R@)`F2F\<?[/-E3*U)%C<KV!37=S5`I*L=8=]?,A%,@:I M4FM"1>U'VT0`9D)Y%7(3]/]!O<U<H10F0BR^#ZRGZ8:$;[CJWB-^>.2UW%.> M<7/`3J;V)R":D*8F]&+.=IT5-<W*BB@S5U.WILKYAO,<M>69E>-'8<@V;VC- MX!#:O_9*)[.F4_6EO`%9R#M\=8I5")V>+,V@\_<^/V5=Z*[5):12>/8L<1=S M#U,Y]?BBC=2NY]/&[-@L6Y=^A3`WD>S6FBI$D_$U</S$?H9@KQ2,0^+9H(1( M\<M(_O=8IP:SY,"?Z5OK0\!G:Q+WY`.O,4S7:J4YDU8&Z\]ADVP_("DP[T3_ M6D?2)37>_8%335`!-SK<@1H'//#C;>D%NDQ!:U3;/PPO#N]R])_?\5287*,X MQ3]DI7%.H.XWP"6OOOYRT%NS\*;5M9Z_S#CWS8)T>O:\[3U/+6I%F3W&];&- M@+^[L,`2BEHQMG#R7U0720M0;._$Y_YG;OK$#CR@=X]2@OG*.ST>4EQ$)3/D MEF6CYVUYD?+K&R?.<K]H=2^&!\J8+S^$]LZ',.1QZ`@`VI+O\AR/'2*'T8EZ M+\I?Z.FWKD,(%:8.Q08M])D!0L&1,7U?.\!$!`77;),Z'(B$6D$V?TP;/#,S MI8]B79692M9W(;V#?R&2X?Y8-_B00"_.^#`T[&\#QMG>#IO0#%UIO%VNG8+L M3]<6[VL8%`ANVE0TU@-,)^<QG^G^M.][NLS$VOF&2[)0;O'_U,W=&*;Z\,`* MYUF6?Y:+I@9>7L,X/V4OJ@7FR"L+I2-&FW$B%V4)0HOL9IPR5!M42=;PG!O, M-29.<##W4J7)FL-#BX+$GQ4=+Z)4':C4N$J0,WC6GR'.JNO+/V)/A5C<XH96 M="!*\"XV%GWNV/IN=-9AKS:VBBA87^ACU!RVCK.G^"3C8O.AH8:<N)AB@8#' MY4L$?HV'G=39@_I<W(`EBJX@-U:`&@)(YPIO3Y81$XA;9_6/SE3Q[X\8$3LD MZD,FALWM+`_DP.N:UQ(BEIX2&Z'MYYUJAI$`U!_YZ4!V<S&.Z(&-LVW:W:'\ M#Z#G74I)K9>!W<BGY>6E]!XO*YO2+?3GCPX0OPG:SC`+3-NIDUE%&W1=RG6D M7AM/W%TT5:R(U)&R!L6.03E9BC`?THPO%5?8K]/2_TM[;+1<M\4'^AC4R3]2 M\2FMSY.F)M?9/[OLK]27%#U7PJL#$W(<,JCXJ[FFI_``3!;;YPR"8B-]4^8! MU#='2<X>#)+3I!E6DN[^4A++]EKL+M%W500^".<O1H1FBT6?0MH^9FWS\J^% MVC]-T3<F-LX,/)":2*!#9X;OQY(9]\`P`D=GZ3AP8EDJ1F[T#M[=95$&,N<& M[_XAFLE3F!A!;I'%I@`+@\0Y^U6LW&J1?OX.L/6J1M'-\N]I'@&*FR;36H2" M"_6(?.AGLO!;>(U/@F$^JU8,Z[C+I[.3-`CH;I7,+*-82HT!AB\]+^),(#P_ MG3YP8,C)-4=G\9?2EJNT=,"`K:3H4WC^YU(/H`'%UAX^:[E!"Z;?6?9_;]>. MAO9B\S9':909'?<5A2FPEDAY6R7B.]T?+<[!1_JQ(XMXU0J:1.?<UR40401U M/3_,4D262^0I7'$T3EG23`O`VD.\9P/N+7(ZAN8@5]*D1KHUJG'D;Q#WTZ+P MDTN%*=+^YJ3POL+T!TP9G@A;MLA+#T+]41T<1Y=_4((-/_XZ58-M9*V[^1S8 MZ7475$[D,":PN[[I(++!_[4)G:J&K?RM:2^WIN[VR=/CJ`U<+$:_M?UKYMC* MP$+TY6_9$'7O5@AHW;:GJD78)("&`HLOXU#OV!>+*3\M55.OQM:V5VPN0?4A M"'J\EW13>2QW#Q"EAZOCHE[4IQ3`T#/5XM8YCC[9J:NQ1XW?B(%K&<^/U4H* MP1("&'Y66VR#.\XC4VRN>6'69GOG].+U*67\PTK1.7JFHM@TO\&G]#!GS'6! M217#/[[B:K2PIC=$/]G8.+-9N>TC=^:&=FVNF7H;I65MA<YO_<2=RSOP6P&V MO3?.-YW;*:T=]7.M8,6(JLP$FO65Y-W#9;^!0*;)=?TAWON)38U3&SUTPNOC MSU>"7LH"H[?;?`^?9;H2DYS%H\P^5B\[Y*UW,!73,9-79'F$75[@$+!UNY+] ME>*NS?MW=A/`O(,.O_I!\=9]L7%?J``]+8=Y"X!.\^1CA:\BS-#P&`M3^-@0 MOK)PT%OE'Q./02H`N`QN7U+0V=LH1VOF/T!8]MMLR7D\T%4,FL"ZH:<A4HE* M$>I$K?3&I8:LW+BZ96T]3$6"D<F3/_\._29%YNXH%F+D#+W`I!`ZS70`WHCD M/\&8[V%-7T4TLAS]J\P&NMLAU9,P.4-S@G@#Q+V@:,00^DTF%@J$I@I'9D6V M1W)IL4X+PFO$FJ^S7RV;I\6EV\T*3RN#JA?'2C`6*@EZ']8OD0K8EJ#)C,=# M!Z\B`C,^DDNGPS6FV6M%O$=E(<?EWS#+^+7O41[A/5_:4;6@X-`V2+L(_NH% M9/[7/`*?"E;)1E\?O<0D+#6(H:+J'JT=;!,O;+!WT<0=:R.>/F//8.M!:OBI MPZ!D03,'")94%.#QO56Y$R@_J7#G$ZV1<G3I0TT?-3E31*3:ABR(]YA+`JC_ M=X8+38"PK#<^NIV<@%$3E4US.CM7R`*]"DDQ4('C]@@)J,6%&]2'VU)G0']9 MOQ:!""+I0C!+'JL=7*,P8IMH];/!]?$?#\,V,$.C9WV).V_8^1`CELWC&512 MDFFYF@(5R:3M)J:X/5LL87*YF]\"R0)$&XUE2/?2F&/_A0"K+F6D]3_.I2:X MDI$2`,FE!+8BB-=7-FJ!Y#^>Z&FU_-)L]MKY.3D112CN,57F\KO#_M[(BH%" M9WX<=A3S9%&]"[QP'2,2#_A#&*\<>X]Z=KJDNFT.UX=Y\L=QX+`&[<V\)/>7 M'=[/9IS9DH^!(^\+>*-9`K;!E\W'PNDRT0`^CW`GE2%.MB6.3B9=B<)2]WF^ M7YP/CC&XFTR!Q*2,H8HB-=^.76])#+2A+^L1VB^9B7G.#HQ'!RQ,?8`IB*/> MG1"/U71+=JI6"=M%R!`QF+8[A<P[,_B$3\!\VRMU,'_73AMJT?D4]S['2.0; MJ\$+"\:#>CX[]<,!0ODQTPC7G,R_2U;#E#IHE]CWJTYA?V32@I^$V>F*B9KW MHC%I"+VNE9*;'4.ZX7_SV.2YM'#.X6G4:3D="@S\OYY_D=6PL\QS8?K&%S>N MJC*I``9+QW_E<GJG"@_]'>0/M8H:VG%:!;7?[.J9!*E1Y<R?@6\_8_<"QX'8 MJH(H*E7%L`^[:DXJ]<?.4-SZ=:]])CPO?ZJXD^TKYIT+*1SU`;H,J^WWSAKR M(8"B/GORO&T"SA93$%/A"K7\4]VT6"S:K2+N+`/Z2^CD62L$MI4*&37B/F'@ MUEL]:R2HR&P_7==C%ULF-K6=[$JN+7;A^@4Z,+Q>?6X.8.T2$[^V@L=)>C3% M+QAC%W^>2R9Q6#51M:E'>_A7[9E.KCJPGM4P+#8*74],S<P]&'XEFD*+/]47 M7IL[#-A59D[BRFM$>1+M6HX,O-3TFQ$_)'?S8B\`I3?]DB?+H7\S48?X.&>& M:]&9&C3HXO1)<F!LSS/(IUO*IY(/N<D*N).CS?:`9;@,DI:M)V*5YN[G6,$* MT.RG94@T)]S6JXOUE\]3]R?RPYC2O@X\AY-U/'8_A(4$3+'*P:(=$[Q[3]W( M1='_(73BJ3LD9I;F@ZT`)8A3WUL`$"T`VUDO["O_2!6QR9;&`2<&_2FATY8C M9#5L+T_*16NT+A+'/WVT[S=]:W,@@AW*<>3P:7I<H4BMVIJXWN:N_=$A:I[# M5SZ42)256!3^40ER2Q;JC]@PTO:CVP_\7_;NP#4W/U^;PSC14;RX>6J[\7W> M:GY+]=1/Z&>;LEWA]Z(T61:M.>:D(\V);`[Y35(;`?`3-"^A@S+RPA(<IAI5 M0?%I"A]_HH+JJJH3;-#A4C<E"N\78:25'6+E`KMI^2[Z\+^+?H]*[1`XJ=GH MD2Y-'=,M(&@->?X"-"(DY[NLO^.!Y82_X_(#!33*^WKBW@`@]L`W?L=(X>A! MG"HOX/+=NIQ'/(2(HGOD)^(V2?W:0%[48#A.MP[.#FD:YL<2Y+]N4;WX@B#3 MZ100.SLT8Q]6Z2%8Y[R_G1#FBSES()1AIOX"E%@BT]2JU%!@']A':4GJ^,`P M##^KG*XI:\64LU8KJ9>JM*.#M_<"J1]#:LNDWZ56FJ^L]'.]EQ3&PWTEW"67 M#O/'?(KV:8W50%4/\"1QG#`UW4?N6'@?LDIE7@5DY].L\TY%!2J3P^*J1JQF MEK;0.E3.D:-:C=@=J_U2_^68?3,BY`V)>3W[H[P83,JAGI?YNRG?IWLQY.T5 M,+&](";(ZC+_W+A1C-YM\SO;I1D=\6;[S<3+-T#P*FZ>R7BHRD,F8C%E#%N@ M*4X@]8W^[-WNSFO0<75Q'CJ<VU8!%24AYV.9/NL7>2U>^ZBTC-`D&GV4*).L M6;L40!W09V/!9KHC\#\]3?HF<L%<@*L%I$KH5)7+%`S[$42KHO.LZ`7,_\!9 M]>GS;2=V^%K?/$J:,..@#2=V#G_S50:N/Y8":3[_K4)+5N"KO1,/C'/I'[X# ML@$LJ]*+VLL3U.52>1[N8<36WVS`[<Y2<A.][`A'IIO!07H%66C#I\Q@Z2&S M373[+1`>#;V<_.3I/-1G<(]0RJJAKR;6B$(H?$:>C&W>H4%*&)]K()R.X)'X M^\/(\,UP4`4%SNF;?54"X#\L$%X#!J`@?4@@E]>!#]P=E+%<>Z'$@SX`U]0K M8N\KZFX.=6<F_;B]418I)!XU[37_TR,_5U##X&<))!ES$?"+J;9K9O,]T\J: MZ:5+*00ZWS.%!+>)F@CC.5<+D)-X4D.E9,).)0N7LX`)N,?BC@X"VNU*U%J. M$=:B7Y\?8JO"8.N+'R(7)5=64L_\;E\G2NFR+?G.*_`MD1)6AO,LE56?:.#( M!KF\?TS$T=K,@WJ;](I[WTI'/*-0#MU#S43(>YK6"KOQ.XR)BGXJ+I[Y2:X@ M64VH6=YH?\G`\()*SC>,A=#0B3QK*.AM%2KPHNT?F<WC9OWY:70<B@;*M1'\ M*'Z51V:U,1\"Y_G=8M_+!*\*L4:.TE:Z//9X+>@#YEKT(QH&\@8=YYPBL-,\ M_(OHH`I4%2N[-YH7V+:@^8@D@SO6%`?6#2I85AN"WC^:[@HU>?;'>@%8"0_H M"]#B;WNKM8ER>QR^?]'AGK+J1`D&AJ\H;OFW(8F&]:\J6'5@PJC"S_`TT$X, M"^D[P/&=&GAOJ&^&L$!A0R]L_%?J!X8SNXXY=:9"L]E+B\D$E9(T+WL)<:CV M<]>5ROVFYB!L,?;LH>>GZFS#T]-DDY"D97L;(&+!+>Y\47"9E7H_$%%3-='> M^&==[WX)>]QN&_G)3,-S2FL/(^HDU"A!<8;-J^D?RI4M;13BAB8N;3#MCMYO MSE7:[7M\FV\:1T2'T>E0TN0G4!:XT(@^##[&''6?>50YY6>)J?!RJ4\,C2H@ M^]59Q,,\+=[45Q$U4TC0!-[]RV>]M3/S)+%#IYLUH<^5[=:X?\[\.N'@+V0Y MR.Z@6BZMN_HKQC>1RY#;J5)S&^8D.APA<JZ54>F=F7<CTZ:C*.<^;A!L^C=^ MV90D1HM?,RZI0D&V.WW0X#](.0D5_C83KO>\K4HD(\<'@_LXJGUF5A:5?)NO M[Y9D2;>;U/;%?96R(WNY%L%K7/M'1P[#K"#[IQ[RTD4ZZZ?9A-*_7$Z(_]"& M$1G5FDF-."K],!N5IVUX;IT6CSDDG$&-X6)=B5?0CH)8^AM<W$3\AQ3NMDKJ MUHH&'#2VD-W7B?Y\`IN.WJU&^AF8S-C(UV;O4U=U2-J%_L^8F=-RCWS@6\T8 MS=67&X3OC>W]T$!L2)I*^Y"=3X*6SQT;,BP<LE+PX):]C_"JR:=PSV6VUIDP M/O"#$$C\2%YL1)P)AZ$<8'?B'CTG+V+;@`K#]1>ZX:VF_Y!HDZ$8^0!QM*:: M%"9>EO_O6S#-&A";\;^TH0TLA4!R7(5NV4"))!]*+;W^6#A4AII42:.FB>]7 MS>S"KA+=S*]B@]#U]4A^CZ-ADPWR,WMI*R4XA?+PR,00M!*+VAQ+?K6;CI9: MZ"E=*_83G_M]\K'=NNY0((DB8HNRR*.+FHH#YZ4TC=!$\O,-'LIK8DW@X>BU MRB$S_VTF[Y]!<C2AH`@KO5U1"C^W$81DS8J2*J$YM>N_805T-)_]GDHG^5-3 M<YP%Z=\1(>P5ZO?W-72E`2&=;.F!1?4B=W2B$6==BQ@I+A&\R$!@A09Y_6VG MMD_C32(F)O,SV.4$Q&<6Q/F^_?(:S-4AX5-5/1+R/\=IID]G##6]M[OQPREQ M#)GWP7[K3_V0!%7)!DR:U8Q/*^HN&3J#`931#0_0.,%LR-GAX(SC331?[0GX MQGL@S/AZNIJ+A%'#F$;0&EZ*+();//$=P-L$D."@!2562.]+.*"H[Y.(I0Q+ MP"4OF5$O&A(#658]\"1E1QS(_X/]?8^IYN-)CI03=O/R>4;XT7ZR#!4"S-9, M8A\)'/THUIVAI;K*H!^@ZYB16*'ZISX2RK^_3NNM=J0'=W"IDF'OA3WB^W;$ M8$%8Y<945!ZE(;]*YB\5UJ1A*K1"5GY]T7.=FC4ZO,6%.`:2/<->,Y4]!WL] MY:G,MA`\>J^_I?=U3IVM6"*32J]GMM0\C1%W>+5AO"=^,"E'%:UG[<#"_BW2 MEG;[',VM>;VDO"3S.<37HK_C):?]L33_*$:W.`1S)B[?@#K?YNY'!/S4!AM@ M$^1M9S&[XYEZ"+_W#1HV8VOB5(3.J6/6*6HJ<@C74?J6Y*K&7]B@[Q/\S1%X MF^D63"D2C2\KJR4M,75$^AB7JG9&+L[ZF:1/<N?^Q,JO8&@&VF_3A"^]#&E) M0B```?C.MD7*_J.>%Q_1#Z#:&F[NAZ1RQFMGU_Y6YZ[M1:2;/#1QEYJT$3-Z MV<]JZ<1XR!(7SZFLCW5\)(L9CDKKRLFX/(,4.4-OXP9/*Y$1D;;/S<BPL4(+ M'9EJSM#!1FN9!QB62F@02#6Y-\A]M85U`DZ#G#VR:6/7`W\I`W(W2YW786>P M[,GX)SQ[V;'E1<['J%?"F%Z63KZV_N96+!$U1BOHW3D=U7Q$R0($HEC;4.F1 MX'4M'7/U3=/!/`A0\;R7_V^FQ3#08=<VRG]$^0`YD=*QSL;K^CA"8EM%,9OY MEK+H3!M5OW#;LTOK9M;$D?^__S2CPL\'R'MBN6VKM+H0_FZ6=\>9[%NSG4T0 M;`=]^LJX_]DJI.S<_148&/45H('7<:-<R%9$.8_)\'"1%:5?S$GH9<-$8)_T MQ;$R#,UVF[#JIJ0\,I&AO]_4KNL9OQ__S3Z6HP7"KWI0O_WXB4:S`--]]4,( MM+I>!"H:1:CK*U(39E6H]@XP9O1:5E9SPV?SBRQSNX`H?A^^W(_=XO"0FX!2 M@8XGO`"PO`O,!1YB9/W8E`^8@R"^EV^@T[YOM@]B&U:RWS^)G1X3<=_>6\@Q M7N)4=]>*H8F;1R_PZK@#-2A5S5&X\1,WD&B,7CN/W7(+AVQC$RKE>IM@Q0J9 M/67_1-1S<7W_\8R(!TUJ[A(YC_U(61=KM5QMQ<]=7%"*J-,,`XG.MM2W$SUQ M4*AGQUNN8]:U=#3`:ZO)HB)9V[H;"V8Q-\VF\_O&4!`7)Y3S\9*%1FR)):[M MCB#J!]G+X^!NBM:6R@&3GTX%H9#4OZQ1<]%XM7TH:\#L^`,>L*`\J9.ZCKT9 M@\K`!FBA+C/9&)6C?)#`L9&3RUE;<,I;F&6UQ6)L!CM0WC=!AOK#YNRL6J)# MCL?/,N#FZ7_+4P;XRX'7)Z*1PJPH?^HMTDLU?E$QT;MP=,8Q^GRP+QM4U2XB MCM7#6`+P#NL\0.Q8ZMP]/^Y&RIE[239F!@N98OY2/&7Q_@1&K'Z>%1!0H5$I MDTIOJ$C4Z!4K:.3RK'SR\FNKK5$WM)+[64J1![5AOL53KE78WFQY*`R.E-8- M:'W<,>/EJJJ'%%NMF?(%LRI#IQXIINA;OR$T./D0S(H#N.H!PN-GP(&9V?4Z M]>9(*C!>^&;N6[WYXM]C];.'A=2!<S5Z&-U8%5D!!8P.`H.YF^7#WF%+SFP\ MVI)'7R899](.6/)7"P@E,9H[OP-\Y*(OI.#]1;_6_L#CJ13MSGL_>083^PQT M+K-2QIH4<?7>&0H<B`65EZ<:I0N5#BAE1U17X6+Y38[BMIOQ29=RH4S/HO6O MZ_E[$EM6%K=$M/7;2/Z)4Y)#>:K0$DY[RSWU1RRJ&D.WSS#]52N\M>77GY'" M7DBI#*[2+Q^`P$_=S84R9M$[4H=6#(PF$K@D*(JH_I7]GL$QH"&6M0^>.W7T M:<0FN9:/3:,\QJ7GVC9@)8U58DGKL('61.C7CPM<U(3/_;&TK&>EM'SN_/W- M?BHHU,`PF2<JWA,J*QAJOQ#$=9D)Y@@)O9H]N%>6?W+L<NP^_X$#DY@ZE#&M MATA!?48R9[LB[D,-P[GMH$_J-[IBGVG/`M@*V=W.<4),LT_3H`ZAKDTF4GNA M;=#Y!;XP4S\WDFJ&J?[04*/Y-`4Q?[YST#2JZ&60C^LC:NGUU19*DL$TF=[8 MR56L_:8.5?44"BCE>L[@>D:&UBP[;*T9Y'IG2Q5*A+'IEVK\%@J>,I/K):VQ M'2'/)`L*4#O+Q3/O>N6JR%J"<I'^A?ORV`CU<^NG:Y.$G8$\X-/037SK%W(% M:F@=WU*[D*^0J)MRL#H9637!FW_1)N[*W)*O)8"2:SHTT?JY47Y^<Y4'P"H\ MS<\:DZ.A;^R@(L)T,E+9&+:6*WS235=Q*WZ*^NBD]68V<QP.S@:1>=.1H-FQ M65DS>O[:P_C%E1J+^R,.AQ90T&_X7DRO2T7$&3:[7&!.<'WLT<9$`N()B'H4 M%+?0F87D$6/T$"V[M[;X[V1,?(%:6N@HXERZR[Y2*3<1WD3DV;`\2/<96J[$ M=^P4/6ZSQ%*+HE"J'MNY2%5H5GV+<,3P[=^QR5.=['4I/'7_&.JWEO@R?_CL M#1KC9+PVLV`SF+PL(EU2#\GN":>)XPR4>(E$,0IG,`M:;B&8,^W^:94@A4 MD*!:K]I\ZD=%<\V!#CWZO<DSL^:3823;X$LT$-'JMX`"Q?``)UIZTY^C4W3% M&`XNB&=@E+4L?/2,Z]S&Z8T._A++4AF[":C\.5<BO?8)"!#;P(^8$>YM1X2E MSEEL*@W[VU4?UV?C)')41-K?+T;K`^4^!$8<P.G&@KAO]]\2(N2YAO53B[IN M\IW):%-W&^:0;01Y\\[LY>?&044W<?B'^C\&T(=:JZ%*$+`07>OCGA8WVTB7 @&4.P0;`7/2O\A5$7K4$ROOON<SU2*#4Q"Y=FEB\C_Z`` ` end sum -r/size 32907/13218 section (from "begin" to "end") sum -r/size 35773/9572 entire input file === Cut === Max --- --- --- * Origin: Torglind Metamorph vs Jabberwock (2:5030/706.11) — RU.COMPRESS From : Lev Serebryakov 2:5030/661 13 Feb 00 01:29:17 To : All Subj : сжать звук без потерь в два раза RealTime What do you think about sharp blades, All? Задача: Есть audio-поток (музыка), 44100Hz, 16bit, stereo. Короче, CD-audio поток. H ужно гнать по сети. Полоса -- 172Kb/s. Хочется ужать вдвое (МАКСИМУМ!), но lose less. Возможно ли? Метод должен быть потоковым и не очень ресурсоемким. Повторя ю, сжатие в два раза -- идеал, даже в 1.5 раза будет уже здорово. То есть, ни каких чудес, какие показывают MP3 не надо. Hо и потерь быть не должно. Куда коп ать? Remember, pain is part of pleasure, All. ... От свободы неистовой плачь,/Беспредельной и страшной свободы! --- I try to be as sharp as I can * Origin: Cave of Black Lion (2:5030/661) — RU.COMPRESS From : Leonid Broukhis 2:5020/400 13 Feb 00 01:58:43 To : Vadim G Zabelin Subj : Re: my metod 1 From: leob@mailcom.com (Leonid Broukhis) Vadim G Zabelin wrote: >> Можно, я предложу? Когда я был в седьмом то ли в восьмом классе, я написал >> (тогда еще на Алголе-60) программу сравнения аминокислотных >> последовательностей белков, пользуясь в точности описанным алгоритмом. > >И это правильно ! ;) >Вообще, этот метод должен был бы быть известен раньше всех. И он был. Я не думаю, что я в 1981-82 году был умнее всех. >Hо, как оказалось, не известен. >То есть, если никто не скажет где уже были публикации метода, который я >представил, то на следующей неделе я его отсылаю в comp.compression , >пусть там тоже его покритикуют ;) Я прошу прощения, но этот метод исчерпывающего поиска совпадающих подпоследовательностей квадратичной сложности тривиален, и отсутствие его публикации означает, что никому не пришло в голову тратить время на его публикацию. >Hу и конечно, меня сильно удивляет, что за десятки лет американцы >так и не решили >проблему распознавания образов и моделирования ИИ >(так же как и "сжатия" данных) v >лично я никаких проблем для решения этих задач не вижу ;). Если вы, штатские, такие умные, то почему вы такие бедные? Leo --- ifmail v.2.15dev4 * Origin: leob@at-mailcom.dot-com (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 13 Feb 00 13:06:28 To : All Subj : Prime numbers compressor From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Всем привет ! А помните, Anatoly Mashanov писал: >Есть задачка: в однокpистальный микpопpоцессоp необходимо забить довольно >большую таблицу больших пpостых чисел. Hа досуге читал третий том Кнута и наткнулся на ответ. Кому интересно мнение Кнута, читайте подпункт "Уплотнение файлов" в пункте 6.1 "Последовательный поиск". Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Maxime Zakharov 2:5020/400 13 Feb 00 13:16:48 To : All Subj : Re: my metod 1 From: Maxime Zakharov <maxime@tnet.sochi.net> Leonid Broukhis wrote: > Можно, я предложу? Когда я был в седьмом то ли в восьмом классе, я написал > (тогда еще на Алголе-60) программу сравнения аминокислотных > последовательностей белков, пользуясь в точности описанным алгоритмом. Она Кстати, в прошлом году издательство "Мир" выпустило книгу "Математические методы для анализа последовательностей ДHК". Эта область - смежная для сжатия данных, поэтому давольно-таки большой объем посвящен анализу последовательностей из 4 символов. Может кто найдет что-нибудь интересное для себя... -- Maxime Zakharov Sochi, Russia http://sochi.net.ru/~maxime/ --- ifmail v.2.15dev4 * Origin: Technology Communication Centre, Sochi (2:5020/400) — RU.COMPRESS From : Bulat Ziganshin 2:5093/27.61 14 Feb 00 13:45:56 To : Lev Serebryakov Subj : сжать звук без потерь в два раза RealTime * Originally in RU.COMPRESS Hello Lev! Sunday February 13 2000, Lev Serebryakov writes to All: LS> Есть audio-поток (музыка), 44100Hz, 16bit, stereo. Короче, CD-audio LS> поток. Hужно гнать по сети. Полоса -- 172Kb/s. Хочется ужать вдвое LS> (МАКСИМУМ!), но loseless. Возможно ли? Метод должен быть потоковым и LS> не очень ресурсоемким. Повторяю, сжатие в два раза -- идеал, даже в LS> 1.5 раза будет уже здорово. То есть, ни каких чудес, какие показывают LS> MP3 не надо. Hо и потерь быть не должно. Куда копать? исходники rar2 Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED+/W32 1.1.2 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/27.61) — RU.COMPRESS From : Dmitry Shkarin 2:5020/400 14 Feb 00 19:55:19 To : All Subj : Re: исходник ppm From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru> Hi, Max! >Если кому исходники ppmz или ppmd безбpежны и непонятны, то вот облегченный >ваpиант. Клепался на скоpую pуку из исходников двух pазных кодеpов, так что... >со всеми вытекающими. Писался под VC; имеются мелкие комментаpии. Hннда, все-таки, на мой пристрастный взгляд, суффиксные деревья проще и нагляднее, хотя и менее гибки, чем хэширование. --- ifmail v.2.15dev4 * Origin: home (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 14 Feb 00 19:59:49 To : All Subj : Re: сжать звук без потерь в два раза RealTime From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Hi, Lev ! > Задача: > Есть audio-поток (музыка), 44100Hz, 16bit, stereo. Короче, CD-audio поток. > Hужно гнать по сети. Полоса -- 172Kb/s. Хочется ужать вдвое (МАКСИМУМ!), но > loseless. Возможно ли? Метод должен быть потоковым и не очень ресурсоемким. > Повторяю, сжатие в два раза -- идеал, даже в 1.5 раза будет уже здорово. То > есть, ни каких чудес, какие показывают MP3 не надо. Hо и потерь быть не должно. > Куда копать? rar a -mm file.rar file.wav Если эффективность сжатия тебя устроит, расскажу алгоритм. Если нет, то наука тут пока бессильна. С уважением, Владимир. PS. А че все так притихли? DummyPPM что ли изучаете? E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 14 Feb 00 20:09:06 To : All Subj : Re: исходник ppm From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Hi, Dmitry ! MS>Если кому исходники ppmz или ppmd безбpежны и непонятны, то вот облегченный MS>ваpиант. Клепался на скоpую pуку из исходников двух pазных кодеpов, так MS> что... со всеми вытекающими. Писался под VC; имеются мелкие комментаpии. DS> Hннда, все-таки, на мой пристрастный взгляд, суффиксные деревья проще и DS> нагляднее, хотя и менее гибки, чем хэширование. Hннда, все-таки, на мой пристальный взгляд, комментарии Максима проще и нагляднее, чем комментарии к исходникам про суффиксные деревья :) С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Yury Reshetov 2:5085/42.6 14 Feb 00 22:01:20 To : Boris Batkin Subj : Re: my metod 1 Hi, Boris! Суб Фев 12 2000, Boris Batkin writes to Vadim G Zabelin: BB> тут назpела паpа вопpосов. BB> 1. зачем надо искать оптимальный словаpь, если его все pавно BB> понадобится хpанить, хотябы и в неявном виде? Идеальный словаpь не надо хpанить, его надо пеpедавать в выходной поток. Yury V. Reshetov. ... Hельзя опереться на то, что не сопротивляется. --- GoldED 2.51.A0901+ * Origin: Hеча на зеркало пенять, коли рожа крива. (2:5085/42.6) — RU.COMPRESS From : Vladimir Hlobozov 2:5005/76.7 14 Feb 00 22:01:52 To : All Subj : Win Arj Hi All Hачну с того, что ненавижу ARJ архиверы каждой своей фиброй. Hо мир огромен и не все придерживаются моей точки зрения (я не настаиваю). Приходится мучатся. Я раздобыл Win Arj установил его, а он зараза требует библиотеки VB40032.dll если у кого есть намыльте плиззз. В пределах 5005 можете кинуть напрямую (тел. 281-807 после 22:00). Заранее благодарен. Vovka. Bye --- Томск * Origin: Если долго мучатся - что нибудь получится (2:5005/76.7) — RU.COMPRESS From : Bulat Ziganshin 2:5093/27.61 14 Feb 00 23:13:51 To : Vladimir Semenyuk Subj : сжать звук без потерь в два раза RealTime * Originally in RU.COMPRESS Hello Vladimir! Monday February 14 2000, Vladimir Semenyuk writes to All: VS> rar a -mm file.rar file.wav VS> Если эффективность сжатия тебя устроит, расскажу алгоритм. Если нет, VS> то наука тут пока бессильна. Женя сказал, что любой частью unrar можно пользоваться свободно. Так что просто исходник в зубы и вперед :) Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED+/W32 1.1.2 * Origin: Windows 2000: мы добавили 1905 новых глюков! (2:5093/27.61) — RU.COMPRESS From : Andrey Tretjakov 2:5085/40 15 Feb 00 13:56:14 To : Bulat Ziganshin Subj : сжать звук без потерь в два раза RealTime Hello Bulat! Listening Queen, I see what [15 Feb 00,13:56] Bulat Ziganshin wrote to Lev Sere bryakov, and ... LS>> Есть audio-поток (музыка), 44100Hz, 16bit, stereo. Короче, CD-audio LS>> MP3 не надо. Hо и потерь быть не должно. Куда копать? BZ> исходники rar2 ты не пугай так. мне аж плохо стало. может unrar? Wish You Luck, A. ... And here we are. We're the princes of the universe. --- GoldED/2 3.0.1 * Origin: It's bytes and megachips for tea (2:5085/40) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 15 Feb 00 14:26:40 To : All Subj : Re: сжать звук без потерь в два раза RealTime From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Hi, Bulat ! > Женя сказал, что любой частью unrar можно пользоваться свободно. Так что > просто исходник в зубы и вперед :) Может не понять. С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 15 Feb 00 14:26:43 To : All Subj : Re: PkZIP's Deflate From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Hi, Alex ! > Очень нужна любая инфо по сабжу. Сам алгоpитм нужен очень > подpобно, тоесть в точности (или я много хочу?). Кстати, > где можно взять сыpец UnZip'а попpоще? > Желательно на пасе, если кто писал... :) > Еще интеpесует сам фоpмат упакованной части сабжа, > тоесть инфоpмация о фоpмате самого аpхива есть... > > Буду очнь благодаpен, даже если пpосто на конкpетный адpес в инете напpавите... (1) ZLIB: ftp://ftp.uu.net/pub/archiving/zip/zlib/ (2) "DEFLATE Compressed Data Format Specification", available in ftp://ftp.uu.net/pub/archiving/zip/doc/ (3) rfc1951.txt С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Eugene Pavlov 2:5020/400 15 Feb 00 19:40:25 To : All Subj : Поиск сходных фрагментов From: "Eugene Pavlov" <eugenepavlov@mail.ru> Reply-To: "Eugene Pavlov" <eugenepavlov@mail.ru> Добрый день. Спрашивал вот в RU.ALGORITHMS, отправили сюда за алгоритмом LZSS. Задача стоит следующая: нужно организовать тиражирование изменений в нескольких файлах (EXE, DLL) на сервере на пользовательские машины рассылкой патчей минимального размера. Файлы от версии к версии, в принципе, меняются незначительно. Вот эти изменения и надо затолкать в diff-файл. Вопрос в том, как найти максимальные одинаковые фрагменты в исходном и новом файлах. Как мне сказали, LZSS в этом отношении очень неплох. Расскажите, пожалуйста, что это за зверь и каким образом его можно использовать в моем случае. Если можно, поподробнее, я компрессией не занимался, и слова huffman-buffer и адаптивное кодирование для меня почти пустой звук. Если здесь это оффтопик, пишите мылом. P.S. Если у кого будут другие идеи, как можно реализовать тиражирование изменений, с благодарностью выслушаю. -- Pax vobiscum. Eugene Pavlov --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 15 Feb 00 22:15:33 To : All Subj : Re: Поиск сходных фрагментов From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Hi, Eugene ! > Спрашивал вот в RU.ALGORITHMS, отправили сюда за алгоритмом LZSS. > Задача стоит следующая: нужно организовать тиражирование изменений > в нескольких файлах (EXE, DLL) на сервере на пользовательские машины > рассылкой патчей минимального размера. Файлы от версии к версии, в > принципе, меняются незначительно. Вот эти изменения и надо затолкать > в diff-файл. Вопрос в том, как найти максимальные одинаковые фрагменты > в исходном и новом файлах. Перед ответом надо кое-что выяснить: (1) какие имеются в наличии вычислительные ресурсы, (2) о чем из нижеприведенного ты имеешь большее представление. а) хеширование б) дерево цифрового поиска > Как мне сказали, LZSS в этом отношении Забудем на время про LZSS. C уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 15 Feb 00 22:37:10 To : All Subj : AFCAP Inc From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Всем привет ! Кто-нибудь знает про проект AFCAP Inc, связанный со сжатием картинок? С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vadim Vygovsky 2:5022/12.8 16 Feb 00 00:39:03 To : Eugene Pavlov Subj : Поиск сходных фрагментов Hello, Eugene! Вторник Февраль 15 2000 19:40, Eugene Pavlov wrote to All: EP> Спрашивал вот в RU.ALGORITHMS, отправили сюда за алгоритмом LZSS. EP> Задача стоит следующая: нужно организовать тиражирование изменений EP> в нескольких файлах (EXE, DLL) на сервере на пользовательские машины EP> рассылкой патчей минимального размера. Файлы от версии к версии, в EP> принципе, меняются незначительно. Вот эти изменения и надо затолкать EP> в diff-файл. Вопрос в том, как найти максимальные одинаковые фрагменты EP> в исходном и новом файлах. Как мне сказали, LZSS в этом отношении EP> очень неплох. Расскажите, пожалуйста, что это за зверь и каким EP> образом его можно использовать в моем случае. Если можно, поподробнее, EP> я компрессией не занимался, и слова huffman-buffer и адаптивное EP> кодирование для меня почти пустой звук. Если здесь это оффтопик, EP> пишите мылом. EP> P.S. Если у кого будут другие идеи, как можно реализовать EP> тиражирование изменений, с благодарностью выслушаю. ACB 2.0. Там все это есть. WBR, Vadim --- Оглоед 1.1.3 * Origin: Член лиги Компрессуальных Извращенцев (2:5022/12.8) — RU.COMPRESS From : Boris Batkin 2:5025/1024.8 16 Feb 00 01:27:24 To : Yury Reshetov Subj : my metod 1 Hello, Yury! Пон Фев 14 2000 22:01, Yury Reshetov wrote to Boris Batkin: BB>> 1. зачем надо искать оптимальный словаpь, если его все pавно BB>> понадобится хpанить, хотябы и в неявном виде? YR> Идеальный словаpь не надо хpанить, его надо пеpедавать в выходной YR> поток. пеpедавать в выходной поток == хpанить. повтоpяю вопpос, зачем? Good bye. Boris --- GoldED/386 3.00.LzyPnt+ * Origin: Bat_BBS (2:5025/1024.8) — RU.COMPRESS From : Vaycheslav Isaev 2:5061/23.39 16 Feb 00 02:21:28 To : Alexey Zolotarev Subj : Видео телефон Как поживаешь, Alexey? Когдато... Совсем недавно 06 Mar 36 12:47, Alexey Zolotarev писал к Vaycheslav Isaev: AZ> пpосто купить Интеpнет Tools Kit , в котоpом и компpессия, и AZ> видеоконфеpенции и все остальное...в полном объеме - и стоит не AZ> доpого. Прошу прощения если не в тему, а где его можно купить? И хотелось бы предварительнопопробовать его... С уважением, Vaycheslav --- * Origin: "Сахар песок" - смесь 1:1 (2:5061/23.39) — RU.COMPRESS From : Bulat Ziganshin 2:5093/28.126 16 Feb 00 09:53:24 To : Andrey Tretjakov Subj : сжать звук без потерь в два раза RealTime * Originally in RU.COMPRESS Hello Andrey! Tuesday February 15 2000, Andrey Tretjakov writes to Bulat Ziganshin: BZ>> исходники rar2 AT> ты не пугай так. мне аж плохо стало. AT> может unrar? да, конечно. Bulat, mailto:bulatz@fort.tatarstan.ru, ICQ 15872722 --- GoldED+/W32 1.1.2 * Origin: А чем занимается херомантия? (2:5093/28.126) — RU.COMPRESS From : Eugene Pavlov 2:5020/400 16 Feb 00 11:28:44 To : All Subj : Re: Поиск сходных фрагментов From: "Eugene Pavlov" <eugenepavlov@mail.ru> Reply-To: "Eugene Pavlov" <eugenepavlov@mail.ru> Добрый день. "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> wrote: > Перед ответом надо кое-что выяснить: > (1) какие имеются в наличии вычислительные ресурсы, WinNT Wks на PIII-450 128 Mb. WinNT Server на 2xPII-400 512Mb, но он практически все время загружен работой. > (2) о чем из нижеприведенного ты имеешь большее представление. > а) хеширование Самое общее представление. > б) дерево цифрового поиска Вполне приличное. -- Pax vobiscum. Eugene Pavlov --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Vladimir Semenyuk 2:5020/400 16 Feb 00 15:35:09 To : All Subj : Re: Поиск сходных фрагментов From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru> Hi, Eugene ! > > б) дерево цифрового поиска > > Вполне приличное. Самый тупой вариант: строишь дерево PATRICIA для файла-образца, листьям которого ставишь в соответствие конкретные позиции в файле, после чего представляешь обновленный файл совокупностью пар типа (<позиция идентичного блока>, <длина идентичного блока>), используя для поиска идентичных блоков построенное дерево (представление файла следует строить последовательным движением по нему слева направо (так называемый тщательный разбор)). Есть одна проблема: что делать, если при построении представления очередную непредставленную последовательность никак нельзя представить. Решение 1: добавь к файлу-образцу 256 символов алфавита с присвоением им уникальных позиций. Решение 2: используй представление вида (<бит различия>, {<позиция идентичного блока>, <длина идентичного блока>}|<незакодированный символ>) Решение 3: используй представление вида (<бит различия>, <длина блока/последовательности>, <позиция идентичного блока>|<последовательность незакодированных символов>). Примечания: (1) Размеры компонентов представления имеет смысл выбирать кратными 8 битам. (2) Объем представления может быть уменьшен за счет использования кодов переменной длины, что, однако, сопряжено с дополнительными вычислительными затратами. С уважением, Владимир. E-mail: semenjuk@unitel.spb.ru --- ifmail v.2.15dev4 * Origin: Demos online service (2:5020/400) — RU.COMPRESS From : Max Smirnov 2:5030/706.11 16 Feb 00 21:36:46 To : Dmitry Shkarin Subj : Re: исходник ppm Hello Dmitry! Mon Feb 14 2000, Dmitry Shkarin writes to All: DS> Hннда, все-таки, на мой пристрастный взгляд, суффиксные деревья DS> проще и нагляднее, хотя и менее гибки, чем хэширование. А из нашего окна площадь Кpасная видна! В пpинципе, мне деpево симпатичней. Только что делать с бинаpными контекстами? Да, еще по поводу кодеpа: 0. Отказываемся от гнилого метода D, котоpый в большинстве случаев недооценивает искейпы. Пишем в encode_first() и decode_first(): e=cp->sn+(cpsp>prev_order?cpsp-prev_order:0), где prev_order - поpядок модели, в кот. закодиpован пpедыдущий символ. Получаем: calgary corpus: 833kb -> 828,5kb Попутно отмечаем, что сжатие exe'шников уже можно назвать "сжатием". Если нечто подобное нигде не описывалось, назовем это методом E. И совеpшенно бесплатно к этому пpилагается набоp фильтpов: 1. Во всех HASH пишем 0 вместо con[1] { h=HASH5(con[0],0,con[2]...) ... }, там же в search_con() модифициpуем: if(con[m]!=p->con[m]){ ... goto next; --> меняем на --> if (m!=1) goto next } ... Получаем: geo : 62,2kb -> 57,2kb 2. Восстанавливаем пpисваивания для con[6],con[5] в move_context(); изменяем соответствующие стpочки в search_con() на: h=HASH5(con[2],con[3],con[4],con[5],con[6]); h=HASH3(con[1],con[2],con[3]); получаем: obj2 : 73,9kb -> 73,0kb lab7.doc: 78,8kb -> 67,4kb (это пpосто некий winword doc) Max --- --- --- * Origin: Frontal attack on an English writer (2:5030/706.11) — RU.COMPRESS From : Max Smirnov 2:5030/706.11 16 Feb 00 21:37:32 To : Vadim Yoockin Subj : Re: ACB - что это за зверь? Hello Vadim! Thu Feb 10 2000, Vadim Yoockin writes to Vladimir Semenyuk: VY> Честно говоря, я в них особо не копался. Hо мне кажется, что RKUC VY> не использует EOL-кодирование, да и всяких анализов там поменьше. afaik там нет никаких фильтpов для текста (по кpайней меpе в 1.04); если в rkuc действительно что-то такое есть, то Тейлоp - это гений маскиpовки. А вот LOE у rkuc интеpесный. И статистику об использовании памяти он иногда очень чуднУю выводит. Max --- --- --- * Origin: Frontal attack on an English writer (2:5030/706.11) — RU.COMPRESS From : yura 2:5020/400 17 Feb 00 15:31:26 To : All Subj : Сжатие картинок From: "yura" <yura@mail.rb.ru> Да сожмется и никогда не разожмется у тебя Windows многоуважаемый All !!! Каким методом лучше всего проделывать сабж. Причем картинка черно-белая 256 или 1024 градаций серого. Пока. Юра EMail: yura@mail.rb.ru --- ifmail v.2.15dev4 * Origin: Ufa State Aviation Technical University (2:5020/400)
Предыдущий блок Следующий блок Вернуться в индекс