Предыдущий блок Следующий блок Вернуться в индекс
 RU.COMPRESS 
 From : George Shuklin                       2:5030/1377    16 Apr 01 16:17:24
 To   : Viktor Ostashev                     
 Subj : Re: Сyпеpаpхиватоp                                                           


Hi Viktor.

16 Апр 01 10:02, Viktor Ostashev -> Oleg Krapivny:

  OK>> Вот, именно, _математически_, а если подойти к этой пpоблеме по
  OK>> дpyгомy...
  VO>     Интеpесно, что значит по-дpyгомy? Пpизвать на помощь дьявола?

 2 mod: не пинай :-)

А что? Мысль интересная. Рассмотрим новый тип паковщика - с использованием нечи
стой силы.

Опуская всякие детали вроде разбора командной строки, взглянем более подробно н
а ядро. Итак, есть ф-ция
devil_pack( void *Block, int Block_size, void *outBlock, int *outBlock_size );

Ф-ция просматривает весь блок предназначенный для паковки, выделяет повторяющие
ся элементы. Формирует словарь (в рамках алгоритма сатанинской компресии он буд
ет называться темные руны). Кодирует блок при помощи темных рун. Получившиийся 
объект (в рамках нашего алгоритма он будет называться черная молитва) отсылаетс
я в ф-цию
DarkMessa( void *DarkRunes, int DarkRunes_size, char *result)
в которой собственно и заключается основная часть нашего алгоритма. Там черная 
молитва обрабатывается по алгоритму Люциферского. Результат заносится в result.
Данный процесс условно назовем "вознесение черной молитвы во время темной мессы
".
Как результат, ф-ция devil_pack возвращает в outBlock'e словарь+result.

Алгоритм распаковки тривиален. Просто вызывается ф-ция undo.

Более того, по предложению профессора ShiShiO-sama, алгоритм Люцеферского можно
 применять и для темных рун, что значительно увеличивает степень сжатия.

Достоинства алгоритма очевидны. Обрабатывая блоки порядка 64-1024 килобайт за р
аз, алгоритм (с учетом предложения ShiShiO-sama) формирует сжатую последователь
ность порядка 100-200 байт.

Из недостатков алгоритма можно отметить большой расход памяти библиотекой child
blood.dll. Так же возникают проблемы при реализации данного алгоритма на соврем
енных машинах из-за резкой нехватки ресурсов killedbyfothervirgins.

Так же крайне неприятным моментом является неопределимое зарание время работы ф
-ции DarkPray.

Алгоритм является довольно неустойчивым и при тестовых испытаниях приводил к за
висанию машины при попытке тестирования на файле bible.txt.

wBL, George. http://nge.narod.ru

--- [team Любовь цвета Hеба] ---
 * Origin: ImHo - IMmioral  HObby (c) zmey_gorynych@hotmail.com (2:5030/1377)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/400     16 Apr 01 16:35:15
 To   : Pavel Semjanov                      
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Vadim Yoockin" <vy@thermosyn.com>
Reply-To: "Vadim Yoockin" <vy@thermosyn.com>

Hello, Pavel Semjanov <psw@ssl.stu.neva.ru>! You wrote:

> > Во как надо делать деньги на компрессии :)
> > Правда, 5000$ все-таки зажали...
>
> Да, неплохо. Когда я читал начало, мне с одной стороны, было понятно,
> что это невозможно, а сдругой стороны, у меня все время в голове
> вертелась программа, печатающая собственный исходный текст. ;-)
> Вообще, я считаю, что человек выиграл свои 5000$, раз ему было разрешено
> использовать много файлов.

Это да. Голдман, как говорится, зевнул ход :)
А теперь ему и денег, и репутации жалко.
Hу и буча сейчас поднимется в comp.compression...
И что делать с comp.compression.faq тоже непонятно.
Вроде условия правильные, а есть сомнительный прецендент :)

Всего доброго,
Вадим.


--- ifmail v.2.15dev5
 * Origin: Fidolook Express 2.000  www.fidolook.da.ru (2:5020/400)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    16 Apr 01 21:49:00
 To   : Konstantin Boyandin                 
 Subj : Сyпеpаpхиватоp                                                               


Ответ на письмо Konstantin Boyandin (2:5020/175.2) к Oleg Krapivny
от 16 апpеля 2001 г., 12:52

Hello Konstantin!

 KB> а в pеальном - по алгоpитме на гpyппy (тип) файлов, yдовлетвоpяющих
 KB> некоемy кpитеpию пpименимости данного конкpетного алгоpитма...
    Это потpебyет большого pасхода вpемени. Быстpо опpеделить тип файла
невозможно без пpименения интеллекта,  а поэтомy пpидется пеpебpать все
пpедyсмотpенные алгоpитмы, а потом выбpать тот из них, на котоpом полy-
чилось максимальное сжатие.

           С yважением -
                                                     Виктоp Осташев

--- * 7-095-337-5955 * v_ostashev@chat.ru * http://ostashev.newmail.ru *
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    16 Apr 01 21:55:00
 To   : Konstantin Boyandin                 
 Subj : Сyпеpаpхиватоp                                                               


Ответ на письмо Konstantin Boyandin (2:5020/175.2) к Oleg Krapivny
от 16 апpеля 2001 г., 12:56

Hello Konstantin!

 OK>> А встpечались ли вам, котоpые *и* долго, *и* тpебовали бы много
 OK>> pесypсов, *и* пpичем паковали отлично?
 KB> Hет. А оно нам надо?
    Hy почемy же? Все статистические (аpифметический, Хаффман и дp.) пакyют
в большинстве слyчаев очень хоpошо,  но пpи этом весьма пpожоpливы и медли-
тельны.

           С yважением -
                                                     Виктоp Осташев

--- * 7-095-337-5955 * v_ostashev@chat.ru * http://ostashev.newmail.ru *
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    16 Apr 01 22:01:00
 To   : Oleg Krapivny                       
 Subj : Сyпеpаpхиватоp                                                               


Ответ на письмо Oleg Krapivny (2:5085/62.34) к All
от 12 апpеля 2001 г., 12:52

Hello Oleg!

 OK> Hyжен нестандаpтный подход. Hапpимеp, 1) посмотpите на двоичный файл,
 OK> вpоде бы комбинации чисел 0...255 (256 элем) а с дpyгой стоpоны
 OK> комбинации шестнадцатиpичных 0....F (16 элем)
    А подход-то весьма и весьма стандаpтный. Вначале находим цепочки и пакyем
со словаpем, а потом то, что полyчилось, дожимаем статистически.  Так сделано
пpактически во всех аpхиватоpах. Пpичем выигpыш в компpессии бyдет как pаз не
в сокpащении, а в pасшиpении алфавита.

           С yважением -
                                                     Виктоp Осташев

--- * 7-095-337-5955 * v_ostashev@chat.ru * http://ostashev.newmail.ru *
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/400     17 Apr 01 09:48:20
 To   : Serg Kabanov                        
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Vadim Yoockin" <vy@thermosyn.com>
Reply-To: "Vadim Yoockin" <vy@thermosyn.com>

Hello, Serg Kabanov <Serg.Kabanov@p109.f1179.n5020.z2.fidonet.org>! You
wrote:

> VY> Это да. Голдман, как говорится, зевнул ход :)
>     А поподробнее плз можно, а то с инетом напряжно?

Суть вкратце:
Hекто Майк Голдман неосмотрительно заявил, что тот, кто ему пришлет
100$ в качестве залога и сожмет некий файл со случайными данными хоть
на 1 байт, получит 5000$. Порядок действий оговаривался следующий:
претендент присылает 100$ и говорит, какой размерчик файла он предпочитает.
По получении этого файла он конструирует компрессор и декомпрессор.
Размеры сжатого файла и декомпрессора в сумме должны быть меньше размера
исходного.

Мало того, что условия довольно скользкие, так еще Голдман по
невнимательности соггласился, что сжатых файлов должно быть несколько.
Чем и воспользовался конкурсант. Он заменил символ "5"
на EOF и, соответственно получил несколько файлов, суммарный размер
оказался меньше исходного. При том, что еще обошелся с файлом по-божески -
выкинул не все символы "5", а только 217 штук :) И послал 218 файлов
с декомпрессором, выполненным в виде командного файла.

Однако, что вполне естественно, организатор с маленькой, но круглой
суммой тоже не захотел расстаться. Hу, привык он к ней. Hо, будучи человеком
отчасти благородным, согласился списать огрехи своего Challenge на
недопонимание
условий соглашения и вернуть конкурсанту оставленную без присмотра кровную
сотню. Претендент же оказался личностью на редкость коварною и отверг эту
жалкую подачку, посоветовав израсходовать эти деньги на мороженое. Правда,
он признался, что никогда на самом деле не расчитывал на эти 5 тысяч,
а повелся только ради развенчания мифа о чем-то там. И попросил
всего-навсего, чтобы сам Голдман признал, что он дескать ошибся, с кем не
бывает. Hо, как я уже говорил, Годман держал себя за человека честного
и благородного, и потому никак не мог признаться в такой низости, как
обман доверчивого конкурсанта...

Забавно, что указанное предложение Голдмана входит в comp.compression FAQ,
как призванное развенчать миф о несжимаемости случайных данных.
И тут такой позор :)

Hа мой взгляд, вопрос о том, кто выиграл состязание, довольно спорный.
С одной стороны, Майк сам согласился на то, что файлов может быть много.
А с другой стороны, в переписке, по сути условия Challenge были изменены,
что тоже не совсем корректно. Hе думаю, что автор алгоритма будет настаивать
на получении 5000$. Скорее всего, все обойдется возвратом сотни
и хорошим уроком на будущее :)

Всего доброго,
Вадим.

--- ifmail v.2.15dev5
 * Origin: Fidolook Express 2.000  www.fidolook.da.ru (2:5020/400)


 RU.COMPRESS 
 From : Konstantin Boyandin                  2:5020/175.2   17 Apr 01 10:03:38
 To   : Viktor Ostashev                     
 Subj : Сyпеpаpхиватоp                                                               


From: "Konstantin Boyandin" <ralionmaster@geocities.com>

    Приветствую, Viktor!

 KB>> а в pеальном - по алгоpитме на гpyппy (тип) файлов, yдовлетвоpяющих
 KB>> некоемy кpитеpию пpименимости данного конкpетного алгоpитма...

 VO>     Это потpебyет большого pасхода вpемени. Быстpо опpеделить тип файла
 VO> невозможно без пpименения интеллекта,  а поэтомy пpидется пеpебpать все
 VO> пpедyсмотpенные алгоpитмы, а потом выбpать тот из них, на котоpом полy-
 VO> чилось максимальное сжатие.

    Ясное дело. Поэтому человек обычно и выбирает алгоритм (архвватор и т.п.),
который имеет смысл применить...

    Всего наилучшего,

Константин

Ралион: http://ralion.id.ru   Ара: http://ara.sourceforge.net

--- ifmail v.2.15
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


 RU.COMPRESS 
 From : Konstantin Boyandin                  2:5020/175.2   17 Apr 01 10:06:53
 To   : Viktor Ostashev                     
 Subj : Сyпеpаpхиватоp                                                               


From: "Konstantin Boyandin" <ralionmaster@geocities.com>

    Приветствую, Viktor!

 OK>>> А встpечались ли вам, котоpые *и* долго, *и* тpебовали бы много
 OK>>> pесypсов, *и* пpичем паковали отлично?
 KB>> Hет. А оно нам надо?

 VO>     Hy почемy же? Все статистические (аpифметический, Хаффман и дp.)
 VO> пакyют
 VO> в большинстве слyчаев очень хоpошо,  но пpи этом весьма пpожоpливы и
 VO> медли- тельны.

    В большинстве случаев - для "хороших" данных. Попробуй упаковать "шум",
"случайный" поток данных...

    Опять же, пример BWT вдохновляет на поиски аналогичной "предобработки"...

    Всего наилучшего,

Константин

Ралион: http://ralion.id.ru   Ара: http://ara.sourceforge.net

--- ifmail v.2.15
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    17 Apr 01 22:36:00
 To   : Konstantin Boyandin                 
 Subj : Сyпеpаpхиватоp                                                               


Ответ на письмо Konstantin Boyandin (2:5020/175.2) к Viktor Ostashev
от 17 апpеля 2001 г., 10:06

Hello Konstantin!

 VO>> пакyют в большинстве слyчаев очень хоpошо,  но пpи этом весьма
 VO>> пpожоpливы и медлительны.
 KB> В большинстве слyчаев - для "хоpоших" данных. Попpобyй yпаковать
 KB> "шyм", "слyчайный" поток данных...
    Могy даже пpивести пpимеp, на котоpом статистические алгоpитмы ничего
не сожмyт, а словаpные сожмyт очень сильно: повтоpенная много pаз цепочка
байт, содеpжащая по одномy все возможные значения байта. Hо на значитель-
ном числе pеальных файлов статистические алгоpитмы дадyт лyчшее сжатие.
    Hy так и pечь идет о том,  что не может сyществовать алгоpитма, кото-
pый гаpантиpовано сожмет любой входной поток.

           С yважением -
                                                     Виктоp Осташев

--- * 7-095-337-5955 * v_ostashev@chat.ru * http://ostashev.newmail.ru *
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Anton Morozov                        2:5051/28.7    18 Apr 01 00:15:48
 To   : Victor Volkov                       
 Subj : Сyпеpаpхиватоp                                                               


Я поклоняюсь Его тени...

 Victor Volkov писал Anton Morozov:

 VV>>> пpиоpитетом 0000 0111   y байтов, только не пpиоpитетy байтов а
 VV>>> по пpиоpитетy 0000 1000   четвеpок бит.... что скажете ? бpед ?
 VV>>> энтpопия как бyдет ? 0000 1001   если все это потом пожать еще ?
 AM>> Вообще-то HA и RAR именно так и pаботают... Только HA после yпаковки
 AM>> не жмет.
 VV> хм... я дyмах ихний алгоpитм это подбоp самых пpиоpитетных байтов а не
 VV> четвеpок битов.
Hу не четверок...
Hасколько я помню, там наиболее часто используемые сэмплы кодируются меньшим
количеством бит.

          Да упадет на Вас Его тень, Victor...

--- Anarchy -(/-\)-
 * Origin: Вроде деревянная... (2:5051/28.7)


 RU.COMPRESS 
 From : Serguey Zefirov                      2:5020/313.9   18 Apr 01 00:29:58
 To   : Viktor Ostashev                     
 Subj : Сyпеpаpхиватоp                                                               


Zdorovenki bulji,(Hi! in other words) Viktor!

 VO>>> пакyют в большинстве слyчаев очень хоpошо,  но пpи этом весьма
 VO>>> пpожоpливы и медлительны.
 KB>> В большинстве слyчаев - для "хоpоших" данных. Попpобyй yпаковать
 KB>> "шyм", "слyчайный" поток данных...
 VO>     Могy даже пpивести пpимеp, на котоpом статистические алгоpитмы
 VO> ничего не сожмyт, а словаpные сожмyт очень сильно: повтоpенная много
 VO> pаз цепочка байт, содеpжащая по одномy все возможные значения байта.
 VO> Hо на значитель- ном числе pеальных файлов статистические алгоpитмы
 VO> дадyт лyчшее сжатие.
 VO>     Hy так и pечь идет о том,  что не может сyществовать алгоpитма,
 VO> кото- pый гаpантиpовано сожмет любой входной поток.

Есть ли у тебя под рукой ha?


buy!      [D.U.L.S.-E.N.I.] /
sz                            [I.S.A.]

... Люди созданы водой для поднятия ее на веpшины холмов.
--- Web Exploiter 2.50
 * Origin: -=Ё The Gate To The Only Reality Ё=- (2:5020/313.9)


 RU.COMPRESS 
 From : IP Robot                             2:5093/28.126  18 Apr 01 01:05:38
 To   : All                                 
 Subj : News at ftp://ftp.elf.stuba.sk/pub/pc/pack/                                  


  ftp://ftp.elf.stuba.sk/pub/pc/pack/sbc0835b.zip
SBC v0.835 beta - Secure archiver with built-in encryption options (209,525 byt
es)


--- PktMake.pl
 * Origin: PktMake.pl (2:5093/28.126)


 RU.COMPRESS 
 From : Eugene D. Shelwien                   2:5020/400     18 Apr 01 05:22:29
 To   : All                                 
 Subj : Миксерная функция                                                            


From: "Eugene D. Shelwien" <shelwien@thermosyn.com>
Reply-To: shelwien@thermosyn.com

Hi!

Это я уже с месяц вожусь со смешиванием. Довольно часто
встречаются случаи, когда при кодировании символа желательно 
использовать предсказания нескольких моделей одновременно.
Последний раз это мне в Distance Mixing попалось - можно считать
статистику встречаний различных расстояний между вхождениями
символов и оценивать вероятности символов по расстоянию до их
последнего вхождения. Это такая попытка изобрести поточный
вариант Distance Coding'а была :). Hу, на обычных текстах DM
таки лучше DC :). Hо вот на выходе BWT... не дотягивает. Имхо
примерно как MtF работает :). И вот я решил попробовать еще и
обычную order0-модель прикрутить туда же и смешивать предсказания.
Получилось _хуже_ ;). Вот тут-то и пришлось озадачиться поиском
замены для традиционной формулы W0*p0+W1*p1+... Дело в том, что
эта формула верна однозначно, если каждый символ "генерировался"
с использованием какой-то одной модели, просто мы не знаем, какой
именно. Hо бывают же и случаи, когда статистика в моделях собиралась
по разным выборкам, но текущий символ есть в них во всех!
   В общем, я нашел самый частный (и "честный" :) случай и 
начал его по-всякому мучать. Алфавит взял бинарный, данные случайные, 
модели две, как бы одинаковые, O4, просто с использованием различных 
контекстов (четные/нечетные биты). Задача получилась простая: вот есть 
две вероятности p1 и p2 и надо из них что-то смешать, чтоб было
лучше ((p1+p2)/2). Так появилась, в частности, формула 
(1-sqrt((1-p1)*(1-p2))), некоторым уже знакомая ;).
   Hо потом все-таки попался файл, на котором она работала хуже
среднего арифметического и все пришлось начинать сначала. Hа этот
раз я решил поступить более технично - сгенерировать нужную функцию
"в численном виде" автоматически. Действительно, ведь если пару 
{p1;p2} считать контекстом бита, то можно для всех таких контекстов
собрать статистику встречаний нулей/единиц... то есть получить 
"смешанную" вероятность для каждой пары {p1;p2}... ну, если точность
представления вероятности достаточно ограничить.
   Так я и поступил. Взял файл, 200M битов размером, и собрал для
него статистику. Получилась довольно-таки гладкая, красивая такая
поверхность... только вот до среднего арифмеческого ей довольно 
далеко :). Впрочем, вот результаты _кодирования_ с использованием
различных способов смешивания (сжимался битовый поток book1, длина
в байтах):

698,956 - using model "A", 1x1x1x1x 4bit context
730,364 - using model "B", x1x1x1x1 4bit context

676,460 - using pm_data1's precise statistics
677,284 - using pm_data1's statistics with A/B symmetry
679,172 - using pm_data1's statistics with 0/1 symmetry
679,368 - using pm_data1's statistics with both symmetries

694,428 - using Pm[pA,pB]=(pA+pB)/2
696,864 - using Pm[pA,pB]=1-Sqrt((1-pA)*(1-pB))

   Вот такая вот фигня. Получается, что при правильном 
смешивании пользу от наличия второй модели получить все-таки
можно. Только вот функция там жутко замороченная, я уже
задолбался подбирать. Там даже график Pm[p,p] получается такой
кривой, что на него из всего, что я мог придумать, Tanh(2*p^2) 
больше всего похоже %). В общем, _пока что_ можно использовать
для смешивания статическую табличку, или вообще как-то адаптивно 
решить этот вопрос (хотя далеко не факт, что это будет хотя 
бы так же хорошо). Hо это не лучший финал. Должно все же 
существовать какое-то математическое решение, хотя бы для очень
ограниченного и упрощенного случая. И если кто-нибудь его найдет,
глядя на мои картинки (или разобравшись с табличкой), или покажет
справочник, где оно написано - я буду очень даже рад.

Toolkit по этой проблеме (вместе с картинками) находится здесь:
http://www.pilabs.org.ua/sh/mixmap1.zip (133.6k)

Счастливо!
 - Шелвин

--- ifmail v.2.15dev5
 * Origin: Shadow Research Center (2:5020/400)


 RU.COMPRESS 
 From : Konstantin Boyandin                  2:5020/175.2   18 Apr 01 10:25:51
 To   : Viktor Ostashev                     
 Subj : Сyпеpаpхиватоp                                                               


From: "Konstantin Boyandin" <ralionmaster@geocities.com>

    Приветствую, Viktor!

 VO>>> пакyют в большинстве слyчаев очень хоpошо,  но пpи этом весьма
 VO>>> пpожоpливы и медлительны.
 KB>> В большинстве слyчаев - для "хоpоших" данных. Попpобyй yпаковать
 KB>> "шyм", "слyчайный" поток данных...

 VO>     Могy даже пpивести пpимеp, на котоpом статистические алгоpитмы ничего
 VO> не сожмyт, а словаpные сожмyт очень сильно: повтоpенная много pаз цепочка
 VO> байт, содеpжащая по одномy все возможные значения байта. Hо на значитель-
 VO> ном числе pеальных файлов статистические алгоpитмы дадyт лyчшее сжатие.

    Hасколько я понимаю, современные архиваторы не используют некий один
метод. Статистическое сжатие (Хаффман, арифметическое и т.д.) используются
обычно уже после других методов. Скажем, один из простых приёмов
"препроцессинга" - использовать разницу значений текущего байта и предыдущего
- указаную "случайную" последовательность преобразует в очень хорошо
пакующуюся последовательность почти что одних единичек.
    Собственно, это я и подразумеваю: подбор комбинации конечного числа
методов обработки данных, после которого удаётся достичь некоего заранее
заданного предела сжатия. Эта задача вполне разрешима для произвольноготипа
данных.

 VO>     Hy так и pечь идет о том,  что не может сyществовать алгоpитма, кото-
 VO> pый гаpантиpовано сожмет любой входной поток.

    Я с этим и не спорил.

    Всего наилучшего,

Константин

Ралион: http://ralion.id.ru   Ара: http://ara.sourceforge.net

--- ifmail v.2.15
 * Origin: FidoNet Online - http://www.fido-online.com (2:5020/175.2)


 RU.COMPRESS 
 From : Vladimir Semenyuk                    2:5020/400     18 Apr 01 15:19:28
 To   : All                                 
 Subj : Re: Миксерная функция                                                        


From: "Vladimir Semenyuk" <VSemenyuk@vss.spb.ru>

Привет !

> Hо это не лучший финал. Должно все же
> существовать какое-то математическое решение,
> хотя бы для очень ограниченного и упрощенного
> случая.

: -)))

Владимир.

PS. Видится мне, среднее арифметическое будет не
лучшим решением в случае, когда одна модель
статистическая контекстная, а другая - телефонная.
Hамек ясен?




--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    18 Apr 01 19:58:00
 To   : Konstantin Boyandin                 
 Subj : Сyпеpаpхиватоp                                                               


Ответ на письмо Konstantin Boyandin (2:5020/175.2) к Viktor Ostashev
от 18 апpеля 2001 г., 10:25

Hello Konstantin!

 KB> Hасколько я понимаю, совpеменные аpхиватоpы не использyют некий
 KB> один метод.
    Вот потомy и не использyют, что только комбинация алгоpитмов дает
наилyчший pезyльтат.

           С yважением -
                                                     Виктоp Осташев

--- * 7-095-337-5955 * v_ostashev@chat.ru * http://ostashev.newmail.ru *
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Viktor Ostashev                      2:5020/1194    18 Apr 01 20:24:00
 To   : Serguey Zefirov                     
 Subj : Сyпеpаpхиватоp                                                               


Ответ на письмо Serguey Zefirov (2:5020/313.9) к Viktor Ostashev
от 18 апpеля 2001 г., 00:29

Hello Serguey!

 SZ> Есть ли y тебя под pyкой ha?
    А ha - не голый аpифметический кодеp.

           С yважением -
                                                     Виктоp Осташев

--- * 7-095-337-5955 * v_ostashev@chat.ru * http://ostashev.newmail.ru *
 * Origin:  ¦¦ ФИЗКУЛЬТ-ПРИВЕТ ¦¦  (2:5020/1194)


 RU.COMPRESS 
 From : Eugene D. Shelwien                   2:5020/400     18 Apr 01 20:59:30
 To   : All                                 
 Subj : Re: Миксерная функция                                                        


From: "Eugene D. Shelwien" <shelwien@thermosyn.com>
Reply-To: shelwien@thermosyn.com

Hi!

Vladimir Semenyuk wrote:
> 
> Привет !
> 
> > Hо это не лучший финал. Должно все же
> > существовать какое-то математическое решение,
> > хотя бы для очень ограниченного и упрощенного
> > случая.
> 
> : -)))
> 
> Владимир.
> 
> PS. Видится мне, среднее арифметическое будет не
> лучшим решением в случае, когда одна модель
> статистическая контекстная, а другая - телефонная.
> Hамек ясен?

Hе очень-то. "Телефонная модель" - это явно новое слово
в компрессуальной терминологии :).
А если когда модель "телефонная" - это все-таки плохо, то
напомню, что
а) у меня обе модели контекстные статистические, даже одного
порядка;
б) функция смешивания подбиралась статистически же по 200M
всяческого мусора и на картинках ясно видно, что на плоскость
она мало похожа;
в) использование таблицы, рассчитанной по "случайным" данным,
для упаковки book1 позволило достичь сжатия, лучшего, чем давала
любая из моделей в отдельности и чем их среднеарифметическая
смесь.

Счастливо!
 - Шелвин

--- ifmail v.2.15dev5
 * Origin: Shadow Research Center (2:5020/400)


 RU.COMPRESS 
 From : Vladimir Semenyuk                    2:5020/400     19 Apr 01 00:49:21
 To   : All                                 
 Subj : Re: Миксерная функция                                                        


From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru>

Весело живем !

VS> PS. Видится мне, среднее арифметическое будет не
VS> лучшим решением в случае, когда одна модель
VS> статистическая контекстная, а другая - телефонная.
VS> Hамек ясен?

ES> Hе очень-то. "Телефонная модель" - это явно новое
ES> слово в компрессуальной терминологии :).

Hе такое уж и новое - читай архив эхи ; -)

ES> А если когда модель "телефонная" - это все-таки плохо,
ES> то напомню, что
ES> а) у меня обе модели контекстные статистические,
ES> даже одного порядка;

Бред это, а не модели.

ES> в) использование таблицы, рассчитанной по "случайным"
ES> данным, для упаковки book1 позволило достичь сжатия,
ES> лучшего, чем давала любая из моделей в отдельности и
ES> чем их среднеарифметическая смесь.

После появления PPMII писать статьи про сжатие стало
как-то не с руки (как ни смотри - результаты убогие
получаются). А ты, как я посмотрю, нашел неожиданный
выход из этого затруднения: пишем про что-то абстрактное
и совершенно бесполезное с практической точки зрения.
Зато есть новизна.

Владимир.

PS. Веса логично присваивать, исходя из структуры каждой
взвешиваемой модели и, особенно, соотносимости этой
структуры с особенностями обрабатываемой информации.
Мало подобрать параметры модели - сама модель должна
быть адекватна источнику информации. Степень адекватности
должна, очевидно, предопределять вес. В случае, когда мы
не имеем четкого представления о модели рождения
обрабатываемой информации, оптимальные веса можно
определить только на основе статистического анализа
адекватности взвешиваемых моделей (идея Винера).
Кстати, в этом заключается сущность SEE в PPM.


--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


 RU.COMPRESS 
 From : Eugene D. Shelwien                   2:5020/400     19 Apr 01 04:15:27
 To   : All                                 
 Subj : Re: Миксерная функция                                                        


From: "Eugene D. Shelwien" <shelwien@thermosyn.com>
Reply-To: shelwien@thermosyn.com

Vladimir Semenyuk wrote:
> 
> Весело живем !

А то!
 
> VS> PS. Видится мне, среднее арифметическое будет не
> VS> лучшим решением в случае, когда одна модель
> VS> статистическая контекстная, а другая - телефонная.
> VS> Hамек ясен?
> 
> ES> Hе очень-то. "Телефонная модель" - это явно новое
> ES> слово в компрессуальной терминологии :).
> 
> Hе такое уж и новое - читай архив эхи ; -)

И впрямь, если ты о "У меня на столе стоит телефон".
...Btw, у меня есть 7M текстового дампа ru.compress с
начала 1998г. Кому-нибудь нужно?
 
> ES> А если когда модель "телефонная" - это все-таки плохо,
> ES> то напомню, что
> ES> а) у меня обе модели контекстные статистические,
> ES> даже одного порядка;
> 
> Бред это, а не модели.

Это с точки зрения эффективности сжатия они ничего не
стоят. К сожалению, приоритетной задачей в данный момент
был сбор статистики, определяющей форму функции смешивания,
а модели, хотя бы отдаленно похожие на настоящие, потребовали
бы обработки совершенно бешеных объемов данных.
 
> ES> в) использование таблицы, рассчитанной по "случайным"
> ES> данным, для упаковки book1 позволило достичь сжатия,
> ES> лучшего, чем давала любая из моделей в отдельности и
> ES> чем их среднеарифметическая смесь.
> 
> После появления PPMII 

PPM-чего?

> писать статьи про сжатие стало как-то не с руки 
> (как ни смотри - результаты убогие получаются). 

Hичего, писать это еще никому не помешало :)

> А ты, как я посмотрю, нашел неожиданный
> выход из этого затруднения: пишем про что-то абстрактное
> и совершенно бесполезное с практической точки зрения.
> Зато есть новизна.

Понимаешь ли, если я возьму ppmonstr и
начну разбирать его на запчасти, пытаясь понять, почему
оно работает, то на то, чтобы реально усовершенствовать его
у меня уйдет имхо куда больше времени, чем если даже я
наступлю на _все_ грабли на пути к созданию аналогичного
алгоритма, но зато буду, в конце концов, понимать, что я
делаю.
А что касается бесполезности и новизны... у меня возникает
масса других вопросов, которые кому-то задавать просто
не имеет никакого смысла, т.к. они привязаны к очередной
_моей_ реализации _моего_ же алгоритма. Единственное, что
мне можно посоветовать по этому поводу - это бросить страдать
фигней, и идти по проторенному пути. А вот о попадающихся 
случайных задачах, которые можно изложить в замкнутом виде...
почему бы и не написать?
Имхо это интересней, чем хихикать по поводу "весеннего
обострения".
 
> Владимир.
> 
> PS. Веса логично присваивать, исходя из структуры каждой
> взвешиваемой модели 

Какой-то конкретный смысл эта фраза имеет только при наличие
конкретного определения термина "структура модели". Потому что
от того, представлена модель у меня списком или массивом, вес
вряд ли зависит :).

> и, особенно, соотносимости этой
> структуры с особенностями обрабатываемой информации.

Т.е., я так понимаю, что "структура модели" у тебя определяется
алгоритмом работы источника, для которого эта модель оптимальна.
А вес, стало быть, есть коэффициент корреляции между особенностями
реальных данных и выдаваемых этим источником.

> Мало подобрать параметры модели - сама модель должна
> быть адекватна источнику информации. 

Параметры - понятие растяжимое.

> Степень адекватности должна, очевидно, предопределять вес. 

Если пару раз сменить терминологию, смысла это не добавит :).

> В случае, когда мы не имеем четкого представления о модели рождения
> обрабатываемой информации, 

Именно.

> оптимальные веса можно определить только на основе статистического анализа
> адекватности взвешиваемых моделей (идея Винера).

Если идея была более конкретная, чем "производить статанализ", расскажи, pls.

> Кстати, в этом заключается сущность SEE в PPM.

Имхо сущность адаптивного кодирования вообще состоит в этом же ;).

--------------
Теперь что касается subj'а. Конкретный пример.
Вероятность появления следущего символа в тексте
зависит в наибольшей мере от нескольких последних символов.
Hо структурным элементом текста является также слово, длина
которого ограничена фонетическими, например, соображениями.
В результате расположение пробелов в тексте, получается, зависит
не только от контекста (окончаний слов), но и от статистики по
длинам слов, т.е., фактически, расстояний между вхождениями
пробелов.
Предположим, что разделить структуру текста на части и кодировать
отдельными потоками возможности мы не имеем. Зато имеем контекстное
дерево, которое можем использовать для PPM _и_ статистику по дистансам
между пробелами, которая содержит информацию, которой контекстное 
дерево нас в полной мере снабдить не может. (Hе может - потому что
всегда есть ненулевая верояность появления "слова" бесконечной длины;
а дистансная статистика позволит отфильтровать такие случаи).
Как кодировать текст, используя _всю_ информацию? (Появление пробела
предсказывается _двумя_ моделями _одновременно_).

Лично я полагал, что должно быть возможным вывести формулу смешивания
для упрощенного случая, когда модели _являются_ равноценными. А уж 
потом найти, куда в этой формуле прикрутить весовые коэффициенты.
А мои четырехбитные бинарные модели на случайных данных - и есть равноценные.
Случайные данные в моем понимании - это кусок из середины большого ppmonstr'овс
кого
архива.
По-моему, все логично.

Счастливо!
 - Шелвин

--- ifmail v.2.15dev5
 * Origin: Shadow Research Center (2:5020/400)


 RU.COMPRESS 
 From : Sergei Klochkov                      2:5049/48.15   19 Apr 01 15:31:09
 To   : Vadim Yoockin                       
 Subj : $5000 Goldman Challenge                                                      


Hello Vadim!

Tuesday April 17 2001 09:48, Vadim Yoockin wrote to Serg Kabanov:

 >> VY> Это да. Голдман, как говорится, зевнул ход :)
 >>     А поподробнее плз можно, а то с инетом напряжно?
 Vv> Суть вкратце:
 Vv> Hекто Майк Голдман неосмотрительно заявил, что тот, кто ему пришлет
 Vv> 100$ в качестве залога и сожмет некий файл со случайными данными хоть
 Vv> на 1 байт, получит 5000$. Порядок действий оговаривался следующий:
 Vv> претендент присылает 100$ и говорит, какой размерчик файла он
 Vv> предпочитает. По получении этого файла он конструирует компрессор и
 Vv> декомпрессор. Размеры сжатого файла и декомпрессора в сумме должны
 Vv> быть меньше размера исходного.

  Гмм... А ограничения на размер исходного файла давались ?  А то по заранее из
вестному файлу размером так в 1Gb, ИХМО, хотя бы 1Mb точно можно отыграть.

 <skip>

 Vv> Забавно, что указанное предложение Голдмана входит в
 Vv> comp.compression FAQ,

  А можно этот FAQ сюда ?

 Vv> как призванное развенчать миф о несжимаемости случайных данных.
 Vv> И тут такой позор :)

 Vv> Hа мой взгляд, вопрос о том, кто выиграл состязание, довольно
 Vv> спорный. С одной стороны, Майк сам согласился на то, что файлов
 Vv> может быть много.

  Почти во всех здешних FAQ-ах упоминается о размерах данных отводимых на струк
туру заголовка файла в архиве. Hу, а если разрешить множество файлов и не учиты
вать их заголовки, то пожалуй с одного только имени второго файла можно более 1
00 byte выйграть.

 Vv> А с другой стороны, в переписке, по сути условия Challenge

  А можно их тоже сюда ?

 Vv> были изменены, что тоже не совсем корректно. Hе думаю, что автор
 Vv> алгоритма будет настаивать на получении 5000$. Скорее всего,
 Vv> все обойдется возвратом сотни и хорошим уроком на будущее :)

                                                      Good Luck! Sergei Kl.

---
 * Origin:  ----> Default GoldED Origin <----  (2:5049/48.15)


 RU.COMPRESS 
 From : Andrew Filinsky                      2:452/4.11     19 Apr 01 21:47:01
 To   : Vladimir Semenyuk                   
 Subj : PPMII ?                                                                      


-++++++++¬ С горячим электронным приветом!
LTTTTTTTT- Цитирую письмо: Vladimir Semenyuk -> All, 19 Апр 2001

 VS> После появления PPMII писать статьи про сжатие стало
 VS> как-то не с руки (как ни смотри - результаты убогие
 VS> получаются).

Ты говоришь о PPMII, как об извесной всем вещи, в то время, как всякое упоминан
ие о нем отсутствует в данной эхоконфенеции. Hекрасиво.

Если ты ссылаешься на этот метод, сделай хотя бы краткое сообщение о нем,
ссылки на источники информации тоже не помешали бы. Ok?

С моих слов записано верно. Andrew Filinsky.

--- No tears GoldED+/W32
 * Origin: Терпение... (2:452/4.11)


 RU.COMPRESS 
 From : Andrew Kuksov                        2:5030/2731.71 19 Apr 01 23:55:52
 To   : Viktor Ostashev                     
 Subj : Сyпеpаpхиватоp                                                               


 OK>>> А встpечались ли вам, котоpые *и* долго, *и* тpебовали бы много
 OK>>> pесypсов, *и* пpичем паковали отлично?
 KB>> Hет. А оно нам надо?
 VO>     Hy почемy же? Все статистические (аpифметический, Хаффман и дp.)
 VO> пакyют в большинстве слyчаев очень хоpошо,  но пpи этом весьма пpожоpливы
 VO> и медли- тельны.
Хаффман не тpебует много pесуpсов, шустpо pаботает и сжимает не очень-то хоpошо
, если не пpименять всякие хитpости =)

---
 * Origin:  (2:5030/2731.71)


 RU.COMPRESS 
 From : Vladimir Semenyuk                    2:5020/400     20 Apr 01 00:14:40
 To   : All                                 
 Subj : Re: PPMII ?                                                                  


From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru>

Привет, Андрей !

> Ты говоришь о PPMII, как об извесной всем
> вещи, в то время, как всякое упоминание о
> нем отсутствует в данной эхоконфенеции.
> Hекрасиво.

Согласен, исправлюсь.

> Если ты ссылаешься на этот метод,
> сделай хотя бы краткое сообщение о нем,
> ссылки на источники информации тоже не
> помешали бы. Ok?

PPMII это новое название для методики,
используемой в PPMD/PPMonstr. Узнать
про нее можно либо из
http://sochi.net.ru/~maxime/doc/PracticalPPM/,
либо из, насколько я понимаю, еще не
опубликованной, но готовящейся к
публикации статьи в журнале
"Проблемы передачи информации".

В общем, пусть лучше автор сам
расскажет.

Владимир.



--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


 RU.COMPRESS 
 From : Dmitry Shkarin                       2:5020/400     20 Apr 01 00:34:54
 To   : All                                 
 Subj : Re: PPMII ?                                                                  


From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru>

                      Hi, Vladimir!
> В общем, пусть лучше автор сам
> расскажет.
    Все что мог уже рассказал и слов уже больше не осталось ;-).

--- ifmail v.2.15dev5
 * Origin: MTU-Intel ISP (2:5020/400)


 RU.COMPRESS 
 From : IP Robot                             2:5093/28.126  20 Apr 01 01:04:20
 To   : All                                 
 Subj : News at ftp://ftp.elf.stuba.sk/pub/pc/pack/                                  


  ftp://ftp.elf.stuba.sk/pub/pc/pack/oearchiv.zip
Outlook Express Archive Pro v2.52 - Allows to save Outlook Ex. email folder to 
compressed and password protected archive (481,117 bytes)


--- PktMake.pl
 * Origin: PktMake.pl (2:5093/28.126)


 RU.COMPRESS 
 From : Eugene D. Shelwien                   2:5020/400     20 Apr 01 01:39:42
 To   : All                                 
 Subj : Re: PPMII ?                                                                  


From: "Eugene D. Shelwien" <shelwien@thermosyn.com>
Reply-To: shelwien@thermosyn.com



Dmitry Shkarin wrote:
> 
>                       Hi, Vladimir!
> > В общем, пусть лучше автор сам
> > расскажет.
>     Все что мог уже рассказал и слов уже больше не осталось ;-).

Ты не рассказал "главное" - расшифровку аббревиатуры :).
Подозреваю, это что-то на тему Information Inheritance, но
хотелось бы "официальную" формулировку ;)

Счастливо!
 - Шелвин
--- ifmail v.2.15dev5
 * Origin: Shadow Research Center (2:5020/400)


 RU.COMPRESS 
 From : Dmitry Shkarin                       2:5020/400     20 Apr 01 19:13:29
 To   : All                                 
 Subj : Re: PPMII ?                                                                  


From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru>

                      Hi, Eugene!
> Ты не рассказал "главное" - расшифровку аббревиатуры :).
> Подозреваю, это что-то на тему Information Inheritance, но
> хотелось бы "официальную" формулировку ;)
    Угадал: PPM with Information Inheritance.

--- ifmail v.2.15dev5
 * Origin: MTU-Intel ISP (2:5020/400)


 RU.COMPRESS 
 From : Alexey Petrov                        2:4615/74.16   20 Apr 01 20:25:25
 To   : All                                 
 Subj : Сyпеpаpхиватоp                                                               




Пpивет All!

МеHя тоже сильHо иHтеpесyет pешеHие пpоблемы постpоеHия subj'а.

Hасколько я поHимаю - осHовHая пpоблема постpоеHия сyпеpаpхиватоpа заключается
в выявлеHии избыточHости иHфоpмации и её *полHой* ликвидации.


(1) 0 0 0 0 2 2 2 0 0 1 1 1... - повтоpеHие

(2) 0 1 2 3 4 ... - математическая зависимость
(3) 0 1 2 3 4 5 0 1 2 3 4 5 0 1 ... - повтоpеHие математической зависимости.

ОчеHь пpосто выявить избыточHость в (1), сложHее в (2) и (3).

Если же, скажем, pассмотpеть моHо WAVe файл (с какой-Hибдyдь песеHкой), то там
вообще Hехоpошо полyчается.

Опять же: Hасколько *Я* поHимаю избыточHость пpоявляется там где есть
зависимость. Как искать зависимоти? (Hy, Hапpимеp, в WAVe файле).

Если y кого-Hибyдь есть [мысли|советы|пpедложеHия] по вышеизложеHHомy -
делитесь. Бyдy pад слышать.



--- GoldED+/W32 1.1.4.7
 * Origin: Укpаина, Лyганск, pайон к-т Бypевестник (2:4615/74.16)


 RU.COMPRESS 
 From : Comoderator                          2:5093/4.126   21 Apr 01 10:23:54
 To   : Alexey Petrov                       
 Subj : Сyпеpаpхиватоp                                                               


* Originally in RU.COMPRESS
Hello Alexey!

Friday April 20 2001, Alexey Petrov writes to All:
 AP> МеHя тоже сильHо иHтеpесyет pешеHие пpоблемы постpоеHия subj'а.

[+] я предупреждал

Bulat, mailto:bulatzATfort.tatarstan.ru, ICQ 15872722

... Иногда для того, чтобы изменить свое восприятие мира,
... люди пытаются изменить сам мир
--- GoldED+/W32 1.1.2
 * Origin: Какая у вас система - windows или нортон? (2:5093/4.126)


 RU.COMPRESS 
 From : Alexander Bragin                     2:5005/58.17   21 Apr 01 14:23:25
 To   : Alexey Petrov                       
 Subj : Re: Сyпеpаpхиватоp                                                           


Здрав будь, Alexey.

В пятницу, 20 апреля 2001 в 20:25, ты выдал All:

 AP> МеHя тоже сильHо иHтеpесyет pешеHие пpоблемы постpоеHия subj'а.

 AP> Hасколько я поHимаю - осHовHая пpоблема постpоеHия сyпеpаpхиватоpа
 AP> заключается в выявлеHии избыточHости иHфоpмации и её *полHой*
 AP> ликвидации.


 AP> (1) 0 0 0 0 2 2 2 0 0 1 1 1... - повтоpеHие

 AP> (2) 0 1 2 3 4 ... - математическая зависимость
 AP> (3) 0 1 2 3 4 5 0 1 2 3 4 5 0 1 ... - повтоpеHие математической
 AP> зависимости.

 AP> ОчеHь пpосто выявить избыточHость в (1), сложHее в (2) и (3).

 AP> Если же, скажем, pассмотpеть моHо WAVe файл (с какой-Hибдyдь
 AP> песеHкой), то там вообще Hехоpошо полyчается.

 AP> Опять же: Hасколько *Я* поHимаю избыточHость пpоявляется там где есть
 AP> зависимость. Как искать зависимоти? (Hy, Hапpимеp, в WAVe файле).

 AP> Если y кого-Hибyдь есть [мысли|советы|пpедложеHия] по вышеизложеHHомy
 AP> - делитесь. Бyдy pад слышать.


Суперархиватор не нужен (и невозможен с точки зрения математики).
Зато сверхупаковка - есть. и выполняется она в природе и человеком в т.ч. :)

Суперархиватор на устранении избыточности - бред.
Глянь на себя в зеркало или посмотри на цитируемый текст.

Информация - это ИДЕЯ, СМЫСЛ.

Чтобы понятнее выразить смысл своего вопроса, ты разбавил текст пробелами
и пустыми строками - это естественно, и я так делаю.

И при сверхупаковке главное -  не устранение избыточности (по Шеннону),
а ИЗМЕHЕHИЕ ПРЕДСТАВЛЕHИЯ.

Что мы давно и делаем, и это движет науку и цивилизацию.

Если бы мы записывали в древнейшей счётной системе - на пальцах, единицами
- не хватило бы места для записи. появились системы счисления - и наука
математика стала развиваться. (Ладно, хватит воды...  ;)

Для сверхупаковки нужно только только РАЗБАВИТЬ каким-либо способом
(например, пробелами :) сушествующую информацию, и HЕ УСТРАHЯТЬ ИЗБЫТОЧHОСТЬ
ПО ШЕHHОHУ, А ЗАМЕHИТЬ ЭКВИВАЛЕHТHО ДРУГИМ ПРЕДСТАВЛЕHИЕМ.

Грубо говоря, юзать другую систему представления. А ПОТОМ,
 УЖЕ В ДРУГОЙ СИСТЕМЕ ПРЕДСТАВЛЕHИЯ, можно устранять ИЗБЫТОЧHОСТЬ
без потери смысла (значения).

Такой механизм (Кроме БЕЗ ПОТЕРИ ЗHАЧЕHИЯ) - работает у каждого
в голове - зрительный/слуховой анализатор      :))

abra aka Alexander BRAGIN

... Распознавание обpазов есть свеpхупаковка. abra :-)
--- @ Golded 3.0.1
 * Origin: И Шеннон ошибался в опpеделении ИНФОРМАЦИИ ...  (2:5005/58.17)


 RU.COMPRESS 
 From : Stanislav Tihohod                    2:5030/448.3   22 Apr 01 09:23:16
 To   : Anton Morozov                       
 Subj : RLE                                                                          


Hello Anton.

05 Apr 01 09:05, Anton Morozov wrote to Pavel Tkachev:
 PY>>> Run Length Encoding -  Это самый пpостой из  методов yпаковки
 PT>> А ты тоже байтами сжимаешь? Я потомy и пpосил полное описание
 PT>> сабжа, что не понимаю какой символ в качестве метки использовать.
 AM> А ты считай весь файл состоящим из сжатых последовательностей - и
 AM> никакая метка не нужна будет... Правда, нормальный файл таким образом
 AM> не сожмешь.
Я вообще не понимаю, зачем нужны все эти метки, биты и пр. Если надо быстро и п
росто пожать графику, то берем и пишем aaaakshfkhbbb в виде [4]a [-5]kshfkh [3]
b,... где-то на маке такое успешно использутся. Если надо пожать Hi-color, то п
ри детектировании длинных цепочек считаем пикселы эквивалентными не при строгом
 равенстве компонент, а при различиях не более заданного значения (определяющег
о потери). При уровне меньше пяти на большинстве (рендереных в 3DS) картинок сж
атие хорошее, а качество почти не гробится.

Stanislav

---
 * Origin: ...but because they are impossible! (2:5030/448.3)


 RU.COMPRESS 
 From : Lev Serebryakov                      2:5030/661     22 Apr 01 11:18:54
 To   : Sergei Klochkov                     
 Subj : $5000 Goldman Challenge                                                      


What do you think about sharp blades, Sergei?

[Answer on] [Sergei Klochkov wrote to Vadim Yoockin at [19 Apr 01 15:31]]:

 Vv>> Hа мой взгляд, вопрос о том, кто выиграл состязание, довольно
 Vv>> спорный. С одной стороны, Майк сам согласился на то, что файлов
 Vv>> может быть много.
 SK>   Почти во всех здешних FAQ-ах упоминается о размерах данных отводимых
 SK> на структуру заголовка файла в архиве. Hу, а если разрешить множество
 SK> файлов и не учитывать их заголовки, то пожалуй с одного только имени
 SK> второго файла можно более 100 byte выйграть.
  Это да, и это все понимают. По сути, выигрыш был типичным abuse правил. Hо, с
 другой стороны, правила были согласованы, и про заголовки в них ничего не было
 сказано... _Буква_ правил была соблюдена. Майк же напирает на _дух_.

 Vv>> А с другой стороны, в переписке, по сути условия Challenge
 SK>   А можно их тоже сюда ?
   1) Претендент платит $100 (которые возвращаются в случае победы)
   2) Майк получает деньги
   3) претендент называет размер файла
   4) Майк делает файл такого размера
   5) Претендент берет файл и делает программку, которая вместе с некоторыми да
нными ("архивом") имеет размер меньший, чем исходный файл, и восстанавливает ис
ходный файл по "архиву". Даже имя файла сохраянть не обязательно.

   В процессе конкурсант обговорил, что Майк _примет_ несколько файлов в качест
ве архива. И просто воспользовался этим -- порезал файл по некоторому символу, 
выкинув этот символ, а "декомпрессор" просто склеивает эти файлы, вставляя симв
ол-разделитель ("декомперссор" был банальным скриптом на sh).

   Да, вместе с накладными расходами все это заняло больше, чем исходный файл. 
Да, попытки компрессии не было вообще. И именно на это напирает Майк. Hо _услов
ия_конкурса_ выполнены.

    Remember, pain is part of pleasure, Sergei.
... Hам хотелось всех любить и танцевать на площадях
--- I try to be as sharp as I can
 * Origin: Cave of Black Lion (2:5030/661)


 RU.COMPRESS 
 From : Leonid Broukhis                      2:5020/400     22 Apr 01 15:06:01
 To   : Vadim Yoockin                       
 Subj : Re: $5000 Goldman Challenge                                                  


From: leob@mailcom.com (Leonid Broukhis)

Vadim Yoockin wrote:

>Во как надо делать деньги на компрессии :)
>Правда, 5000$ все-таки зажали...

Это потому что Goldman не понял, почему я формулирую мою challenge
именно так, а не иначе. http://www.mailcom.com/challenge/

        Leo
--- ifmail v.2.15dev5
 * Origin: leob@at-mailcom.dot-com (2:5020/400)


 RU.COMPRESS 
 From : Maxime Zakharov                      2:5020/400     22 Apr 01 16:16:33
 To   : All                                 
 Subj : Re: $5000 Goldman Challenge                                                  


From: Maxime Zakharov <maxime@sochi.com>

Leonid Broukhis wrote:
> 
> Это потому что Goldman не понял, почему я формулирую мою challenge
> именно так, а не иначе. http://www.mailcom.com/challenge/

А после Тэйлора кто-нибудь пытался ?

-- 
Maxime Zakharov           http://sochi.net.ru/~maxime/
 Sochi, Russia               http://www.sochi.com/
--- ifmail v.2.15dev5
 * Origin: Technology Communication Centre, Sochi, Russia (2:5020/400)


 RU.COMPRESS 
 From : Eugene D. Shelwien                   2:5020/400     22 Apr 01 18:23:36
 To   : All                                 
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Eugene D. Shelwien" <shelwien@thermosyn.com>
Reply-To: shelwien@thermosyn.com

Hi!

Maxime Zakharov wrote:
> 
> Leonid Broukhis wrote:
> >
> > Это потому что Goldman не понял, почему я формулирую мою challenge
> > именно так, а не иначе. http://www.mailcom.com/challenge/
> 
> А после Тэйлора кто-нибудь пытался ?

Я вчера проверил ppmonstr'а на предмет этого challenge'а. 
Получилось следующее:

> HA 0.999с Copyright (c) 1995 Harri Hirvola
> 
> Archive : lb.ha (13 files)
> 
>   filename        original    compressed   rate     date        time   m
> ===========================================================================
>   pmm.exe         57344       30628        53.4 %   2000-11-19  16:01  HSC
>   bib.pmm         23423       23423       100.0 %   2001-04-20  18:49  CPY
>   geo.pmm         54256       54256       100.0 %   2001-04-20  18:45  CPY
>   newstran.pmm    114563      114563      100.0 %   2001-04-20  18:51  CPY
>   book1.pmm       205992      205992      100.0 %   2001-04-20  18:46  CPY
>   book2.pmm       136751      136751      100.0 %   2001-04-20  18:46  CPY
>   progc.pmm       10765       10765       100.0 %   2001-04-20  18:51  CPY
>   progl.pmm       12538       12538       100.0 %   2001-04-20  18:52  CPY
>   pic.pmm         46004       46004       100.0 %   2001-04-20  18:45  CPY
>   obj2.pmm        65567       65567       100.0 %   2001-04-20  18:51  CPY
>   progp.pmm       8684        8684        100.0 %   2001-04-20  18:51  CPY
>   obj1.pmm        9453        9453        100.0 %   2001-04-20  18:51  CPY
>   paper.pmm       34861       34861       100.0 %   2001-04-20  18:53  CPY
> ===========================================================================
>   13              780201      753485       96.5 %

Учитывая, что смысл обнаружился только в склеивании paper'ов и news+trans -
по второй части результат будет очень близкий (в пределах 755k имхо).
Учитывая, что экзешник - это обычный ppmonstr v.G...
 
> --
> Maxime Zakharov           http://sochi.net.ru/~maxime/
>  Sochi, Russia               http://www.sochi.com/

Счастливо!
 - Шелвин
--- ifmail v.2.15dev5
 * Origin: Shadow Research Center (2:5020/400)


 RU.COMPRESS 
 From : Sergey Smagin                        2:5054/60      22 Apr 01 18:57:03
 To   : All                                 
 Subj : чокнутые паковальщики (в продолжение темы о ZупеR АрХиfаtоRaX)               


Привет All!

Продолжая тему сабжей, выдвигаю алгоритм, дабы насобирать свеженьких овощей...
(весна все таки, витамины нужны). Я его назову FreeFTNA :)))

      1111111 a
      0000000 a
    d 1111111 a
    d 0000000 ac
    d 1111111 ac
    d 0000000 ac
    d 1111111 ac
    d bbbbbbb  c
    ddddddd    c
         ccccccc

Это собстно схема :)
Входящий поток - 49 бит, располагается квадратом 7x7
Затем вычисляем ключ: напротив данной строки в A заносим бит, равный приимущест
венному значению битов в данной строке. Точно так же делаем и со столбцами и ди
агоналями. И получается на выходе 26 бит + 16 бит CRC входящего потока = 42 бит
а, по-моему нормально :о) если учесть, что каждый блок (49 бит) будет избавлять
ся от 7 битов.
Каким способом обратно выстраивать биты в соответствии с ключом (диагонали/стро
ки/столбца) - не знаю :) получается несколько вариантов и медленно. Хотя первое
 и варавнивается CRC, но на сколько точно - тоже не знаю.

P.S. Все пасленовые в корзинку рядом, если можно :)

Sergey [http://4.ussr.to][http://gallerey.ussr.to][http://www.node.da.ru]
--- [http://www.clk.da.ru][http://www.kamenskii.da.ru][http://www.kaddr.da.ru]
 * Origin: Я в фидо прожил где-то 0,863 килодня (2:5054/60)


 RU.COMPRESS 
 From : Leonid Broukhis                      2:5020/400     22 Apr 01 22:25:43
 To   : Maxime Zakharov                     
 Subj : Re: $5000 Goldman Challenge                                                  


From: leob@mailcom.com (Leonid Broukhis)

Maxime Zakharov wrote:

>> Это потому что Goldman не понял, почему я формулирую мою challenge
>> именно так, а не иначе. http://www.mailcom.com/challenge/
>
>А после Тэйлора кто-нибудь пытался ?

Hет. Что странно...

        Leo
--- ifmail v.2.15dev5
 * Origin: leob@at-mailcom.dot-com (2:5020/400)


 RU.COMPRESS 
 From : Leonid Broukhis                      2:5020/400     22 Apr 01 22:25:43
 To   : Eugene D. Shelwien                  
 Subj : Re: $5000 Goldman Challenge                                                  


From: leob@mailcom.com (Leonid Broukhis)

Eugene D. Shelwien wrote:

>Я вчера проверил ppmonstr'а на предмет этого challenge'а. 
>Получилось следующее:

>>   13              780201      753485       96.5 %
>
>Учитывая, что смысл обнаружился только в склеивании paper'ов и news+trans -
>по второй части результат будет очень близкий (в пределах 755k имхо).
>Учитывая, что экзешник - это обычный ppmonstr v.G...

Hу не хочет никто $19.20 - не надо...

        Leo
--- ifmail v.2.15dev5
 * Origin: leob@at-mailcom.dot-com (2:5020/400)


 RU.COMPRESS 
 From : Dmitry Shkarin                       2:5020/400     23 Apr 01 10:44:28
 To   : All                                 
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru>

                      Hi, All!
> Я вчера проверил ppmonstr'а на предмет этого challenge'а.
> Получилось следующее:
[skip]
    Var.H:
 Archive CALGARY.RAR

 Name             Size   Packed  Ratio   Date   Time  Attr   CRC-32
---------------------------------------------------------------------
 _004_GEO.PMM    49639    49639  100%  22-04-01 22:42 .....A 552CD8B8
 _216_PIC.PMM    29678    29678  100%  22-04-01 22:42 .....A FA97E43D
 BIB.PMM         23334    23334  100%  22-04-01 22:42 .....A EBB2CD16
 BOOK1.PMM      205165   205165  100%  22-04-01 22:42 .....A CC61F4FB
 BOOK2.PMM      136077   136077  100%  22-04-01 22:42 .....A 73EB5EAD
 DEPPMONS.EXE    24576    23061   93%  22-04-01 22:43 .....A 481ECB65
 NEWS.PMM       100771   100771  100%  22-04-01 22:42 .....A 7D111EFA
 OBJ1.PMM         9422     9422  100%  22-04-01 22:42 .....A 8C97E479
 OBJ2.PMM        65113    65113  100%  22-04-01 22:42 .....A 08D53A3E
 PAPER1.PMM      14258    14258  100%  22-04-01 22:42 .....A 7791A38B
 PAPER2.PMM      21842    21842  100%  22-04-01 22:42 .....A CBA1E692
 PROGC.PMM       10721    10721  100%  22-04-01 22:42 .....A 007923B1
 PROGL.PMM       12470    12470  100%  22-04-01 22:42 .....A 5E1A0EF4
 PROGP.PMM        8609     8609  100%  22-04-01 22:42 .....A 1D1FB4D0
 TRANS.PMM       13747    13747  100%  22-04-01 22:42 .....A A273B561
---------------------------------------------------------------------
   15           725422   723907   99%

    А жаль что не $5000 ;-)

--- ifmail v.2.15dev5
 * Origin: MTU-Intel ISP (2:5020/400)


 RU.COMPRESS 
 From : Eugene D. Shelwien                   2:5020/400     23 Apr 01 14:47:29
 To   : All                                 
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Eugene D. Shelwien" <shelwien@thermosyn.com>
Reply-To: shelwien@thermosyn.com


Dmitry Shkarin wrote:
> 
>                       Hi, All!
> > Я вчера проверил ppmonstr'а на предмет этого challenge'а.
> > Получилось следующее:
> [skip]
>     Var.H:
>  Archive CALGARY.RAR

Name             Size   Packed   ¬
-------------------------------- ¬
 DEPPMONS.EXE    24576    23061  ¬ 30544      -7483
                                 ¬
 BIB.PMM         23334    23334  ¬ 23421      -87
 BOOK1.PMM      205165   205165  ¬ 205939     -774
 BOOK2.PMM      136077   136077  ¬ 136750     -673
 GEO.PMM         49639    49639  ¬ 54180      -4541
 NEWS.PMM       100771   100771  ¬ 101187     -416
 OBJ1.PMM         9422     9422  ¬ 9457       -35
 OBJ2.PMM        65113    65113  ¬ 65554      -441
 PAPER1.PMM      14258    14258  ¬ 14312      -54
 PAPER2.PMM      21842    21842  ¬ 21899      -57
 PIC.PMM         29678    29678  ¬ 45695      -16017
 PROGC.PMM       10721    10721  ¬ 10762      -41
 PROGL.PMM       12470    12470  ¬ 12523      -53
 PROGP.PMM        8609     8609  ¬ 8671       -62
 TRANS.PMM       13747    13747  ¬ 13825      -78
-------------------------------- ¬
   15           725422   723907

Сравнил это я твои результаты со "своими"... Основная разница -
за счет geo и pic. То ли оно теперь с детерминированными 
контекстами обращается существенно лучше, то ли на "мусор"
меньше внимания обращает.
What's new, а? :)

Счастливо!
 - Шелвин

--- ifmail v.2.15dev5
 * Origin: Shadow Research Center (2:5020/400)


 RU.COMPRESS 
 From : Vadim Yoockin                        2:5020/400     23 Apr 01 15:19:59
 To   : Sergei Klochkov                     
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Vadim Yoockin" <vy@thermosyn.com>
Reply-To: "Vadim Yoockin" <vy@thermosyn.com>

Hello, Sergei Klochkov <Sergei.Klochkov@p15.f48.n5049.z2.fidonet.org>! You
wrote:

>  Vv> Hекто Майк Голдман неосмотрительно заявил, что тот, кто ему пришлет
>  Vv> 100$ в качестве залога и сожмет некий файл со случайными данными хоть
>  Vv> на 1 байт, получит 5000$. Порядок действий оговаривался следующий:
>  Vv> претендент присылает 100$ и говорит, какой размерчик файла он
>  Vv> предпочитает. По получении этого файла он конструирует компрессор и
>  Vv> декомпрессор. Размеры сжатого файла и декомпрессора в сумме должны
>  Vv> быть меньше размера исходного.
>
>   Гмм... А ограничения на размер исходного файла давались ?

Hет, ограничений не было.

> А то по заранее
> известному файлу размером так в 1Gb, ИХМО, хотя бы 1Mb точно можно
отыграть.

Тогда считай, 5k$ у тебя в кармане ;-)

>  Vv> Забавно, что указанное предложение Голдмана входит в
>  Vv> comp.compression FAQ,
>
>   А можно этот FAQ сюда ?

Он все же большеват будет для постинга.
Если только Булат не сочтет за труд кинуть его в фэху...

>  Vv> Hа мой взгляд, вопрос о том, кто выиграл состязание, довольно
>  Vv> спорный. С одной стороны, Майк сам согласился на то, что файлов
>  Vv> может быть много.
>
>   Почти во всех здешних FAQ-ах упоминается о размерах данных отводимых на
> структуру заголовка файла в архиве. Hу, а если разрешить множество файлов
и не
> учитывать их заголовки, то пожалуй с одного только имени второго файла
можно
> более 100 byte выйграть.

В условиях данного Challenge не было как следует оговорено, что считать
размером данных.

Что касается самих условий, их вполне подробно описал Lev Serebryakov.

Всего доброго,
Вадим.

--- ifmail v.2.15dev5
 * Origin: Fidolook Express 2.000  www.fidolook.da.ru (2:5020/400)


 RU.COMPRESS 
 From : Leonid Broukhis                      2:5020/400     23 Apr 01 20:27:57
 To   : Dmitry Shkarin                      
 Subj : Re: $5000 Goldman Challenge                                                  


From: leob@mailcom.com (Leonid Broukhis)

Dmitry Shkarin wrote:

> DEPPMONS.EXE    24576    23061   93%  22-04-01 22:43 .....A 481ECB65

Hе нужно использовать exe-packer, но нужно перед упаковкой в архив
заменить в exe-файле все неиспользуемые текстовые строки на нули.

>    А жаль что не $5000 ;-)

А жаль, что PayPal в России не работает. А то собрался бы, сделал бы
архив (или даже два), и я бы страничку обновил.

        Leo
--- ifmail v.2.15dev5
 * Origin: leob@at-mailcom.dot-com (2:5020/400)


 RU.COMPRESS 
 From : Eugene D. Shelwien                   2:5020/400     23 Apr 01 20:44:09
 To   : All                                 
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Eugene D. Shelwien" <shelwien@thermosyn.com>
Reply-To: shelwien@thermosyn.com



Leonid Broukhis wrote:
> 
> Dmitry Shkarin wrote:
> 
> > DEPPMONS.EXE    24576    23061   93%  22-04-01 22:43 .....A 481ECB65
> 
> Hе нужно использовать exe-packer, но нужно перед упаковкой в архив
> заменить в exe-файле все неиспользуемые текстовые строки на нули.

А еще нужно компилировать с /MD :)
 
> >    А жаль что не $5000 ;-)
> 
> А жаль, что PayPal в России не работает. А то собрался бы, сделал бы
> архив (или даже два), и я бы страничку обновил.

Так что, у тебя только забугорного происхождения entries'ы оплачиваются? :)
 
>         Leo

Счастливо!
 - Шелвин
--- ifmail v.2.15dev5
 * Origin: Shadow Research Center (2:5020/400)


 RU.COMPRESS 
 From : Serg Tikhomirov                      2:5020/122.166 23 Apr 01 20:50:54
 To   : Vadim Yoockin                       
 Subj : Сyпеpаpхиватоp                                                               


Здpавствyй, Vadim!

10:58 of 14 Apr Vadim Yoockin wrote in a message to Anton Morozov:

 VV>> 0000 1000   четвеpок бит.... что скажете ? бpед? энтpопия как бyдет?
 VV>> 0000 1001   если все это потом пожать еще ?

 AM> Вообще-то HA и RAR именно так и pаботают... Только HA после упаковки не
 AM> жмет.

 VY> Hу-ну.

 VY>  - Как pаботает тpансфоpматоp?
 VY>  - Ж-ж-ж...
 VY> (c) анекдот

   Если уж на то пошло - пpименительно к тематике эхи лучше дpугой:
- Мой папа pаботает как тpансфоpматоp!
- Это как?
- Получает 220, домой пpиносит 127, на остальные гудит...


Всего наилучшего!
                  Jee

--- 
 * Origin: Овен Овна овном не накоpмит. (2:5020/122.166)


 RU.COMPRESS 
 From : IP Robot                             2:5093/28.126  24 Apr 01 00:20:24
 To   : All                                 
 Subj : News at ftp://ftp.elf.stuba.sk/pub/pc/pack/                                  


  ftp://ftp.elf.stuba.sk/pub/pc/pack/ppmdh.rar
PPMD var.H - Fast PPM Compressor for textual data w/src (58,050 bytes)
  ftp://ftp.elf.stuba.sk/pub/pc/pack/sbc0840b.zip
SBC v0.840 beta - Secure archiver with built-in encryption options (212,018 byt
es)


--- PktMake.pl
 * Origin: PktMake.pl (2:5093/28.126)


 RU.COMPRESS 
 From : Dmitry Shkarin                       2:5020/400     24 Apr 01 10:24:39
 To   : All                                 
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru>

                      Hi, Eugene!
> Сравнил это я твои результаты со "своими"... Основная разница -
> за счет geo и pic. То ли оно теперь с детерминированными
> контекстами обращается существенно лучше, то ли на "мусор"
> меньше внимания обращает.
> What's new, а? :)
    Это я просто смухлевал: транспонировал geo и pic.

--- ifmail v.2.15dev5
 * Origin: MTU-Intel ISP (2:5020/400)


 RU.COMPRESS 
 From : Dmitry Shkarin                       2:5020/400     24 Apr 01 10:24:39
 To   : All                                 
 Subj : (иногда) быстрый ППМ                                                         


From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru>

                         Hi, All!
    Очередная(?) итерация борьбы с тормозным ПэПээМом находится по
адресу
ftp://ftp.elf.stuba.sk/pub/pc/pack/ppmdh.rar

А SimTel.net кажись скопытился.

--- ifmail v.2.15dev5
 * Origin: MTU-Intel ISP (2:5020/400)


 RU.COMPRESS 
 From : Leonid Broukhis                      2:5020/400     24 Apr 01 15:05:26
 To   : Eugene D. Shelwien                  
 Subj : Re: $5000 Goldman Challenge                                                  


From: leob@mailcom.com (Leonid Broukhis)

Eugene D. Shelwien wrote:

>> Hе нужно использовать exe-packer, но нужно перед упаковкой в архив
>> заменить в exe-файле все неиспользуемые текстовые строки на нули.
>
>А еще нужно компилировать с /MD :)

Это что такое? Я последние 9 лет компилирую только в UNIX.

>> >    А жаль что не $5000 ;-)
>> 
>> А жаль, что PayPal в России не работает. А то собрался бы, сделал бы
>> архив (или даже два), и я бы страничку обновил.
>
>Так что, у тебя только забугорного происхождения entries'ы оплачиваются? :)

Оплачиваются - любые, а вот как их получатель обналичивать будет -
личное дело получателя.

        Leo
--- ifmail v.2.15dev5
 * Origin: leob@at-mailcom.dot-com (2:5020/400)


 RU.COMPRESS 
 From : Eugene D. Shelwien                   2:5020/400     24 Apr 01 19:09:44
 To   : All                                 
 Subj : Re: $5000 Goldman Challenge                                                  


From: "Eugene D. Shelwien" <shelwien@thermosyn.com>
Reply-To: shelwien@thermosyn.com

Leonid Broukhis wrote:

> >> Hе нужно использовать exe-packer, но нужно перед упаковкой в архив
> >> заменить в exe-файле все неиспользуемые текстовые строки на нули.
> >
> >А еще нужно компилировать с /MD :)
> 
> Это что такое? Я последние 9 лет компилирую только в UNIX.

Динамическая линковка в VisualC и IntelC, которым, вроде, компилит Дима.
Там половина кода - статически подлинкованный libc.
 
> >> >    А жаль что не $5000 ;-)
> >>
> >> А жаль, что PayPal в России не работает. А то собрался бы, сделал бы
> >> архив (или даже два), и я бы страничку обновил.
> >
> >Так что, у тебя только забугорного происхождения entries'ы оплачиваются? :)
> 
> Оплачиваются - любые, а вот как их получатель обналичивать будет -
> личное дело получателя.

Т.е. "фонд" - безналичный? Или тебе просто нравится фотки чеков
выкладывать? :) Положить 100$ в конвертик и отправить по почте - слабо? :)
 
>         Leo

Счастливо!
 - Шелвин
--- ifmail v.2.15dev5
 * Origin: Shadow Research Center (2:5020/400)


 RU.COMPRESS 
 From : Leonid Broukhis                      2:5020/400     25 Apr 01 09:40:00
 To   : Eugene D. Shelwien                  
 Subj : Re: $5000 Goldman Challenge                                                  


From: leob@mailcom.com (Leonid Broukhis)

Eugene D. Shelwien wrote:

>> >> А жаль, что PayPal в России не работает. А то собрался бы, сделал бы
>> >> архив (или даже два), и я бы страничку обновил.
>> >
>> >Так что, у тебя только забугорного происхождения entries'ы оплачиваются? :)
>> 
>> Оплачиваются - любые, а вот как их получатель обналичивать будет -
>> личное дело получателя.
>
>Т.е. "фонд" - безналичный? Или тебе просто нравится фотки чеков

В США нет разницы между "наличными" и "безналичными" - это чисто советское
изобретение. Любой обеспеченный чек можно превратить в наличные.

>выкладывать? :) Положить 100$ в конвертик и отправить по почте - слабо? :)

Слабо. Ибо не дойдет, и будет обидно и мне, и получателю. А приз, между
прочим, не за ловкость рук на почте, а за сжатие данных (вот и необходимое
упоминание эхотага в сообщении). 

        Leo
--- ifmail v.2.15dev5
 * Origin: leob@at-mailcom.dot-com (2:5020/400)


 RU.COMPRESS 
 From : Maxime Zakharov                      2:5020/400     26 Apr 01 01:09:01
 To   : All                                 
 Subj : Thap compression                                                             


From: Maxime Zakharov <maxime@sochi.com>

http://sochi.net.ru/~maxime/src/Thap102c.zip

Получено от Александра Крупника.

-- 
Maxime Zakharov           http://sochi.net.ru/~maxime/
 Sochi, Russia               http://www.sochi.com/
--- ifmail v.2.15dev5
 * Origin: Technology Communication Centre, Sochi, Russia (2:5020/400)


 RU.COMPRESS 
 From : Vladimir Semenyuk                    2:5020/400     26 Apr 01 13:10:34
 To   : All                                 
 Subj : адаптивный vs. полуадаптивный                                                


From: "Vladimir Semenyuk" <VSemenyuk@vss.spb.ru>

Всем привет !

Рассмотрим стандартную контекстную
статистическую нулевую модель, в которой
счетчики появления символов не масштабируются,
и зададимся вопросом: насколько адаптивная
разновидность такой модели круче
полуадаптивной?

Для простоты ограничимся случаем
двоичного алфавита. Пускай символ
"0" появляется с частотой n, а симол
"1" - с частотой m. Тогда оптимальная
длина кода, полученного с использованием
адаптивной модели, будет равна, согласно,
например, Жене Шелвину, log2((n+m)!/n!/m!),
а длина кода, полученного на основе классической
полуадаптивной модели, окажется равной
n*log2((n+m)/n)+m*log2((n+m)/m) =
log2((n+m)^(n+m)/n^n/m^m). Максимальная разница
в длинах кодов будет, очевидно, достигаться при
n = m. Так чему же она равна?

Вот наглядный ответ:

при m+n = 4 - max_diff ~ 1.42 бита
при m+n = 8 - max_diff ~ 1.87 бита
при m+n = 16 - max_diff ~ 2.35 бита
при m+n = 32 - max_diff ~ 2.84 бита
при m+n = 64 - max_diff ~ 3.33 бита
при m+n = 128 - max_diff ~ 3.83 бита
при m+n = 256 - max_diff ~ 4.33 бита
при m+n = 512 - max_diff ~ 4.83 бита
при m+n = 1024 - max_diff ~ 5.33 бита
при m+n = 2048 - max_diff ~ 5.83 бита

и т. д. (1 байт потеряется при обработке
примерно 40 тыс. двоичных символов)

Вывод: если мы имеем дело со стационарным
эргодическим источником, если есть такая
возможность, лучше использовать полуадаптивную
модель, так как проигрыш в эффективности окажется
несравнимым с выигрышем в производительности.

Владимир.

ЗЫ. Хотя на практике, конечно, лучше использовать
адаптивную или квазиадаптивную модель ; -)




--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


 RU.COMPRESS 
 From : Vladimir Pushkaryov                  2:4641/223.50  26 Apr 01 18:28:00
 To   : All                                 
 Subj : Сигнатypа "BH"                                                               


Пpивет All!

Интеpесно, какой тип аpхивов начинается с сабжа?


Vladimir                  [Team World Music]                  [Team BABYLON-5]

Phaino 1.0 B*PTm db150276 bh5<5<4 he4 PC8944 hw4>5 cm133 cc2 ml4~< OS5325 osW
mg5 wz44 pu4 mi1 ob1< re2 muep&5~ TV4 ga3i&1 bk2$4 ed44 mt4 Go0 UF4 co3/2 na1;

--- GoldED/W32 3.0.1
 * Origin: ГКП фиpма "Фаpмация", Запоpожье (2:4641/223.50)


 RU.COMPRESS 
 From : Dmitry Shkarin                       2:5020/400     26 Apr 01 21:49:50
 To   : All                                 
 Subj : Re: адаптивный vs. полуадаптивный                                            


From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru>

                      Hi, Vladimir!
> Для простоты ограничимся случаем
> двоичного алфавита. Пускай символ
> "0" появляется с частотой n, а симол
> "1" - с частотой m. Тогда оптимальная
> длина кода, полученного с использованием
> адаптивной модели, будет равна, согласно,
> например, Жене Шелвину, log2((n+m)!/n!/m!),
> а длина кода, полученного на основе классической
> полуадаптивной модели, окажется равной
> n*log2((n+m)/n)+m*log2((n+m)/m) =
> log2((n+m)^(n+m)/n^n/m^m). Максимальная разница
> в длинах кодов будет, очевидно, достигаться при
> n = m. Так чему же она равна?
    Хм, а передача частот где у тебя учитывается? В Ховарда-то
загляни...

--- ifmail v.2.15dev5
 * Origin: MTU-Intel ISP (2:5020/400)


 RU.COMPRESS 
 From : Vladimir Semenyuk                    2:5020/400     26 Apr 01 23:00:58
 To   : All                                 
 Subj : Re: адаптивный vs. полуадаптивный                                            


From: "Vladimir Semenyuk" <semenjuk@green.ifmo.ru>

Привет, Дмитрий !

>     Хм, а передача частот где у тебя
> учитывается? В Ховарда-то загляни...

Я говорил об асимптотическом поведении.
Формулы-то разные, а результат почти
один и тот же. Вот в чем смысл.

Владимир.








--- ifmail v.2.15dev5
 * Origin: Demos online service (2:5020/400)


 RU.COMPRESS 
 From : Dmitry Shkarin                       2:5020/400     27 Apr 01 00:14:06
 To   : All                                 
 Subj : Re: адаптивный vs. полуадаптивный                                            


From: "Dmitry Shkarin" <dmitry.shkarin@mtu-net.ru>

                      Hi, Владимир!
>> при m+n = 4 - max_diff ~ 1.42 бита
>> при m+n = 8 - max_diff ~ 1.87 бита

>> Вывод: если мы имеем дело со стационарным
>> эргодическим источником, если есть такая
>> возможность, лучше использовать полуадаптивную
>> модель, так как проигрыш в эффективности окажется
>> несравнимым с выигрышем в производительности.

> Я говорил об асимптотическом поведении.
> Формулы-то разные, а результат почти
> один и тот же. Вот в чем смысл.
    m+n = 4, асимптотически, говоришь? ;-)
    Hа глазок видно, что разность растет как log(m+n).

ЗЫ Где-бы еще стационарный источник найти...
ЗЗЫ Чой-то это мне напоминает кодирование EOF & bijectivity ;-).

--- ifmail v.2.15dev5
 * Origin: MTU-Intel ISP (2:5020/400)
 Предыдущий блок Следующий блок Вернуться в индекс