Re: архиватор размером 64Mb


Сайт о сжатии >> Форум #Компрессор# >> [Ответить] [Ответы]

Автор: Maxim Smirnov, <msmirn@newmail.ru>
SPb, Russia, 02 июля 2002 года в 11:25:09

В ответ на : Re: архиватор размером 64Mb от Олег Набатов в 01 июля 2002 года в 19:15:18:


> > зрения самого Андрея Николаевича?
> > http://sochi.net.ru/~maxime/doc/
> > 3w_h.ps.gz

> Статья к сожалению слишком короткая, у меня вопросов больше чем там текста.

есть, к примеру, еще классическая
статья, в "Проблемах..." года эдак 1965-
1970,
"К логическим основам теории информации
и теории вероятностей"
И книжка:
Колмогоров А.Н. Теория информации и теория алгоритмов.
Где-то в 80-х выходила.

> Во вторых. Марковская модель содержит переходы от одного контекста к другому, почему переход должен быть только один?

Скажу, что марковская модель
(обобщенная, не p(xi)=p(xi|xi-1) )
таких ограничений не имеет.

> высокого порядка, это очевидно и глупо. Где в модели контекст "глагол" или контекст "фамилия". Нету.

Те лингвистические модели, которые
я наблюдаю, реально уступают PPM.
Мои эксперименты с морфологическим
и синтаксическим разбором в рамках
статистической модели типа PPM
пока не дают сколько-нибудь
впечатляющих результатов. Т.е.
выигрыш есть, но незначительный.
Затраты явно не оправдываются.

> Вот такие вещи должны превратить "штук 1500-2000" в 64Mb.

Мы говорим о реальных программах
или фантазиях?

> Еще мне видится у семейства ppm такая фича: они одинаково хорошо жмут и текст и его же если буквы переставить в обратном порядке. И это архиватор для текстов. Его еще учить и учить.

На самом деле, разбирать текст
лучше справа налево...

Ответы:



Ответить на это сообщение

Тема:

Имя (желательно полное):

E-Mail:

URL:

Город:

Страна:

Вежливый и подробный комментарий:
(Форматируйте его, пожалуйста, как почту - короткими строками
Еnter в конце строки, пустая строка между параграфами).

Пожалуйста, заполните все поля.
И не нажимайте по два раза на кнопку! Дождитесь ответа сервера.