Re: Поддерживаю предыдущего оратора


Сайт о сжатии >> Форум #Компрессор# >> [Ответить] [Ответы]

Автор: FAL,
09 июля 2004 года в 18:15:53

В ответ на : Поддерживаю предыдущего оратора от Vadim в 09 июля 2004 года в 16:20:12:


> На всякий случай уточню, что с этим тоже надо быть аккуратным. Если установлен , такие сокращения чреваты :)

Нет, не совсем выкинуть, конечно теги будут при распаковке восстановлены точно такими же, а вот форматированием самого текста HTML можно пренебречь и потом производить автоматическое форматирование - отступы там всякие и переносы строк.
Можно вообще сделать однозначное (неискажающее) кодирование.

> Ну и всякие таблицы можно хорошо поджать. Можно настроиться на шаблоны, используемые генераторами. Сделать фиксированные словарики и т.п.

Для XML я делал словарь имен тегов и атрибутов, а для HTML вообще большинство тегов можно запихнуть в словарь, так как они извстны заранее и кодировать индекс.

> Возможно, LZMA был выбран по причине требований к скорости и памяти. С этой точки зрения, ИМХО, выбор оправдан. Ну разве только еще можно было BWT применить, который по ресурсам при декодировании как раз посередке между LZ и PPM :-)

Ну чего не знаем, того не знаем :)

Ответы:



Ответить на это сообщение

Тема:

Имя (желательно полное):

E-Mail:

URL:

Город:

Страна:

Вежливый и подробный комментарий:
(Форматируйте его, пожалуйста, как почту - короткими строками
Еnter в конце строки, пустая строка между параграфами).

Пожалуйста, заполните все поля.
И не нажимайте по два раза на кнопку! Дождитесь ответа сервера.