Применение методов сжатия данных в СУБД >>


Этот текст в PDF (403 кбайт)

Санкт-Петербургский государственный университет
аэрокосмического приборостроения

 

М.А. Смирнов

Обзор применения методов

безущербного сжатия данных в СУБД

Рукопись

Версия от 23.05.2004

 

 

Санкт-Петербург

2003-2004


Любое коммерческое использование данного текста без предварительного согласования с автором запрещается.
По всем вопросам пишите на Максиму Смирнову


Содержание

Содержание | Часть 1 | Часть 2 | Часть 3 | Часть 4

(Часть 1)

Актуальность темы

1. Исследования по применению методов сжатия в СУБД

Общие обозначения

Базовые принципы устройства РСУБД. Терминология

Логическая организация

Физическая организация

Средства обеспечения доступа к данным

Типы РБД

Стандартные тесты для сравнения СУБД

Основные методы сжатия данных. Терминология

Статистическое кодирование

Словарное сжатие

Другие методы сжатия

Преобразования, используемые в схемах сжатия данных

Классификация методов по стратегиям обновления модели (словаря)

Содержание и основные тенденции в исследованиях проблемы сжатия данных в СУБД

(Часть 2)

Сжатие табличных данных

Кодирование числовых данных

Упаковка битов

Кодирование длин серий и методы устранение констант

Статистическое кодирование

Дифференциальное кодирование

Кодирование текстовых данных и данных произвольного типа

Метод Хаффмана

Арифметическое сжатие

Методы Зива-Лемпела

Другие способы словарного сжатия

Дифференциальное кодирование, векторное квантование

Сортировка, группировка и преобразование столбцов

Другие методы сжатия данных

Сжатие табличных данных с потерями

(Часть 3)

Сжатие индексных структур

Основные типы индексов

Сжатие битовых карт

Экономное кодирование B-деревьев

Сжатие индексов других типов

Сжатие результирующих наборов

Сходные области исследований: сжатие данных в информационно-поисковых системах

Оптимизация запросов в СУБД со сжатием данных

Выводы

(Часть 4)

2. Использование сжатия данных в современных СУБД

ADABAS

DB2

Ingres

Microsoft Access

MySQL

Oracle

SAS System

Sybase IQ

Teradata

Сравнение и выводы

Заключение: перспективные направления в области использования сжатия данных в СУБД

Благодарности

Литература

Содержание | Часть 1 | Часть 2 | Часть 3 | Часть 4