Применение методов сжатия данных в СУБД

>> Предисловие к разделу
     Русские материалы
     Английские материалы >>
        Кодирование табличных данных |
        Кодирование индексов |
        Прочее


Смотрите также материалы:
- Методы Хаффмана и Шеннона-Фано
- Арифметическое сжатие
- Кодирование целых чисел
- Обзоры универсальных алгоритмов сжатия данных



>> Русские материалы
     Английские материалы >>
        Кодирование табличных данных |
        Кодирование индексов |
        Прочее
Авторы Название Описание Рейтинг
Смирнов М. Предисловие к разделу Несколько слов о вопросах применения экономного кодирования в СУБД
HTML
-
Смирнов М.А. Обзор применения методов безущербного сжатия данных в СУБД Данный текст задумывался как достаточно подробный и, по возможности, бесстрастный обзор использования сжатия данных в СУБД и сопутствующих вопросов. Дан обзор научных публикаций по сжатию баз данных, и проведено сравнение реализаций сжатия данных в основных СУБД.
Санкт-Петербург, 2003-2004.
HTML
PDF  403 кбайт
?
Poess M. Сжатие таблиц в СУБД Oracle9i release 2: анализ эффективности Перевод технической статьи Oracle. Кратко описан метод сжатия таблиц, реализованный в Oracle9iR2, выполнен анализ эффективности при использовании сжатия на одной схеме типа "звезда" и одной нормализованной схеме из TPC-H.
Oracle Magazine RE, март 2004, апрель-май 2004 //Перевод А. Соколова, В. Сусойкина
Исходная страница статьи
Статья в HTML:
Часть I
Часть II
Исходная статья на английском:
PDF  352 кбайт
4


>> Русские материалы
     Английские материалы >>
        Кодирование табличных данных |
        Кодирование индексов |
        Прочее
Chen A. Building Compressed Database Systems Одно из самых объемных исследований в данной области. Предложены методы: словарного кодирования данных, оптимизации планов запросов при использовании сжатия, сжатия результатов выполнения запросов. Рассмотрена проблема выбора методов сжатия для обеспечения наибольшей производительности.
PhD thesis, Cornell University, 2002.
PDF.RAR  701 кбайт
5
Westmann T., Kossmann D., Helmer S., Moerkotte G. The implementation and performance of compressed databases Описание простых алгоритмов сжатия для СУБД. Предложен вариант модификации оптимизатора плана выполнения запросов для учета влияния сжатия.
Technical Report 3/98, Universitat Mannheim, 1998. 
PDF.RAR    233 кбайт
4+
Roth M.A., Van Horn S. Database compression Краткий обзор вопросов применения методов сжатия данных в СУБД.
ACM SIGMOD Record, 22(3):31-39, Sept. 1993. 
PDF.RAR
4
Goldstein J., Ramakrishnan R., Shaft U. Compressing relations and indexes Описан простой метод сжатия целочисленных столбцов на основе упаковки битов. Предложен вариант его применения к кодированию индексов типа R-дерева. Статья практически 1:1 вошла в нижеследующую диссертацию.
Proc. IEEE Conf. on Data Engineering, Orlando, FL, USA, pp. 370-379, 1998.
PDF.RAR  271 кбайт
3
Goldstein J. Improved query processing and data representation techniques В первой части данной диссертации предложен метод кодирования целочисленных атрибутов на основе упаковки битов. Также рассмотрено применение метода к сжатию индексов типа R-дерева. Во второй части предлагается способ выполнения запросов, требующих нахождения ближайшего соседа в n-мерном пространстве.
PhD thesis, University of Washington, 1999.
PDF.RAR  639 кбайт
4
Ray G. Data Compression in Databases Изучена целесообразность использования в СУБД нескольких методов сжатия данных. Предложена схема кодирования на основе полуадаптивного арифметика.
Master's Thesis, Dept. of Computer Science and Automation, Indian Institute of Science, June 1995. 
PDF.RAR  209 кбайт
4
Graefe G., Shapiro L.D. Data Compression and Database Performance Показано, что использование сжатия данных может существенно увеличивать производительность СУБД.
Proceedings of the ACM/IEEE-Computer Science Symposium on Applied Computing, Kansas City, MO, 1991.
PDF.RAR   186 кбайт
4
Ng W.K., Ravishankar C.V. Block-Oriented Compression Techniques for Large Statistical Databases Предложен вариант дифференциального кодирования.
Knowledge and Data Engineering, 9(2):314-328, 1997.
PDF.RAR   197 кбайт
4
Poess M. Table Compression in Oracle9i Relsease 2: A Performance Analysis Техническая статья Oracle. Кратко описан метод сжатия таблиц, реализованный в Oracle9iR2, выполнен анализ эффективности при использовании сжатия на одной схеме типа "звезда" и одной нормализованной схеме из TPC-H.
An Oracle White Paper, January 2003
PDF  352 кбайт
Русский перевод "Сжатие таблиц в СУБД Oracle9i release 2: анализ эффективности" (HTML):
Часть I
Часть II
Oracle Magazine RE, март 2004, апрель-май 2004 //Перевод А. Соколова, В. Сусойкина
4


>> Русские материалы
     Английские материалы >>
        Кодирование табличных данных |
        Кодирование индексов |
        Прочее
Antoshenkov G. Dictionary-based order-preserving string compression Описание словарного алгоритма сжатия, сохраняющего упорядоченность. Эта техника используется в СУБД Oracle для сжатия индексов типа B-дерева и индексных таблиц.
VLDB Journal, 6(1):26-39, 1997.
PDF.RAR  115 кбайт
4
Johnson T. Performance Measurements of Compressed Bitmap Indices Исследование эффективности использования разных схем кодирования битовых индексов.
Proceedings of 25th International Conference on Very Large Data Bases, September 7-10, 1999 (VLDB'99), Edinburgh, Scotland, UK, pp. 278-289.
PDF.RAR  325 кбайт
5
Wu K., Otoo E., Shoshani A. Compressed bitmap indices for efficient query processing Предложена схема сжатия битовых индексов (bitmap) на основе RLE. По сжатию проигрывает аналогам, но обеспечивает значительно более быструю обработку.
Technical report LBNL/PUB-3161, Lawrence Berkeley National Laboratory, Berkeley, CA, 2001.
PDF.RAR  260 кбайт
5
Wu K., Otoo E., Shoshani A. Compressing Bitmap Indexes for Faster Search Operations Более подробное сравнение производительности схемы сжатия битовых индексов, описанной в предыдущей статье, с конкурирующими алгоритмами.
In Proceedings of SSDBM 2002. Preprint as technical report LBNL-49627, Lawrence Berkeley National Laboratory, Berkeley, CA, 2002.
PDF.RAR  129 кбайт
4
Goyal K., Ramamritham K., Datta A., Thomas H. Indexing and Compression in Data Warehouses Описание ряда индексов, применяемых в хранилищах данных. Исследованы способы экономного представления датаиндексов (DataIndex).
Technical Report, Indian Institute of Technology, Bombay, April 1999.
PDF.RAR  214 кбайт
4
Pigeon S., Wu X. Searchable Compressed Representations of Very Sparse Bitmaps Предложен метод кодирования сильно разреженных битовых карт. Весь интервал карты индексируется полным двоичным деревом. Каждый подинтервал битовой карты, соответствующий листу дерева, кодируется одним из 3 способов:
- со сжатием (перечисление элементов, входящих в подинтервал);
- одним битом, если все биты подинтервала одинаковы;
- "как есть" в виде обычной битовой карты.
Вид дерева и способ сжатия выбираются на основе минимизации размера закодированного представления. Несмотря на утверждения авторов, непосредственного выполнения операций на сжатых индексах не получится, надо декодировать.
Proceedings of the 2003 IEEE Data Compression Conference, pages 353-362, Snowbird, Utah, March 2003.
PDF.RAR  101 кбайт
3


>> Русские материалы
     Английские материалы >>
        Кодирование табличных данных |
        Кодирование индексов |
        Прочее
Chen Z., Seshadri P. An Algebraic Compression Framework for Query Results Рассмотрена проблема сжатия результирующих наборов (результатов выполнения запросов). Предложен подход к выбору методов сжатия таких данных. Материал вошел в состав вышеуказанной диссертации Чена.
Proceedings of the International Conference on Data Engineering ICDE'99, San Diego, CA, March, pp. 177-188, 1999. 
PDF.RAR  131 кбайт
4

Смотрите также материалы:
- Методы Хаффмана и Шеннона-Фано
- Арифметическое сжатие
- Кодирование целых чисел
- Обзоры универсальных алгоритмов сжатия данных


наверх