OLAP-системы и методика многомерного хранения данных
OLAP разработана Коддом в 1993 году и определяет структуру, которая поддерживает сложные аналитические приложения.
Их работа в специализированных многомерных СУБД, т.н. MMOBMS.
Серверы MMOBMS могут выполнять следующие операции:
1) Консолидация:
— простое суммирование;
— расчет с использованием сложных выражений с включением других свернутых данных. Например, есть сведения о городах – получаем данные по стране.
2) Нисходящий анализ:
— обратно консолидации – отображение подробных сведений для каких-либо консолидированных данных. Наоборот – есть данные по стране – получаем данные о городе , далее – о районе…
3) Разбиение с поворотом:
— создание сводной таблицы. Бывает нужно рассмотреть данные с разных точек зрения.
Неформальные правила для OLAP- системы:
1) многомерное концептуальное представление данных;
2) прозрачность;
3) доступность;
4) неизменная производительность подготовки отчетов;
5) архитектура клиент-сервер;
6) универсальность измерений;
7) динамическое управление разряженностью матриц;
8) многопользовательская поддержка
9) неограниченные перекрестные операции между размерностями;
10) гибкость средств формирования отчетов;
11) неограниченное число измерений и уровней обобщения – например измерение – время, уровень обобщения – неделя, месяц, квартал, год.
Категории OLAP-инструментов
1) MOLAP : основные данные для куба сохраняются в высокоэффективной многомерной структуре. Здесь хороша компрессия данных, т.е. они хорошо упакованы.
Недостатки: изначально она проектируется под определенные требования,
тяжело ее переделать под другие требования.
2) ROLAP: основные данные для куба находятся в реляционной базе данных. Считается, что это наиболее развивающийся сегмент в OLAP-технологии. Все происходит за счет промежуточного программного обеспечения.
3) Управляемая среда запросов MQE. Это новое направление в OLAP- системах.
Для управления OLAP-системами предложены расширение языка SQL : RISQL.
MS-SQL-server OLAP-service
Информационный куб создан по основе информационной модели, где данные хранятся в виде многомерного куба с множеством осей и измерений.
Существует три модели хранения данных:
— MOLAP;
— ROLAP;
— HOLAP (гибрид).
Основные данные для куба сохраняются в реляционной базе данных, а интегрированные данные – в многомерной структуре. Т.е. это как бы 2 – е базы – обычная реляционная и куб с интегрированными данными
Примерная структура системы.
Методика многомерного хранения данных
Многомерные базы данных подразумевают такой тип хранения, который не допускают нормализацию баз данных. Реальная модель- “звезда” от Red Brik Sistance. Это MDDB. Измерений несколько – например 4 : менеджеры, товары, покупатели, заказы. Какие покупатели по каким заказам у какого менеджера какие товары купили – находится в таблице фактов – ненормализованной таблице. Измерений м.б. сколько угодно. Например здесь нет времени, территории и т.д.
Реализована в Oracle, начиная с 7.3, программный пакет – Discover 3.0