Концепция разработки складов данных
Первая фаза разработки склада данных является анализ бизнес-процессов и данных предприятия. Без ясного понимания разработчиками сферы бизнеса, способов достижения успеха, возникающих при этих проблемах, о необходимых ресурсах и т.д. создать Базу данных достаточно трудно.
Беда только в том, что в России поскольку мы переходим от плановой экономике к рыночной, большинство руководителей остались старого образца, когда выпускали продукцию – надо 20 отверток – выпускали 20 отверток, а сложите вы их продать или нет никого не волновало.
Поэтому мышления переход с одной технологии мышления на другую когда надо решить и правильно осознать, как принимать решения, не всегда идет удачно. Поэтому переходной процесс большой. Но с другой стороны такого рода люди не могут четко сформулировать какие потоки данных нужны организации, что является целью их бизнеса и т.д. и пока это не осознает руководителями и эти руководители не смогут рассказать разработчикам, разработчик – прежде всего программист, он не обязан знать предметную область.
Таким образом формализация модели предприятия определение неких формальных данных необходимых для того чтобы качественную систему создать.
Известно два подхода к бизнес анализу. Первый ориентируется на описание бизнес процессов протекающих на предприятия. Если бизнес стабилен и внешние факторы не играют в нем решающей роли или тоже стабильны, этот подход может быть достаточно эффективен. Второй учитывает не бизнес процессы, а бизнес события, ну считается, что это подход более гибкий и обеспечивает большую эффективность поскольку позволяет гибко модифицировать бизнес процессы ставя их в зависимость от бизнес событий, ну кроме того позволяет объединять управляющие информационные потоки и т.д.
Иными словами теоретики ОЛАП систем скажем так настаивают, что бизнес события являются более устойчивым и более тесно связаны с информационной моделью предприятия и потоками данных хранения, чем бизнес процессов. Ну бизнес-процессы хороши, например при производстве хлеба. Оно редко колеблется, всем кушать хочется. Вот когда касается колбасы и мяса там уже могут быть разнообразие появиться достаточно сильное. А с хлебом не так сильно люди расходятся и т.д.
Суть технологии проектирования этих схем заключается в выделении из общего объема данных. В выделении из общего объема данных собственно-анализируемых данных или фактов и вспомогательных данных, которые называются измерениями. Измерения – например: для хронологии надо знать кварталы, месяцы, декады и т.д. вторая ед. измерения может быть какая – территория: районы города, улицы, деревни и т.д. по разным измерениям собирается куб – по одной оси даты, по другой территории по третьей оси что-то другое, причем этих осей может быть много. То есть в основе ОЛАП систем лежит понятие гиперкуба, то есть многомерного куба данных, в ячейках которого, храниться анализируемые данные, например объемы продаж, а измерения могут быть названия месяцев, названия территории, названия отделов. Дальнейшее усложнение простейших моделей в виде ОЛАП кубов происходит обычно по следящим направлениям:
— Увеличение числа измерений
Чем больше число измерений тем (Легшее) проще проводить анализ. То есть вместо двух по месяцам и товарам, вводим по регионам, куб становится трехмерным.
— Усложнение содержимого ячейки
Например: в ячейке может храниться не просто уровень продаж, ну и остаток на складе, прибыль и т.д
— Введение иерархии в приделах одного измерения
Например основная ось это месяца, или кварталы, но при желаниях гиперкуб можно расширить и сделать какие-то точные измерения, если вам захотелось узнать какой товар в течение квартала идет лучше или хуже. Квартал – весна, в марте – пиво покупают мало, а в мае уже заливают. Можно за счет этого как-то улучшить прогнозирование.
Одна из первых производителей подобных систем стало ArBorSoftware выпустила продукт под названием ESSbase. У фирмы Оракал есть продукт под названием Оракал-Экспресс, который интегрирован с универсальным сервером – Оракал-Сервер. В силу естественно различий между операционными базами данных различаются способы доступа к ним. Популярный способ доступа к базам данных для хранилищ являются нерегламентируемый запрос, запрос который сочиняется на ходу, надо что-то проанализировать для этого специалист который работает в этой области должен быть достаточно квалифицированным, чтобы уметь составлять запросы.