Современные
информационные технологии/3 Программное обеспечение
Костюченко Г.Л.
Белорусский
торгово-экономический университет
потребительской
кооперации, Беларусь
Технология обработки данных OLAP
Система OLAP (On-line Analytical
Processing – аналитическая обработка в реальном времени) ‑ технология
обработки данных, заключающаяся в подготовке суммарной (агрегированной)
информации на основе больших массивов данных, структурированных по многомерному
принципу.
E.F. Codd, стоявший у истоков технологий
систем управления реляционными базами данных сказал: «Хотя системы управления
реляционными базами данных доступны для пользователей, они никогда не считались
средством, дающим мощные функции по синтезу, анализу и консолидации (функций, называемых
многомерным анализом данных)». OLAP позволяет выполнять такое превращение.
OLAP-технология используется аналитиками
для анализа накопленных в организации данных, подготовки отчетов.
В 1993 году Кодд опубликовал 12 правил под
названием «OLAP для пользователей-аналитиков: каким он должен быть». Позднее правила
были переработаны в тест FASMI. FASMI ‑ это аббревиатура от названия
каждого пункта теста. Требования к OLAP:
Fast (Быстрый). Обеспечивать минимальное
время доступа к аналитическим данным ‑ в среднем порядка 5 секунд;
Analysis (Анализ). Давать пользователю
возможность осуществлять числовой и статистический анализ;
Shared (Разделяемый доступ). Предоставлять
возможность работы с информацией многим пользователям одновременно;
Information (Информация). Давать
пользователю возможность получать информацию, в каком бы электронном хранилище
данных она не находилась;
Multidimensional
(Многомерность). Смотреть ниже.
В основе OLAP лежит идея многомерной
модели данных. Человеческое мышление многомерно по определению. Процесс анализа
в многомерной модели приближен к реальности человеческого мышления.
Любая система поддержки принятия решений
должна обладать средствами отбора и представления пользователю данных в удобной
для восприятия и анализа форме. Наиболее удобными для анализа являются многомерные
данные. Для описания таких наборов данных вводится понятие многомерных кубов. По
осям многомерной системы координат откладываются данные анализируемого
бизнес-процесса. Измерениями являются признаковые данные (Дата, товар, клиент).
Данные, количественно характеризующие процесс ‑ факты. Куб создается из
соединения таблиц с применением схемы звезды или снежинки. В центре схемы
находится таблица фактов, по которым делаются запросы. Множественные таблицы с
измерениями присоединены к таблице фактов. Куб потенциально содержит всю
информацию, которая может потребоваться для ответов на любые запросы.
Моделью для запросов является
пространственная БД ‑ хранилище данных. OLAP делает мгновенный снимок
базы данных и структурирует ее в пространственную модель для запросов.
Хранилище данных (Data warehouse) –
предметно ориентированная информационная корпоративная БД, специально
разработанная и предназначенная для подготовки отчетов, анализа
бизнес-процессов с целью поддержки принятия решений в организации. Технология
информационного хранилища обеспечивает сбор информации из существующих БД
организации и внешних источников.
Пользователи могут легко рассматривать
данные на многомерной структуре в применении к собственным задачам. Данные
торговых операций многомерны по природе. Для исследования данных торговой
деятельности, для оперативного аналитического анализа подходит OLAP-технология.
Рассмотрим возможные задачи анализа в
торговле, решаемые с помощью OLAP-технологии. Например, построить прогноз объема
продаж, определить самый выгодный товар (клиента, поставщика) и т.п. Такие
данные необходимы для принятия управленческих решений об изменении ассортимента
товаров, цен, расторжении и подписании договоров с контрагентами, проведения рекламных
кампаний и т.д.
Для анализа собрана информация о продажах условной
организацией, занимающейся мелкооптовой торговлей. Информация представлена измерениями
и фактами в хранилище данных. Измерения: Дата, Товар, Клиент (Покупатель),
Поставщик. Факты: Цена, Количество, Наценка, Скидка. Информация представлена в
таблицах:
Справочник Клиентов (КодКлиента, Клиент);
Справочник Поставщиков (КодПоставщика,
Поставщик);
Справочник Товаров (КодТовара, Товар,
ЕдИзм);
Продажи (Дата, КодТовара, КодКлиента,
КодПоставщика, Цена, Количество, Наценка, Скидка).
Из хранилища данные импортируются в
программу. Настройка размещения полей куба (рис.1) и многомерная таблица
(рис.2) выполнены с помощью OLAP,
встроенного в программу Deductor
Studio.
Deductor Studio — программа, реализующая
механизмы получения информации из произвольного источника данных с полным
циклом обработки (очистка, трансформация данных, построение моделей),
отображения результатов наиболее удобным образом (OLAP, диаграммы, деревья и т.
д.) и экспорта результатов.
Рис.1. Настройка размещения полей куба
Структура многомерной таблицы динамична. Заголовки измерений таблицы можно
менять местами, удалять.
Рис.2. Многомерная таблица в Deductor
Studio
Преимущества кубов очевидны ‑ данные
необходимо запросить из реляционной СУБД всего один раз при построении куба. Из
многомерного куба извлекают обычные двумерные таблицы. Разрезая кубы по
измерениям, аналитик получает обычные двумерные отчеты.
Для получения прогноза объема продаж из
хранилища импортируем не все данные, а только количество продаваемого товара в
разрезе даты и товара. Дату можно преобразовать к неделе и сгруппировать количество
объемов продаж по неделям.
Для анализа клиентов выбираем поля Клиент
и предварительно рассчитанное поле Прибыль. Используя возможности программы
можно выбрать клиентов, приносящих максимальные суммы прибыли. Аналогичный
анализ можно провести для товаров, поставщиков.
Для оценки партнерских отношений полезно
оценить надежность поставщика, например, по динамике поставок.
Ассортиментные решения базируются на
информации о структуре и динамике продаж.
Этими видами анализа возможности OLAP не
исчерпываются. Применяя в качестве алгоритма вычисления функции статистического
анализа можно получить другие виды оперативного анализа.
Оперативная аналитическая обработка служит
цели превращения данных в информацию и позволяет значительно упростить и
ускорить процесс подготовки и принятия решений руководящим персоналом.
OLAP применим везде, где есть задача
анализа многофакторных данных. При наличии некоторой таблицы с данными OLAP-технология
будет эффективным средством оперативного анализа.
Литература:
1. Корпоративные информационные
системы : пособие для студ. /
Л.К. Голенда [и др.] ; под ред. Л.К.
Голенда, Н.Н. Говядиновой. ‑Мн. : БГЭУ, 2011. ‑ 291 с.
2. Кривошеенко, Ю.В. Корпоративные информационные системы : учеб. пособие
для вузов / Ю.В. Кривошеенко. ‑ М. : Спутник, 2008. ‑ 106 с.
3. Экономическая
информатика : Введение в экономический анализ информационных систем : Учебник. ‑
М. : ИНФРА-М, 2005.‑958.