Классика баз данных - статьи

Отчетность по Хранилищу данных предприятия


Хранилище данных предприятия (Enterprise Data Warehouse - EDW) предназначено для объединения данных из различных учетных систем, обеспечивает консолидированные и очищенные данные для ряда витрин данных. Ключевым моментом этой технологии является применение бизнес-правил к исходным данных. Бизнес-правила определяют методы консолидации, стандартизацию кодов, очистку данных и отслеживание транзакций за прошедшие периоды. Таким образом, каждая из систем (учетная, Хранилище и витрина данных) будет выполнять те цели, для которых она была разработана.

Рис. 4. Отчетность по хранилищу данных предприятия

Надписи на рисунке:

Sales -продажи;

Operations - операции;

Financial - финансы;

HR - человеческие ресурсы;

Enterprise Data Warehouse - Хранилище данных предприятия;

Sales Data Mart - витрина данных продаж;

Operations Data Mart - витрина данных операций;

Financial Data Mart - витрина данных финансов;

HR Data Mart - витрина данных человеческих ресурсов;

Business User - бизнес-пользователь

Часто данные передаются в Хранилище в стандартном формате. К каждому типу данных, загружаемых в хранилище, применяется специальный формат файла или XML-схема. Например, при пересылке информации о продажах в EDW, выполняется ее консолидация по всем исходным системам. Каждый клиент должен быть занесен в основной список, независимо от того, во скольких отделах он зарегистрирован.

После консолидации к данным применяются правила стандартизации и очистки. Таким образом, у пользователей появляется согласованный доступ к данным, не зависящий от источника. Записи, которые не отвечают требованиям, предъявляемым к качеству данных, получают статус "ожидания" ("on hold"), пока не будет выполнено некоторое действие, которое устранит создавшуюся неопределенность. В соответствии с бизнес-правилами, таким данным можно присвоить также значение "по умолчанию" (default value).

После очистки и консолидации данные хранятся в реляционной СУБД. Часто используется та же технология, что и в учетных системах (например, продукт фирмы Oracle, IBM, SQL Server и т.п.).
Данные хранятся в реляционном формате, позволяя эффективно использовать историю транзакций и время от времени менять дизайн. Помимо истории транзакций Хранилище данных также содержит изменения, вносимые в структуру бизнес подразделений. Так, продавцы часто переходят в другие отделы, а заведующие отделов прикрепляются к другим подразделениям. Но запись о конкретной продаже не подгоняется под изменившуюся структуру организации, так как каждая транзакция должна отражать ту реальную ситуацию, которая складывалась на момент ее выполнения. Таким образом, в Хранилище поддерживаются так называемые "медленно изменяющиеся измерения" (slowly changing dimensions).

Таким образом, Хранилище может служить единым источником регулярно обновляемой информации для витрин - на сегодняшний день это наиболее предпочтительных инструментов пользовательского доступа к данным.

Поскольку изменения происходят как в учетной системе, так и в витринах данных, Хранилище служит своего рода буфером, минимизирующим исправления в данных и инфраструктуре отчетности. EDW подходит для компаний, которые планируют переход к ERP-системам (Enterprise Resource Planning - планирование ресурсов предприятия). Хранилище предназначено для работы со стандартными транзакционными форматами. Манипулированию каждой из исходных систем придается меньше значения, основное внимание уделяется тому, как привести данные в соответствие стандартному формату. По выполнении этой задачи, данные можно обрабатывать обычным способом для всех источников.

Это в равной мере относится как к крупным компаниям, поглощающим мелкие, так и к мелким, ориентированным на слияние с крупными. Данные из EDW-системы передаются в многомерную витрину. Для хранения данных, отображаемых с помощью интерфейсных средств, в этих витринах используются стандартные структуры данных, а также схемы "звезда" (star) и "снежинка" (snowfalke). На сегодняшний день, большинство поставщиков BI-инструментов обеспечивают поддержку стандартных форматов и позволяют пользователям осуществлять доступ и просматривать бизнес-данные.При покупке нового инструмента проблем с созданием отчетов по соответствующим витринам данных не возникает. Такая устойчивость и совместимость обеспечиваются EDW-архитектурой.

Единственным очевидным аргументом, говорящим не в пользу Хранилищ данных, является стоимость их реализации. Однако расходы на дизайн и разработку можно отсрочить, создавая EDW постепенно, расширяя его по мере добавления новых предметных областей. При таком подходе, выгода от использования высококачественных данных, удобных для представления и анализа, превышает издержки на разработку сложной архитектуры отчетности.


Содержание раздела