Читайте также:
|
|
Интеграция множества источников данных d рамках единого информационного хранилища представляет собой трудоемкую и дорогостоящую проектную задачу. Поэтому к процессу проектирования систем оперативного анализа данных на основе информационного хранилища в наибольшей степени относятся требования: очередности внедрения компонентов ИХ, обеспечивающей быструю отдачу от внедрения, и адаптивности логической и физической структуры ИХ к изменяющимся в ходе проектирования и эксплуатации информационным потребностям. Рассмотрим технологическую сеть проектирования информационного хранилища.
1.Идентификация проблемной области
На основе материалов предпроектного обследования осуществляется параметризация проекта создания информационного хранилища и выделяются все необходимые материальные, финансовые, людские и временные ресурсы на выполнение проектных работ, т.е. составляются техническое задание и технико-экономическое обоснование проекта. В частности, в рамках технического задания в разрезе конкретных видов деятельности или бизнес-процессов формулируются цели и задачи, области применения и пользователи ИХ, устанавливаются источники исходных данных, определяются информационные потребности пользователей.
Цели и задачи. Цели построения информационного хранилища во многом определяют характер используемых источников данных, направлений и методов анализа извлекаемой информации. В качестве целей создания ИХ могут выступать:
• реинжиниринг и непрерывный инжиниринг процессов и структуры управления предприятием;
• повышение качества и оперативности обоснования управленческих решений на стратегическом, тактическом и оперативном уровнях;
• упрощение управленческого документооборота для процесса принятия управленческих решений и др.
2.Разработка концептуальной модели ИХ
Этап разработки концептуальной модели ИХ соответствует этапу логического проектирования, который выполняется на основе технического задания и технико-экономического обоснования. На выходе этого этапа получаются логическая структура данных ИХ, схема преобразования данных, логическая структура данных витрин и схема представления данных.
Проектирование логической структуры ИХ осуществляется на основе анализа статистики использования конкретных информационно-справочных документов в процессе решения основных задач принятия решений. В результате выполнения операции производятся:
• отбор признаков анализа;
• построение.схем агрегации показателей;
• построение схем обобщения признаков;
• определение временного горизонта хранения показателей;
• отбор первичных и производных показателей для хранения;
• выбор типа логической структуры ИХ;
• распределение показателей по типам логической структуры. Основными методами выполнения операции отбора и структуризации показателей и признаков являются матричные, графо-аналитические и тезаурусные методы. В частности, большое значение имеет формирование объемно-частотных характеристик использования типов показателей и признаков их группировки в различных типах информационно-справочных запросов. На этой операции происходит также обобщение непосредственно сформулированных пользователями типов запросов к ИХ.
Сложность структуры данных показателей предопределяет выбор ее типа: «звезды» с однородной структурой признаков для всех показателей или «расширенной снежинки» с применением нескольких типов хранилищ показателей. В последнем случае осуществляется распределение показателей по типам хранилищ.
Проектирование процессов извлечения и схемы преобразования данных производится путем анализа выявленных на этапе идентификации проблемной области источников данных. На выходе операции формируется уточненный состав источников данных с определенными схемами фильтрации и агрегации данных для помещения в ИХ.
В частности, на этом этапе осуществляется анализ альтернативных источников данных, например выбор из числа коммерческих баз данных, а также устанавливаются схемы преобразований исходных данных в хранимые структуры ИХ. Сложность схем отображения источников данных в структуру хранилища предопределяет выбор типа ИХ: MOLAP, ROLAP, HOLAP.
Проектирование логической структуры витрин и схемы представления данных предполагает распределение показателей вместе с измерениями по витринам данных на основе выявленных информационных потребностей пользователей. Для витрин данных точно так же, как и для информационных хранилищ, проектируется структура данных и устанавливается схема отображения структуры ИХ на структуры витрин.
Данная операция может предшествовать разработке структуры информационного хранилища, когда сначала создаются структуры витрин данных, например, по основным видам деятельности или структурным подразделениям, а затем эти структуры данных интегрируются в общую структуру ИХ.
В рамках логически спроектированных витрин данных осуществляется выбор методов анализа данных для конкретных категорий пользователей. В частности, выявляется потребность в применении определенных видов статистического и интеллектуального анализа данных.
3. Формализация ИХ
Этап формализации завершает техническое проектирование информационного хранилища. На основе спроектированной на предшествующей операции архитектуры ИХ и универсумов программно-технических средств осуществляется выбор схемы размещения ИХ в сетевой вычислительной среде и программно-технических средств реализации ИХ.
Выбор схемы размещения ИХ в сетевой вычислительной среде осуществляется в зависимости от выбранного типа организации и предполагает определение числа уровней хранения:
• структура данных реализована централизованно на одном MOLAP-сервере;
• структура данных распределена на нескольких серверах в соответствии с ROLAP-организацией;
• наиболее оперативные и агрегированные данные хранятся на быстродействующем MOLAP-сервере, а детальные данные в ROLAP-хранилище - на менее производительных серверах.
Определение требований к конфигурации и числа клиентских мест выполняется на основе структуры витрин данных, выявленных категорий пользователей и используемых методов интеллектуального анализа, которые в совокупности определяют требования подключения к OLAP-серверу. Для каждого пользователя устанавливаются права доступа к ИХ.
Выбор программно-технических средств ИХ (серверов, клиентских мест, телекоммуникационного оборудования, инструментальных программных средств) выполняется на основе требований к физической конфигурации системы в части объемов памяти, быстродействия, надежности и выбранной клиент-серверной архитектуры ИХ.
Расчет объемов ИХ осуществляется путем суммирования объемов хранимых данных на всех MOLAP-серверах с учетом необходимого индексирования (специальных индексирующих таблиц для доступа к основным данным), а также объемов метаинфор-мации репозитория для MOLAP и ROLAP-организации. Объемы ИХ рассчитываются на текущий момент времени и на перспективу с учетом внедрения всех компонентов системы.
4. Реализация проекта ИХ
Этап реализации проекта ИХ выполняется на основе выбранных программных и технических средств, а также построенных на этапе концептуального моделирования компонентов ИХ и схемы размещения ИХ путем наполнения репозитория, настройки или программирования других инструментальных средств, наполнения информационного хранилища для MOLAP-структуры, создания проектной документации.
Наполнение репозитория ИХ осуществляется путем ввода определений:
• структуры ИХ, источников и витрин данных;
• правил ввода данных в ИХ из одного источника, из нескольких источников, при отсутствии данных;
• правил преобразования форматов при поступлении данных из источника и при выводе данных в предоставление пользователю;
• параметров использования методов интеллектуального анализа данных.
Разработка и отладка программных компонентов производятся в основном путем параметрической настройки ППП. В случае функциональной неполноты выбранного инструментального программного средства в части процедур начальной и периодической загрузки данных, а также процедур анализа данных выполняется программирование отдельных программных модулей.
Наполнение ИХ предполагает автоматическую загрузку информации из источников данных в ИХ с MOLAP-организацией, которая повторяется с заданной в репозитории периодичностью. Эта операция в последующем предполагает очистку ИХ от ненужных и устаревших данных; управление данными на различных уровнях хранения; автоматическое обновление агрегированных данных.
5. Внедрение и опытная эксплуатация
Заключительный этап создания ИХ предполагает комплексное тестирование всех компонентов ИХ с исправлением всех возникающих ошибок, последующим обучением пользователей и постоянным администрированием в соответствии с установленными правилами и документацией проекта.
Вопросы для самопроверки
1. Что понимается под клиент-серверной архитектурой? Что такое сервер и клиент?
2. Какие существуют уровни представления клиент-серверной архитектуры?
3. Какие существуют варианты клиент-серверной архитектуры?
4. Какие преимущества обеспечивает клиент-серверная архитектура?
3. Что такое репликация данных и какие существуют режимы ее осуществления?
6. Какие операции выполняются на стадии техно-рабочего проектирования клиент-серверной архитектуры?
7. Какие операции включает проектирование базы данных в клиент-серверной среде?
8. Что представляет собой система оперативной обработки транзакций (OLTP-система)?
9. Каковы особенности создания систем управления рабочими потоками?
10. Каковы особенности создания Интернет-приложений?
11. Что представляет собой система оперативного анализа данных (OLAP-система)?
12. Каковы особенности организации информации в информационных хранилищах?
13. Какие требования предъявляются к архитектуре информационных хранилищ?
14. Каковы основные компоненты архитектуры информационного хранилища?
15. Каковы основные технологические операции проектирования информационного хранилища?
Дата добавления: 2015-07-08; просмотров: 286 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Подсистема хранения данных | | | Величина и характер распределения остаточных напряжений в сварных соединениях низкоуглеродистых и легированных сталей , алюминиевых и титановых сплавов |