Читайте также:
|
|
3 уровня:
1. внешний – это тот, на котором представляют данные пользователи;
2. концептуальный - служит для отображения данных внешнего ур-ня на внутренний и обеспечивает необходимую независимость данных разных уровней друг от друга;
3. на внутреннем - данные воспринимаются СУБД и операц. сист.
Внешний уровень – это самый верхний Ур-нь, который отражает представление конечного пользователя о конфигурации данных. Некоторые представления пользователя не являются исходными, а потому в базе данных их не следует сохранять. Конечные пользователи часто оперируют с приложениями. Каждое приложение видит и обрабатывает только те данные, которые необходимы именно ему.
Концептуальный уровен ь – это объединяющее представление данных, используемых всеми пользовательскими приложениями, работающими с данной базой. На этом уровне БД - общий взгляд пользователя на данные проектируемой базы. Здесь описывается: какие данные хранятся в базе, и каковы связи между ними. Этот уровень отражает логическую структуру всей базы с точки зрения администратора базы данных. Здесь должны быть отражены: § все сущности, включаемые в базу, их атрибуты и связи; § накладываемые на данные ограничения; § семантическая информация о данных; § информация о мерах обеспечения безопасности и поддержки целостности данных. База данных на концептуальном уровне имеет высокую степень абстракции и характеризуется аппаратной и программной независимостью.
Внутренний уровень служит для адаптации концептуальной модели к конкретной СУБД. Другими словами, внутренняя уровень – это представление базы данных со стороны СУБД, и на этом уровне описывается, как данные должны храниться в компьютере. Внутренний уровень предназначен для достижения оптимальной производительности и обеспечения оптимального использования дискового пространства. Здесь хранится такая информация: § распределение дискового пространства для хранения данных и индексов; § описание подробностей хранения данных; § сведения о размещении записей; § сведения о сжатии данных и методах их шифрования. База данных, создаваемая на этом уровне, имеет средний уровень абстракции и характеризуется аппаратной независимостью и программной зависимостью, то есть она зависит от программного обеспечения базы данных.
В действительности ниже внутреннего Ур-ня находится еще урнь физ. представления данных, то есть физ.ур-нь, на кот. описываются способы хранения инф-ции на носителях. Другими словами, физ. Ур-нь – это собственно данные, хранящиеся на внешних носителях информации и расположенные в файлах или страничных структурах.
Логическая независимость предполагает возможность изменения одного приложения без корректировки других, работающих с этой же базой данных. А физическая независимость предполагает возможность переноса хранимой информации с одних носителей на другие при сохранении работоспособности всех приложений, работающих с конкретной базой. Логическая независимость устанавливается между 1 и 2 уровнями, а физическая между 2 и 3.
11. Модели данных. Иерарх. модель, +и-
Данные- набор конкрет. знач-ий, парам-ов, характер. объект, условие, ситуацию, Данные не облад. опред. структурой, стан-ся инфой, когда пользователь задает им опред. структуру, т.е. надел. их смыслов.содерж. Модель дан – некот. абстракция, которая, будучи приложима к конкретным данным, позвол пользователям и разработчикам трактовать их уже как инфу(сведения, содержащие осмыслен данные и взаимосвязь между ними). Люб. БД сост. из элементов данных (реквизитов) и связей между ними. Чтобы организовать данные в базу, необходим предварит процесс моделир-я (должна быть разработана схема, позвол. изобразить связи между элементами данных). Такую схему наз моделью данных. Модель данных явл ядром базы данных.
3 модели: иерархическая, сетевая, реляционная – традицион. модели данных. В послед. годы вед. работы по созд.БД, построен.на постреляц, многомерн, объектно-ориентиров. и др. моделях, кот наз нетрадиц.моделями.
Иерархическая модель появ. в резул обобщ.структур данных языка Кобол. Осн. структура представ-ия данных им. форму дерева. На первом уровне нах. одна вершина, кот.наз.корнем дерева(им.связи с вершинами 2ого ур-ня, вершины 2ого ур-ня им. связи с вершинами 3го ур-ня и т.д) Связи между вершинами одного уровня нет. Данные в иерарх. структуре не равноправны – одни жестко подчинены другим. Доступ к информации - только по вертик схеме, начин. с корня, т.к. кажд. элемент связан только с одним элементом на верхнем уровне и с одним или неск. на низком. Над иерарх.организ.данными опред.след. операции: добав в БД нов.запись, измен. знач. данных удалить некоторую запись и все подчин ей записи, извлечь запись. Иерарх. модель явл. наиб. прост. «+»: достаточ.эфф.исп. памяти и норм. времен. показат-и выполн.операций над данными. «-»: иерархической модели явл.слож.логич.связи, громоздк.в обраб.дан.
Иерарх.сист. IMS. PC/Focus, Team-Up, Data Edge и наши: Ока, ИНЭС, МИРИС.
12. Сетевая модель, ее +и-
Дальнейшим развитием иерархической модели является сетевая. Сет. модель – структура, у кот. любой элемент может быть связан с любым др. элементом. Сетевая база данных состоит из наборов записей, кот. связаны между собой так, что записи могут содержать явные ссылки на другие наборы записей. Тем самым наборы записей образуют сеть. Связи между записями могут быть произвольными, и эти связи явно присутствуют и хранятся в БД. Над данными в сет. базе могут выполняться следующие операции: Добавить – внести запись в БД; Извлечь – извлечь запись из БД; Обновить – изменить значение элементов предварительно извлеченной записи; Удалить – убрать запись из БД; Включить в групповое отношение – связать существующую подчиненную запись с записью-владельцем; Исключить из групп. отношения – разорвать связь между записью-владельцем и записью-членом; Переключить – связать существующую подчиненную запись с другой записью-владельцем в том же групповом отношении. Первоначально сет. модель замышлялась как инструмент для программистов. В качестве базового языка программирования был выбран Cobol. К известным сетевым системам управления БД относятся: DBMS, IDMS, TOTAL, VISTA, СЕТЬ, СЕТОР, КОМПАС и др. Достоинства сетевой модели: 1. высокая эффективность затрат памяти; 2. оперативность; 3. возможность образования произвольных данных. Недостатки сетевой модели: 1. сложность и жесткость схемы базы; 2. сложность понимания для обычного пользователя; 3. ослаблен контроль целостности, так как допускается устанавливать произвольные связи между записями; 4. много весит. Поскольку в сетевых базах основная структура представления информации имеет форму сети, в которой каждая вершина (узел) может иметь связь с любой другой, то данные в сетевой базе более равноправны, чем в иерархической, так как доступ к информации может быть осуществлен, начиная с любого узла. Графовые (иерархические и сетевые) модели реализованы в качестве моделей данных в системах управления базами данных, работающих на больших ЭВМ. Для ПК больше распространены рел. БД, хотя имеются и СУБД поддерживающие сетевую модель.
13. Рел. модель. Понятия, + и -
Реляционная модель-сов-ть данных, сост. из набора 2мерных таблиц. Рел. модель является удобной и наиболее привычной ф. представления данных. При табл. организации данных отсутствует иерархия элементов. Строки и столбцы могут быть просмотрены в любом порядке, поэтому высока гибкость выбора любого подмножества эл-тов в строках и столбцах. Любая табл. в рел. базе состоит из строк, кот. называют записями, и столбцов, которые называют полями. На пересечении строк и столбцов находятся конкретные значения данных. Структура таблицы в рел. базе характеризуется след.: она состоит из совокупности столбцов;каждый столбец имеет уникальное,т.е. не повт. в др. столбцах, имя;последовательность столбцов в таблице не существенна;все строки табл. организованы по одинаковой структуре, т.е. имеют одно и то же кол-во реквизитов и имеют одинаковую длину; в табл. нет одинаковых строк;кол-во строк в табл. практически не ограничено; послед-ть строк в табл. не существенна;при выполнении манипуляций с табл. все строки и столбцы могут просматриваться в произв. порядке безотносительно к их содержанию и смыслу. Для этого типа модели имеется развитый матем. аппарат – рел. алгебра. В рел. алгебре поименованный столбец отношения называется атрибутом, а мно-во всех возможных значений конкр. атрибута – доменом. Строки табл. со значениями разн. атрибутов называют кортежами. Кол-во атрибутов, содержащихся в отн., определяет его степень, а кол-во кортежей – кардинальность отношения. Достоинства реляционных БД: Упрощенная схема представления данных – в виде табл.; Простота инструментальных средств поддержки рел. модели; Оптимизация доступа к БД,т.к. сис-мы сами выбирают наиболее эффект. послед-ть действий; Улучшение целостности и защиты, поскольку рел. модель позволяет улучшить выр-ние требований целостности путем использования языка высокого уровня; возм-ти разл. применений, в том числе и рассчитанных на не
специалистов в области программ-ния; Обеспечение пользователя языками высокого уровня при работе с БД; Обеспечение методологического подхода, т.к. главной целью модели БД является возможность описания реального мира, что проще всего осуществляется в рел. модели. Недостаток реляционной модели – в жесткости структуры данных, например, невозможно задать строку таблицы произвольной длины, а также сложность описания иерархических и сетевых связей. Неудобства, возникающие при работе с рел.базами:
· Рел. сис-мы ограничены в структурах представления данных, т.к.все данные хранятся в них в виде отн., сост. из простых атрибутов. Классическая рел. модель предполагает неделимость данных, хран-ся в полях табл.,т.е. информация в табл. должна быть представлена в первой норм. форме. Однако на практике иногда возникают ситуации, когда такое ограничение снижает эфф-ть работы с базой. Данные в рел. системе пассивны, и для описания их поведения требуется создавать прикладные программы;Возм-ти рел. БД недостаточны в тех случаях, когда объекты данных сложны, напр: географ. информ. сис-мы, мультимедийные базы. Все эти требования можно реализовать с помощью реляц. методов, но в рез-те получается не очень естественное представление требований пользователя.
В наст. время многие известные СУБД используют именно рел. модель представления данных –:это dBase, FoxBase, FoxPro, Paradox, Oracle, Microsoft Access, Clarion, Clipper, Ingres; отечественные: ПАЛЬМА, HyTech и др.
Связь между табл. в рел. модели данных. Перв. и вн. ключи, их отличия
Один или несколько атрибутов, значения которых однозначно определяют кортеж отн., называется его ключом, или первичным ключом, или ключевым полем. Т.е. ключевое поле – это такое поле, значения которого в данной табл. не повторяется. Записи в табл. хранятся упорядоченными по ключу. Ключ может быть простым, состоящим из одного поля, и сложным, сост. из нескольких полей. Сложный ключ выбирается в тех случаях, когда ни одно поле табл. однозначно не определяет запись. Кроме первичного ключа в табл. могут быть вторичные ключи, называемые еще внешними ключами, или индексами. Индекс – это поле или совокупность полей, чьи значения имеются в неск. таблицах и которое является первичным ключом в одной из них. Значения индекса могут повторяться в некоторой табл. Индекс обеспечивает логическую послед-ть записей в табл., а также прямой доступ к записи. По первичному ключу всегда отыскивается только одна строка, а по вторичному – может отыскиваться группа строк с одинаковыми значениями первичного ключа. Ключи нужны для однозначной идентификации и упорядочения записей табл., а индексы для упорядочения и ускорения поиска. Индексы можно создавать и удалять, оставляя неизменным содержание записей рел. таблицы. Кол-во индексов, имена индексов, соответствие индексов полям таблицы определяется при создании схемы таблицы. Индексы позволяют эффект. реализовать поиск и обр-ку данных, формируют доп. индексные файлы. При корректировке данных автом. упорядочиваются индексы, изменяется местоположение каждого индекса согласно принятому условию (возрастанию или убыванию значений). Сами же записи рел. табл. не перемещаются при удалении или включении новых экземпляров записей, изменении значений их ключевых полей. С помощью индексов и ключей устан-тся связи между таблицами. Связь устан-тся путем присвоения значений внешнего ключа одной таблицы значениям первичного ключа другой. Группа связанных таблиц называется схемой данных. Информация о таблицах, их полях, ключах и т.п. называется метаданными.
15. Реляционная целостность: целостность отношений, ссылочная целостность.
3 группы правил целостности:
1 целостн сущностей(запрещ первичн ключу иметь неопред знач); 2 целостн ссылок(знач внешн ключа=знач первичн ключ. либо быть неопред); 3 целостн,опред пользователем
Типы усл. целостн базы данных:
- обязат-ть данных
-проверка на правильность
-проверка на соотв огранич
-целостн табл
-ссылочная целостность
Применение дел-ых правил
Отношение может быть предст: матрицей смежности,графами,таблицей.
Реляц сис-мы: -d Base,Fox Base,Fox Pro, -Paradox, -Microsoft Access, -Clipper, - Ingres, - Clarion, - отечественные: ПАЛЬМА, Hy Tech и др.
16. Операции реляционной алгебры: объединение, пересечение, декартово произведение, разность, проекция, выборка, соединение, деление.
2 базовых мех-ма манипуляции данными: 1) реляционная алгебра 2) реляционное исчисление 1)-основана на теор множеств 2)- основана на математич логике
Степень отношений-число его атрибутов. 1-унарное, 2- бинарное, n-арные.
Кардин число или мощн отношений- число его картежей.(изменятся во времени)
Каждое отношение в пред. БД имеет уникальное имя. Имя отн.,получ в рез-те выполн реляц операции указыв в левой части нер-ва.
Э.Кодд предложил включить в реляц алгебру 8 операций,5 из кот являются базовыми:выборка,проекция,умножение,объединение,вычитание.
Множество операций:
1)Теоретико-множеств: (1.1объедин отнош(1)1.2пересеч отнош(2)1.3разность отнош(3)1.4декартово произв отнош(4))
2)Спец-ые реляц операции:(-проекция отнош –соед-ие отн –деление отн –огранич отнош(селекция,выборка))
Дополнительно: присваивание и переименование.
(1) -операция требует,чтобы операндыимели одинак значения.
(2) -принадл одновр обоим отнош R и S.
(3)- те кортежи,кот были в 1 но не были во 2.
(4)- отнош.,схема,кот явл сцеплением схем отношений
Выборка(огранич.,селекция)-из отн. выбир некот кортежи по опред условиям.
Проекция-создание новых отнош по опред схемам.
Остальные 3 операции производные:соединение,пересечение,деление.Соединение- логическое выражение в кот могут атрибуты отношений R и S и (или)скалярные выраж.
17. Постреляционная модель. Ее +и-
Постреляционная модель является расширением рел. модели. Она снимает ограничение неделимости данных, допуская многозначные поля, значения кот. состоят из подзначений, и набор значений воспринимается как самост. таблица, встроенная в главную табл. В пострел. БД данные хранятся более компактно, и не требуется выполнять операции связи 2-х таблиц. Такое хранение обеспечивает высокую наглядность представления данных и повышение эфф-ти их обр-тки. Спецификой пострел. модели является то, что она поддерживает множеств. группы, называемые ассоциированными множеств. полями, а совокупность объединенных множеств. полей называется ассоциацией. В пострел. модели не накладываются требования на длину и кол-во полей в записях, что делает структуру табл. более наглядной. Таким образом, осн. достоинством пострел. модели является возм-ть представления совокупности связанных рел. таблиц в виде одной пострел. табл. А недостатком является сложность обеспечения целостности и непротиворечивости данных, хранимых в ней. Постреляц. модель данных реализована в СУБД uniVers, Bubba и Dasdb.
Объектно-ориентированная модель данных (Object-oriented Data Model - OODM). Ее базовые понятия (объекты, классы, методы, наследование, инкапсуляция, расширяемость, полиморфизм), достоинства и недостатки
ОО БД результат применения подходов ОО прогр. к технологии БД. Все данные оформлены в виде моделей объектов (представление любой сущности реального мира в виртуальном пространстве, характеризующееся уникальным неизменным идентификатором, внутренним состоянием и поведением). Идентификатор (ключевая характеристика) генерируется системой при создании объекта и не зависит от состояния объекта. Объекты и значения могут быть именованными. Именование определяет длительность хранения: именованные объекты или значения и их потомки долговременны. Каждый объект должен принадлежать определенному классу (абстрактный тип данных, характеризуемый способом своего построения), т.е. каждый объект – экземпляр класса. Классы организованы в порядке иерархии (принцип структурной организации, состоящий в подчинённости низших звеньев высшим).
Класс объекта = интерфейс (виден другим объектам) + закрытая область. Интерфейс класса = свойства класса + методы класса. Св-ва (атрибуты) значения, характеризующие объект в его классе. Определяют состояние объекта. Напр., у счета – категория, баланс, кредит. К св-вам относятся также связи с другими объектами. Св-ва объектов описываются одним из стандартных типов (напр., строковым String) либо типом, кот. конструирует пользователь (Class). Св-ва сами могут быть объектами, что позволяет создавать составные объекты, напр., св-во ФИО может состоять из св-в: фам., имя, отч. Методы (программные коды, процедуры, с пом. кот. можно получить доступ к данным) определяют поведение объектов. Напр., клиент может сделать заказ, оплатить счет и т.п. – для каждого вида деятельности отдельный метод. Обычно имеют форму операций и функций с параметрами. На уровне интерфейса видно только имя каждого метода и требуемые параметры. В БД только через методы возможен доступ к данным (вне них внутренняя структура объекта скрыта от пользователя). В закрытой области могут существовать дополнительные свойства с закрытыми значениями, а также скрытые связи и сообщения другим объектам.
Структура и поведение объектов одного класса одинаковы, объекты класса отличаются значениями свойств.
Между записями БД и функциями их обработки устанавливаются связи с помощью ОО механизмов: Инкапсуляция означает объединение в объекте данных и методов, а также скрытие данных внутри объектов (что повышает надежность). Доступ к объекту только через его интерфейс (методы). Наследование (разбиение на подтипы) распространяет множество свойств и методов на всех потомков объекта (новые классы или объекты). Однако можно добавить дополнительные свойства и методы. Напр., классы Мужчина и Женщина как наследующие класс Человек. Полиморфизм допускает в объектах разных классов иметь методы с одинаковыми именами, но различно реагирующих на одинаковые события. Для унификации обработки разнородных объектов. Напр., метод «Печать результата»
Используются для высокопроизводительной обработки данных, имеющих сложную структуру. БД позволяет совместно использовать объекты различными приложениями и пользователями. Поиск в ОО БД состоит в установлении сходства между объектом, задаваемым пользователем (объект-цель), и объектами, хранящимися в БД. Примеры ООСУБД: POET, Jasmine, Orion, Iris, Versant, O2, ODB-Jupiter.
«+»: Способность отображать инфо. о сложных объектах с исчерпывающим описанием взаимосвязей между ними и их динамического поведения (внутри БД в форме объектов, а не внешних приложений). Используя объекты и методы, можно хранить и неоднократно использовать структуру и поведение объекта. Пользователю не нужно знать о взаимодействии объектов: просто обращается к конкретному объекту и использует конкретный метод.
«-»: Сложность понятийного аппарата, что затрудняет применение и отрицательно сказывается на накоплении опыта конструирования и эксплуатации. Низкая скорость выполнения запросов.
OODM используется в специальных инженерных и научных приложениях, где не хватает функциональности реляц. модели.
«-»: У ОРМД и ООМД отсутствуют в отл. от рел. МД унифицированная теория, формальная методология проектирования БД (как нормализация), специальные средства создания запросов, общие правила определения целостности и др.
«+»: ООМД и ОРМД для преодоления ограниченных возможностей РМД по хранению и обработке сложных объектов (документы, звук, видео, графика,…)
19. Объектно-реляционная (расширенная реляц.) модель данных (object-relational database ORD; Extended Relation Data Model – ERDM) ее достоинства и недостатки
ОР модель основана на стратегии РМД (что обеспечивает простоту ее структуры), однако учитывает объектные свойства данных, являясь, т.о., гибридной моделью. В ОРМД используются объ.-ориент. компоненты: пользовательские типы данных, инкапсуляция, полиморфизм, наследование, переопределение методов и т.п. Основные характеристики ОРМД определены стандартом SQL-3 (2003). Классы ООМД соответствуют таблицам в ОРБД, а объекты – записям в таблице. Для каждого наследуемого класса созд.ся отдельная таблица, связанная с таблицей базового класса по первичному ключу отношением 1:1. Перв.кл. (напр., поле с автонумерацией) является идентификатором объекта. Базовый класс должен уметь выполнять создание, загрузку, сохранение, удаление единичных объектов, изменение и удаление множеств объектов. ОРСУБД поддерживают язык SQL.
ОРМД наиболее приспособлена для бизнес-приложений. В будущем может произойти слияние OOМД и ОРМД.
ОРСУБД: Informix Universal Server, Oracle8, DB2, CUBRID, OpenLink Virtuoso.
«+»: возможность обработки больших объемов данных, быстродействие, широкие возможности масштабирования, функциональность (добавление отдельных интерфейсов и подсистем сервера)
Дата добавления: 2015-10-21; просмотров: 210 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Пользователи базы данных | | | Понятие проектирования базы данных. Требования, предъявляемые к БД |