Нормализация отношений с примерами (1НФ, 2НФ, 3НФ)

Формы записи концептуальной модели | Индексирование таблиц. Определение индекса и его назначение. Типы индексов | Основные команды SQL | Распределенная база данных. Определение, основные термины, типы моделей, достоинства и недостатки |

Читайте также:

Метод нормализации отношения (таблицы) – это процесс постепенного улучшения отношения (таблицы) путем последовательного перевода отношения (таблицы) из ненормализованной формы в первую, во вторую, в третью (иногда в четвертую и пятую) нормальные формы.

Проектирование таблиц можно начинать с построения концептуальной модели и определения состава атрибутов для каждого объекта. Затем все атрибуты можно объединить в одну исходную таблицу. Можно сразу, без построения концептуальной модели, сформировать исходную таблицу. Исходная таблица в дальнейшем нормализуется путем расщепления на взаимосвязанные новые таблицы. Таким образом, можно построить или уточнить существующую концептуальную модель базы.

Таблица находится не в нормализованной форме, если существует ячейка, в которой находится несколько значений.

Пример ненормализованной таблицы: ИЗДЕЛИЯ (Код изделия, список деталей). Может встретиться изделие, которое содержит список из нескольких деталей.

Виды зависимостей между атрибутами

Атрибут (группа атрибутов) В функционально зависит от атрибута (группы атрибутов) A, если каждому значению A соответствует одно значение B. Такая зависимость изображается в виде A-->B (Табельный номер -->Фамилия сотрудника).

Если существует функциональная зависимость вида A-->B и B-->A, то имеет место функциональная взаимозависимость, которая изображается в виде A<-->B (Табельный номер <-->Номер паспорта сотрудника).

Частичная функциональная зависимость – это зависимость неключевого атрибута от части составного ключа, а не от всего ключа.

Полной функциональной зависимостью называется зависимость неключевого атрибута от всего ключа.

Атрибут C транзитивно зависит от атрибута А, если выполняются условия A-->B и B-->C, но обратная зависимость отсутствует.

Многозначные зависимости вида 1:M, M:1, M:M между атрибутами

A и B изображаются в виде A-->>B, A<<--B и A<<-- >>B соответственно.

Первая нормальная форма(1НФ).

Таблица находится в первой нормальной форме, если в каждой ее ячейке находится не более одного значения.

Пример. Преобразуем таблицу “ИЗДЕЛИЯ” из предыдущего примера в таблицу вида: ИЗДЕЛИЯ (код изделия, деталь). Тогда, за счет дублирования кода изделия, в каждой строке в колонке “Деталь” будет стоять только одно значение – наименование кода детали. Новая таблица будет в первой нормальной форме.

Покажем процесс нормализации на следующей исходной таблице:

ВЫПУСК ИЗДЕЛИЙ (Код подразделения (KP), наименование подразделения (NP), код изделия (KI), наименование изделия (NI), код типа изделия (KTI), наименование типа изделия (NTI), дата выпуска (DVI), количество (KVI), себестоимость изделия (SI)). Ключевые атрибуты первичного ключа подчеркнуты. Эта таблица находится в первой нормальной форме.

Рассмотрим аномалии (недостатки) первой нормальной формы.

1. Избыточное дублирование данных. Все наименования будут дублироваться в каждой строке нашей таблицы.

2. Аномалия включения. Пока изделие не будет выпущено, информация о нем (проектируемом или ранее снятом с производства) будет отсутствовать в базе.

3. Аномалия удаления. Если изделие не выпускается в отчетный период, то информация об изделии исчезнет из базы.

4. Аномалия корректировки. Если меняется, например, название изделия, то нужно откорректировать наименование не в одной строке, а во всех строках таблицы, где оно встречается.

Для устранения этих недостатков продолжим процесс нормализации.

Вторая нормальная форма(2НФ).

Таблица находится во второй нормальной форме, если она уже находится в первой нормальной форме, и все неключевые атрибуты целиком зависят от всего ключа, а не от отдельной его части.

Рассмотрим нашу таблицу на предмет выявления неключевых атрибутов, зависящих только от части ключа.

Атрибут “Наименование подразделения” зависит только от атрибута “Код подразделения” и не зависит от атрибутов “Код изделия” и “Дата выпуска”. Поэтому его следует удалить из таблицы. Чтобы не потерять информацию о подразделении создадим новую таблицу “ПОДРАЗДЕЛЕНИЯ” и в нее включим удаляемый атрибут “Наименование подразделения” вместе с ключевым атрибутом “Код подразделения” (иначе потеряется связь с таблицей “ВЫПУСК ИЗДЕЛИЙ”) и получим таблицу вида:

ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения).

Атрибут “Наименование изделия” зависит только от атрибута “Код изделия” и не зависит от остальных ключевых атрибутов. Аналогично предыдущему случаю, удалим его из таблицы в новую таблицу:

ИЗДЕЛИЯ (Код изделия, наименование изделия).

Атрибут “Код типа изделия” зависит только от атрибута “Код изделия” и не зависит от атрибутов “Код подразделения” и “Дата выпуска”. Аналогично предыдущему случаю удалим его из таблицы, добавим в таблицу “ИЗДЕЛИЯ” и получим таблицу:

ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия).

Атрибут “Наименование типа изделия” зависит только от атрибута “Код изделия”. Аналогично предыдущему случаю удалим его из таблицы и добавим в таблицу “ИЗДЕЛИЯ” и получим таблицу:

ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия, наименование типа изделия).

Атрибуты “Количество” и “Себестоимость изделия” зависят от всего ключа, поэтому оставим их в исходной таблице.

Таким образом, получим три таблицы:

ВЫПУСК ИЗДЕЛИЙ (Код подразделения, код изделия, дата выпуска, количество, себестоимость изделия).

ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения).

ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия, наименование типа изделия).

Очевидно, что все они находятся во второй нормальной форме.

Третья нормальная форма(3НФ)

Таблица находится в третьей нормальной форме, если она уже находится во второй нормальной форме, и все неключевые атрибуты взаимно функционально независимы.

Очевидно, что первые две таблицы удовлетворяют определению третьей нормальной формы. Рассмотрим таблицу “ИЗДЕЛИЯ”.

Атрибут “Наименование типа изделия” функционально зависит от неключевого атрибута “Код типа изделия”, поэтому его следует удалить (по определению третьей нормальной формы) из таблицы в новую:

ТИПЫ ИЗДЕЛИЙ (Код типа изделия, наименование типа изделия).

В результате получим модель базы данных из четырех таблиц в третьей нормальной форме:

ВЫПУСК ИЗДЕЛИЙ (Код подразделения, код изделия, дата выпуска, количество, себестоимость изделия).

ПОДРАЗДЕЛЕНИЯ (Код подразделения, наименование подразделения).

ИЗДЕЛИЯ (Код изделия, наименование изделия, код типа изделия).

ТИПЫ ИЗДЕЛИЙ (Код типа изделия, наименование типа изделия).

Модель базы данных “Выпуск изделий”:

[ПОДРАЗДЕЛЕНИЯ]–>[ВЫПУСК ИЗДЕЛИЙ]<–[ИЗДЕЛИЯ]<–[ТИПЫ ИЗДЕЛИЙ]

Убедимся в исчезновении аномалий из первой нормальной формы.

1. Избыточное дублирование данных. Все наименования сохраняются в таблицах по одному разу без дублирования, и избыточное дублирование исчезло.

2. Аномалия включения. Хотя изделие еще не выпущено (только проектируется), информацию о нем можно занести или сохранить в таблице “ИЗДЕЛИЯ”. Аномалия включения исчезла.

3. Аномалия удаления. Если изделие не выпускается в отчетный период, то информация об изделии сохранится в таблице “ИЗДЕЛИЯ”. Аномалия удаления исчезла.

4. Аномалия корректировки. Если меняется название изделия, то нужно откорректировать наименование только в одной строке таблицы “ИЗДЕЛИЯ”. Аномалия корректировки исчезла.

Дата добавления: 2015-11-14; просмотров: 224 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Принципы и этапы проектирования и создания баз данных	\|	Котлоагрегаты типа БГ-35 и БМ-35

mybiblioteka.su - 2015-2025 год. (0.008 сек.)