База данных (БД) – поименованная совокупность сведений о конкретных объектах предметной области, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными. База данных – совокупность массивов данных сложной структуры. Предметная область - часть реального мира, представляющая интерес для конкретного исследования.
Слайд 3
Требования к БД : Модельность – БД должна моделировать некоторую часть объектов реального мира; Актуальность – отражает текущее состояние объектов реального мира и динамически обновляется; Непротиворечивость – данные в БД не должны противоречить друг другу и выбранной модели предметной области; Целостность – БД должна по возможности наиболее полно моделировать объекты реального мира в рамках выбранной предметной области; Надежность - данные защищены от потери либо искажения.
Системы управления базами данных (СУБД) – пакет программ, обеспечивающих создание БД и организацию данных. Основные функции СУБД Описание структуры данных; Ввод данных Обработка данных: Редактирование (Добавление, Удаление, Обновление) Поиск и выборка Вычисления Вывод данных Управление данными: Защита от несанкционированного доступа. Поддержка многопользовательского режима. Обеспечение целостности и согласованности данных.
Слайд 5: БАЗЫ ДАННЫХ
БД Данные из внешней среды Ввод данных Хранение данных Обработка данных Редактирование Поиск Вычисление Информация для использования Вывод информации
Слайд 6: КЛАССИФИКАЦИЯ БД
По технологии обработки данных: А) Централизованные; Б) Распределенные; Централизованная база данных хранится в памяти одной вычислительной машины Распределенная база данных состоит из нескольких частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД). 2. По способу доступа : А) с локальным доступом; Б) с удаленным (сетевым) доступом; Системы централизованных баз данных с сетевым доступом могут быть реализованы с использованием следующих архитектур : файл-сервер и клиент-сервер
Слайд 7: АРХИТЕКТУРА ФАЙЛ - СЕРВЕР
Файл – сервер Раб. Станция №1 Раб. Станция №2 Раб. Станция №3 П е р е д а ч а ф а й л о в БД д л я о б р а б о т к и Хранение данных Обработка данных Информация для использования
Слайд 8: АРХИТЕКТУРА КЛИЕНТ - СЕРВЕР
Сервер базы данных Раб. Станция №1 Раб. Станция №2 Раб. Станция №3 Хранение данных Обработка данных Информация для использования
Слайд 9: КЛАССИФИКАЦИЯ БД
3. По используемой модели данных : Модель данных – это правила, которые определяют структуру данных и доступные операции над данными. А) иерархические; Б) сетевые; В) реляционные Г) объектно-ориентированные
Слайд 10: Классификация СУБД по модели данных
Иерархические Сетевые Реляционные Объектно-ориентированные Организация данных в виде двухмерных таблиц
Слайд 11: Иерархическая модель данных
Иерархическая структура представляет совокупность элементов, связанных между собой по правилам иерархических отношений. Объекты, связанные иерархическими отношениями, образуют ориентированный граф (перевернутое дерево). С3 С2 Уровень 1 Уровень 2 Уровень 3 … … С1 .. .. С5 С4 С6 С7 С8 .. В1 В2 В3 А К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.
Слайд 12: ИЕРАРХИЧЕСКАЯ СТРУКТУРА ДАННЫХ
специальности факультеты ИЕРАРХИЧЕСКАЯ СТРУКТУРА ДАННЫХ ВУЗ Главная вершина (корень) Уровень 1 Юридический Экономический Информационных технологий Уровень 2 Этр Фин Мэк Уровень 3 Эуп курсы 1 2 Уровень 4 3 4 5 группы 1 2 Уровень 5 3 4 Андреев Борисов Григорьева
Слайд 13
Сетевая структура ( модель данных ) имеет те же составляющие, что и иерархическая ( уровень, узел, связь ), но каждый узел может быть связан с любым другим узлом ( представлена в виде диаграммы связей ). А B C D E F
Слайд 14: Пример сетевой структуры БД
Студент ( номер зачетной книжки, фамилия, имя, отчество) Д11222 Иванов И.И. Д22111 Петров П.П. Д33222 Сидоров С.С. 1006 Орлов Н.А. 1007 Соколов П.Е. 1008 Грачев К.П. 1009 Галкин А.В. Работа ( шифр, руководитель) Примером сложной сетевой структуры может служить структура базы данных, содержащей сведения о студентах, участвующих в научно-исследовательских работах (НИР). Возможно участие одного студента в нескольких НИР, а также нескольких студентов в разработке одной НИР.
Слайд 15: РЕЛЯЦИОННАЯ СТРУКТУРА ДАННЫХ
Отношение ( relation ) Поля, домены Запись, кортеж Ключевое поле
Слайд 16: РЕЛЯЦИОННАЯ МОДЕЛЬ, ОПРЕДЕЛЕНИЯ
Реляционная база данных – связанная информация, представленная в виде двумерных таблиц. Сущность – это любой различимый, отличный от других, реальный или воображаемый, объект, информация о котором будет храниться в базе данных. Отношение – сгруппированные в двумерную таблицу логически связанные данные, описывающие сущность (информационный объект). Атрибут – характеристика, определяющая свойства данного класса объектов и позволяющая однозначно идентифицировать объект и отличить его от других. Домен (Поле) – это диапазон значений, которые может принимать атрибут. Домен может быть задан перечислением возможных значений либо в абстрактном виде. Кортеж ( Запись) – одна из реализаций информационного объекта, т.е данные, расположенные в одной из строк таблицы. Ключевое поле - это тот атрибут информационного объекта, значение которого однозначно определяет соответствующую запись.
Слайд 17: Реляционная модель данных. Основные понятия
Сущность Таблица. Атрибуты сущности Заголовки столбцов (полей). Значения атрибутов для различных экземпляров объектов Строки таблицы (записи). Номер Фамилия Имя Отчество Страна 1 Иванов Иван Иванович Россия 2 Петров Петр Петрович Украина 3 Сидоров Сидор Сидорович Россия Клиенты
Слайд 18: Свойства отношений
Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами: каждый ее столбец имеет уникальное имя; все столбцы в таблице однородны, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и для них выделяется одинаковый объем в памяти ЭВМ; один элемент данных занимает одну ячейку таблицы; одинаковые строки в таблице отсутствуют; порядок следования строк и столбцов может быть произвольным.
Слайд 19: Идентификация строк
Первичный ключ ( PRIMARY KEY ) - уникальный идентификатор записей таблицы. Один или несколько столбцов, используемые для идентификации каждой строки и обеспечивающие различимость строк. Однозначно определяет значения остальных атрибутов отношения, не входящих в состав первичного ключа. Содержит минимально необходимое для идентификации записи множество атрибутов. В качестве первичного ключа рекомендуется выбирать поля типа «длинное целое». Если первичный ключ подобрать сложно, рекомендуется создавать искусственный идентификатор в виде поля «длинное целое» и заполнять его уникальными значениями, кодирующими записи исходной таблицы.
Слайд 20: Связывание таблиц
Внешний ключ ( FOREIGN KEY ) – поле таблицы, предназначенное для хранения значения первичного ключа другой таблицы с целью организации связи между этими таблицами. Значения атрибутов, входящих в исходную и связанную таблицы, должны совпадать для связанных записей. Наименования связанных полей совпадать не обязаны. Код сделки Код клиента Дата Сумма 1 3 01.12.08 1000 2 1 02.12.08 2000 Код клиента Наименование Адрес 1 Клиент1 Адрес1 2 Клиент2 Адрес2 Сделки Клиенты FOREIGN KEY PRIMARY KEY
Слайд 21: Типы связей
Экземпляры 2-ой сущности Экземпляры 1-ой сущности Экземпляры 2-ой сущности Экземпляры 1-ой сущности Экземпляры 2-ой сущности Экземпляры 1-ой сущности Один - к – одному (1:1) Один - ко – многим (1: n ) Многие - ко – многим ( n : n )
Слайд 22: Связи между информационными объектами (сущностями)
Связи между информационными объектами (сущностями) или межтабличные связи бывают трех типов: 1:1 (Один-к-одному), если одному экземпляру 1-го информационного объекта соответствует один экземпляр 2-го информационного объекта. 1:М (Один-ко-многим), если одному экземпляру 1-го объекта соответствует множество экземпляров 2-го, а каждому экземпляру 2-го объекта соответствует один экземпляр1-го. М:М ( Многие-ко-многим), если каждому экземпляру 1-го объекта соответствует множество экземпляров 2-го объекта, а каждому экземпляру 2-го объекта соответствует множество экземпляров 1-го объекта.
Слайд 23: Примеры связей между информационными объектами
Один студент обучается у многих преподавателей, а один преподаватель обучает многих студентов Установленный размер стипендии по результатам сдачи сессии может неоднократно повторяться для различных студентов Каждый студент имеет определенный набор экзаменационных оценок в сессию
Слайд 24: Проектирование реляционных баз данных
В теории реляционных баз разработан метод нормализации отношений, который помогает разработчику оптимальным образом спроектировать структуру отношений базы данных. Нормализация отношений - пошаговый процесс разложения (декомпозиции) исходных отношений БД на более простые. Каждая ступень этого процесса приводит схему отношений БД в последовательные "нормальные формы". Каждая следующая нормальная форма обладает «лучшими» свойствами, чем предыдущая.
Слайд 25: Нормализация БД
Нормализация – процесс удаления избыточных данных из таблицы путем декомпозиции отношений, т.е. разбиения исходного отношения на множество более простых отношений. Результаты нормализации : Устранение (сокращение) дублирования данных. Поддержка непротиворечивости информации. Уменьшение пустых значений. Уменьшение объема таблиц БД. Повышение скорости выполнения различных операций с данными. В теории реляционных баз данных принято выделять следующую последовательность нормальных форм: первая (1 NF ); вторая (2 NF ); третья (3 NF ); нормальная форма Бойса-Кодда ( BCNF );четвертая (4 NF ); пятая (5 NF ).
Слайд 26: Нормальные формы
Отношение находится в первой нормальной форме (1 NF ), если значения атрибутов атомарны, то есть в каждом столбце находится только одно значение. Отношение находится во второй нормальной форме (2 NF ), если выполняются ограничения первой нормальной (1 NF ) формы и каждый неключевой атрибут функционально полно зависит от первичного ключа (первичный ключ может быть составным). Отношение находится в третьей нормальной форме (3 NF ), если выполняются ограничения второй нормальной формы (2 NF ) и если все неключевые атрибуты отношения взаимно независимы и полностью зависят от первичного ключа.
Слайд 27: Пример проектирования реляционной базы данных
Пусть небольшой фирме, продающей комплектующие для компьютеров, требуется сохранять данные о заказах. Эти данные включают: 1) дату заказа; 2) номер заказа; 3) артикул (уникальный номер единицы товара); 4) наименование товара; 5) цену заказанного товара.
Слайд 28: ПЕРВАЯ НОРМАЛЬНАЯ ФОРМА ОТНОШЕНИЯ «ЗАКАЗЫ»
Отношение находится в 1 NF, так как все ее атрибуты атомарны.
Слайд 29: ВТОРАЯ НОРМАЛЬНАЯ ФОРМА ОТНОШЕНИЯ «ЗАКАЗЫ»
Для того чтобы выполнить требования второй нормальной формы, надо добавить к таблице атрибут, который однозначно бы идентифицировал каждую единицу товара, входящую в заказ. Это атрибут – Учетный №. В этой таблице все атрибуты зависят от атрибута Учетный №, но есть зависимость Наименования и Цены от Артикула. Требование (3 NF ) независимости атрибутов отношения не выполняются.
Слайд 30: ТРЕТЬЯ НОРМАЛЬНАЯ ФОРМА ОТНОШЕНИЯ «ЗАКАЗЫ»
ПРОДАЖИ КОМПЛЕКТУЮЩИЕ ЦЕНЫ Для приведения отношения в третью нормальную форму предыдущую таблицу требуется разбить на три отношения: ПРОДАЖИ, КОМПЛЕКТУЮЩИЕ, ЦЕНЫ.
Слайд 31: ИНФОЛОГИЧЕСКАЯ МОДЕЛЬ БД «ЗАКАЗЫ»
Инфологическая модель предметной области представляет собой ее (области) отображение в виде совокупности информационных объектов и структурных связей.
Слайд 32: ОСНОВНЫЕ ЭТАПЫ РАБОТЫ С БД
Определение таблиц, включаемых в БД; Определение полей всех таблиц; Определение полей с уникальными значениями (ключевых полей); Определение связей между таблицами. Разработка инфологической модели ОСНОВНЫЕ ЭТАПЫ РАБОТЫ С БД создание структуры таблиц базы данных; ввод и редактирование данных в таблицах Создание базы данных обработка данных, содержащихся в таблицах; вывод информации из базы данных. Эксплуатация БД
Слайд 35: Кодирование ответов на вопрос
Содержание ответа Код ответа Полностью 1 Не в полной мере 2 Нет 3 Затрудняюсь с ответом 4