Первый слайд презентации: Базы данных и знаний
Слайд 2: Информация и данные
Под информацией понимают любые сведения о каком-либо событии, процессе, являющиеся объектом некоторых операций: восприятия, передачи, преобразования, хранения и использования. Данные – информация, представленная в определенной форме (формализованная), пригодной для последующей обработки, хранения и передачи. Понятие «данные» в концепции баз данных — это набор конкретных значений, параметров, характеризующих объект, условие, ситуацию или любые другие факторы. Примеры данных: Петров Николай Степанович, $30 и т. д. Данные не обладают определенной структурой, данные становятся информацией тогда, когда пользователь задает им определенную структуру, то есть осознает их смысловое содержание. Поэтому центральным понятием в области баз данных является понятие модели.
Под базой данных понимают совокупность разнообразных данных, организованных по определенным правилам. Технология использования БД реализуется средствами систем управления базами данных (СУБД) состоящих из совокупности языковых и программных средств. СУБД предназначены для создания, хранения и организации доступа к БД.
Слайд 5: Моделирование данных и знаний
Моделирование – процесс представления исследуемого объекта некоторой замещающей последовательностью других объектов или представлений, реализующих те или иные стороны изучаемого объекта с требуемой точностью. Модель всегда преследует определенную цель, и в зависимости от цели меняется сама модель. Модель никогда не отражает всю глубину изучаемого объекта. Различают следующие виды моделей :
Слайд 6: Модель предметной области
При моделировании предметной области используется два подхода: 1. анализ и интеграция информационных потребностей пользователей будущего банка данных; 2. анализ самой предметной области на основе методов системного анализа с привлечением методов экспертных оценок.
Слайд 7: Модель данных
— это некоторая абстракция, которая, будучи приложима к конкретным данным, позволяет пользователям и разработчикам трактовать их уже как информацию, то есть сведения, содержащие не только данные, но и взаимосвязь между ними. – это совокупность правил определения структур данных, операций над ними и ограничений целостности. Модель базы данных является средством интерпретации содержимого базы данных и реализации требуемых операций по обработке и управлению данными.
Слайд 8: Компоненты модели
Сущность – это абстракция реально существующего объекта. В качестве сущностей в моделях предметной области рассматриваются материальные объекты (предприятие, книга и т.д.) и результаты интеллектуального труда (патент, реферат и т.д.). Атрибут – это поименованная характеристика сущности, которая принимает значения из некоторого множества значений (домена). Чтобы задать атрибут, необходимо: присвоить ему имя; привести смысловое описание атрибута; определить множество его допустимых значений. Назначение атрибута - описывать свойства сущности. Один из атрибутов должен иметь уникальное значение и однозначно идентифицировать экземпляр сущности. Часто в роли таких специальных атрибутов выступают искусственно введенные атрибуты: шифр детали, код изделия и т.п. Связи выступают в качестве средства, с помощью которого представляют отношения между сущностями (ПО). Наиболее часто встречаются бинарные связи - связи между двумя сущностями.
Слайд 9: три основные модели данных
Иерархическая модель основана на графическом способе связей данных, и схема взаимосвязей объектов имеет вид перевернутого дерева. Каждому элементу соответствует только одна связь от элемента более высокого уровня. Поиск данных происходит по одной из ветвей дерева. В сетевой модели данных каждый элемент может иметь более одного порождающего элемента, а графическое представление модели очень напоминает сеть. Она допускает усложнение «дерева» без ограничения количества связей, входящих в его вершину. Реляционной называется база данных, в которой все данные, доступные пользователю, организованы в виде таблиц, а все операции над данными сводятся к операциям над этими таблицами.
Слайд 10
Примером реляционной базы данных может служить таблица «Сотрудники», где одна строка (запись) — сведения об одном из сотрудников. Табельный № Фамилия Имя Отчество Дата рождения 1278 Петров Олег Сергеевич 15.02.1954 8562 Сидоров Иван Петрович 23.02.1976 4625 Панин Петр Борисович 07.09.1986
Слайд 11: Структура таблицы
Поле (столбец таблицы) — элементарная единица логической организации данных. Каждое поле таблицы имеет уникальное имя, при этом каждое из полей однородно, т. е. данные в нем имеют одинаковые тип и длину. Для описания поля используют имя и тип данных. Поле, значение которого однозначно определяет соответствующую запись, называется ключевым полем. Если ключевое поле одно, то это — простой ключ, если ключевых полей несколько, то ключ называется составным. Запись — это совокупность значений связанных элементов данных. Экземпляр записи — это отдельная строка таблицы, содержащая конкретные значения ее полей. Таблица базы данных — это совокупность экземпляров записей одной структуры. Описание структуры базы данных содержит перечень полей записи и их основные характеристики.
Слайд 12: При моделировании используются следующие правила:
только три конструктивных элемента участвуют в отдельном проектном представлении предметной области: сущность, атрибут, связь; выбор конструктивных элементов, особенно сущностей, должен производиться таким образом, чтобы избежать избыточности данных. При моделировании сложной предметной области проектировщик разбивает ее на ряд предметных областей - локальных представлений, таким образом, чтобы каждое представление содержало не более 6-7 сущностей.
Слайд 13: Пример
Рассмотрим ПО «Служащий». Выделим на основании априорной информации, полученной от постоянных пользователей ПО две сущности: Служащий и Отдел
Слайд 15: Методы доступа к данным
Последовательный метод доступа заключается в просмотре всех записей таблицы в порядке очередности их вхождения. Этот метод является самым простым в организации и связан со значительными затратами времени на поиск, пропорциональными размеру таблицы. Прямой метод доступа состоит в нахождении нужной записи таблицы с помощью ключа (или индекса), содержащего ссылку на эту запись. При использовании данного метода просмотр других записей не выполняется, а осуществляется прямой доступ к записи на основании ссылки (смещения относительно начала таблицы). Индексно-последовательный метод доступа представляет собой объединение предыдущих методов, он используется при поиске группы записей. Применение данного метода возможно при наличии индекса, построенного по полям, значения которых должны быть найдены. При выборе данных последовательно перебираются индексы всех записей, удовлетворяющих заданным условиям, а по найденным индексам выбираются сами записи из таблицы (прямой доступ).
Слайд 16: способы доступа к данным
Навигационный способ доступа заключается в извлечении для обработки из БД каждой отдельной записи таблицы. В этом случае при необходимости обработать несколько записей запрос к БД будет выполняться многократно. Поэтому навигационный способ предпочтительно использовать в локальных БД. Например, в средах быстрой разработки приложений, таких как Delphi, данный способ доступа востребован компонентами-навигаторами для построчного редактирования записей. Реляционный способ доступа состоит в обработке сразу всей группы записей, при этом выдается один запрос к БД на получение всей группы записей. Указанный способ доступа более подходит для работы с удаленными БД. Здесь запрос на получение группы записей (в частном случае это может быть запрос на получение и одной записи) выполняется с привлечением средств языка SQL.
Слайд 17: Связывание таблиц
Таблицы реляционной БД, как правило, взаимосвязаны. Организация связи (отношений) между таблицами называется связыванием или соединением таблиц. Связывание таблиц можно осуществлять при проектировании или при эксплуатации БД. Связывать можно две или несколько таблиц. Вместе с тем, в БД могут присутствовать отдельные таблицы, не соединенные ни с одной другой таблицей. Для связывания таблиц используются поля связи, которые должны быть индексированными. В подчиненной таблице для связи с главной таблицей берется индекс, который также называется внешним ключом. Состав полей этого индекса должен полностью или частично совпадать с составом полей индекса главной таблицы. Для организации связи в главной и подчиненной таблицах выбираются индексы, составленные по полям одного и того же типа, например, целочисленного.
Слайд 18: Классификация бинарных связей
1:1 «Один к одному». Каждому экземпляру сущности А соответствует один экземпляр сущности В и наоборот. Пример: Если студент обучается в одном вузе, то связь «СТУДЕНТ» « СТУДЕНЧЕСКИЙ БИЛЕТ» является связью 1:1. 1:М «Один ко многим». Каждому экземпляру сущности А соответствует один или несколько экземпляров сущности В. Пример: «МАТЬ» «РЕБЕНОК»
Слайд 19
М:1 «Многие к одному». Каждый экземпляр сущности А связан с одним экземпляром сущности В, а каждый экземпляр сущности В связан с одним или несколькими экземплярами сущности А. Пример: «РЕБЕНОК» «МАТЬ» М:М «Многие ко многим». Каждый экземпляр сущности А связан с одним или несколькими экземплярами сущности В и наоборот. Пример: «ВРАЧ» «ПАЦИЕНТ», « СТУДЕНТ» «ПРЕПОДАВАТЕЛЬ».
Слайд 20: Работа со связанными таблицами имеет несколько особенностей
При изменении (редактировании) поля связи может нарушиться связь между записями двух таблиц. Поэтому при редактировании поля связи записи главной таблицы нужно соответственно корректировать и значения полей связи всех подчиненных таблиц. При удалении записи главной таблицы следует удалять и соответствующие ей записи в подчиненной таблице (каскадное удаление). При добавлении записи в подчиненную таблицу значение ее поля связи должно быть установлено равным значению поля связи главной таблицы.
Слайд 21: Бизнес-правила
Бизнес-правила представляют собой механизмы управления БД, которые, собственно, и предназначены для поддержания БД в целостном состоянии, а также для выполнения ряда других действий, например, накапливания статистики обращений к БД, и не имеют отношения к бизнесу в прямом смысле этого слова. В первую очередь, бизнес-правила реализуют ограничения БД, к которым относятся следующие: задание допустимого диапазона значений; установка значения по умолчанию; требование уникальности значения; запрет пустого значения; ограничения ссылочной целостности и др.
Слайд 23: ОБОБЩЕННАЯ ТЕХНОЛОГИЯ РАБОТЫ С БД
Технология работы с базами данных имеет несколько этапов:
Слайд 25: Построение инфологической модели
Для построения инфологической модели необходимо сделать анализ существующей базы данных, определить источник данных, посмотреть решаемые с помощью базы задачи и продумать проблемы, которые следует решать в будущем. Идентифицировав данные и задачи, которые следует решать, необходимо разделить их на группы, которые впоследствии станут таблицами БД. Студенты Дисциплины Преподаватели 1 :М Оценки 1 :М М:1
Слайд 26: Создание структуры таблиц
Имя поля Тип данных Размер поля Код студента Числовой Целое Фамилия Текстовый 15 Имя Текстовый 12 Отчество Текстовый 15 Группа Числовой Целое Телефон Текстовый 9 Стипендия Логический Да/Нет базы данных предполагает определение групп и типов данных, которые будут храниться в таблицах, задание размера полей в каждой таблице и определение общих элементов таблиц-ключей.
Слайд 27: Ввод и редактирование данных
Код Фамилия Имя Отчество Дата рожд. Должность Дисциплина Телефон 1 Истомин Ремир Евгеньевич 23.10.54 Доцент Информатика 110-44-68 2 Миронов Павел Юрьевич 25.07.40 Профессор Экономика 312-21-40 3 Гришин Евгений Сергеевич 05.12.67 Доцент Математика 260-23-65 могут производиться двумя способами: с помощью специальных форм и непосредственно в таблице без использования форм.
Слайд 28: Обработка информации
в базе данных производится путем выполнения запросов или в процессе выполнения специально разработанной программы. Запрос — это команда, формулируемая для СУБД, которая требует представить определенную, указанную в запросе информацию. Язык SQL — это структурированный язык запросов ( Structured Query Language ). Запросы являются наиболее часто используемым аспектом SQL. Все запросы в SQL конструируются на базе команды SELECT (выбор). Рис. 6 Результатом выполнения запроса является таблица с временным набором данных (динамический набор). Записи динамического набора могут включать поля из одной или нескольких таблиц. На основе запроса можно построить отчет или форму.
Слайд 29: Вывод информации
Для вывода информации из базы данных существует специальное средство — отчеты. Они позволяют: включать в отчет выборочную информацию из таблиц базы данных; • добавлять информацию, не содержащуюся в базе; • выводить итоговую информацию из базы данных; • располагать выводимую информацию в любом удобном виде; • включать в отчет информацию из разных таблиц Вывод информации
Слайд 30: Система управления базой данных
(СУБД) – программные средства, предназначенные для создания, наполнения, обновления и удаления баз данных. Различают три основных вида СУБД: промышленные универсального назначения; промышленные специального назначения; разрабатываемые для конкретного заказчика.
Слайд 31: Категории Современных бд
1. Программные продукты корпоративного направления — Oracle и MS SQL Server : должны быть надежными, что обеспечивается резервным копированием; безопасными — иметь защиту от несанкционированного доступа; работать с огромными объемами данных и обладать широкими функциональными возможностями. 2. СУБД, предназначенные для работы с информационными массивами в небольших компаниях, — MS Access и Borland Interbase : должны обладать не только надежностью и функциональностью, но и работать без выделенного сервера. 3. СУБД для Web, реализующих создание web -сайтов с небольшими базами данных, — MySQL и опять-таки Borland Interbase : присуща высокая скорость обработки данных, нетребовательность к ресурсам и удобное удаленное администрирование.
Слайд 32: СУБД Oracle
Oracle — одна из наиболее мощных современных СУБД, предназначенных для реализации баз данных уровня корпорации, что предъявляет серьезные требования к серверу. Oracle может работать в большинстве операционных систем- Windows - NT, -2000, Linux, UNIX, AIX, Nowell Netware. А это в свою очередь позволяет выбирать наиболее удобную для корпоративных задач платформу сервера. Например, если организация предпочитает использовать операционные системы не от Windows, то она легко может себе это позволить. Некоторые организации могут ориентироваться на решения на базе UNIX -систем, славящихся надежностью и устойчивостью в качестве серверной платформы, при этом продолжая использовать привычный пользователям Windows на клиентских компьютерах.
Слайд 33: СУБД MS SQL Server -2000
MS SQL Server -2000 получила широкое распространение как у нас в стране, так и зарубежом, поскольку она предлагает широкий спектр услуг администрирования и легко масштабируется. Этопозволяет использовать ее в информационных системах для среднего бизнеса и больших компьютерных информационных системах (КИС). В основе платформы MS SQL Server используется среда Windows. Главное преимущество программы — тесная интеграция с программными продуктами от Microsoft и возможность экспорта/импорта данных в большинство распространенных форматов данных, что позволяет использовать MS SQL Server как центральное Хранилище данных.
Слайд 34: СУБД Borland Interbase
Borland Interbase содержит все, что требуется от СУБД, предназначенной для нужд малого и среднего бизнеса. К тому же начиная с версии 6.0 программа стала бесплатной, что тоже существенно. Программа нетребовательна к аппаратной части — минимальная конфигурация: Pentium 100, оперативная память — 32 Мбайт, RAM (объем дисковой памяти), необходимой для хранения базы, — 50 Мбайт. Borland Interbase поддерживается платформами Windows и Linux, а также UNIX, NetBSD, FreeBSD. Borland Interbase является одной из самых быстродействующих СУБД, уступая разве что MySQL. Как существенное преимущество следует рассматривать то, что такие популярные языки программирования от Borland, как Delphi, Kylix и C ++ Builder, поставляются с компонентами, позволяющими работать с данной СУБД. Именно это позволяет достичь очень высокого быстродействия программы.
Слайд 35: СУБД MySQL
СУБД MySQL заслужила популярность, благодаря своей высокой производительности при создании Web -приложений. Она получила широкое распространение в качестве средства работы с базами данных в Интернете. Программа совершенно нетребовательна к ресурсам сервера, на котором работает, очень быстрая и к тому же совершенно бесплатная: исходные коды и дистрибутивы для различных платформ доступны на сайте в Интернете. MySQL предназначена в первую очередь для работы в сети. Изначально программа была ориентирована на операционную систему Linux, но сейчас уже существуют версии программы для операционных систем Windows, UNIX, NetBSD, FreeBSD, AIX. В последнее время программа завоевывает популярность у пользователей Macintosh с использованием операционной системой Mac OSX. И это происходит несмотря на то, что MySQL не может Похвастаться очень богатым набором возможностей.
Слайд 36: СУБД MS Access
Назначение этого широко известного программного продукта — решение локальных офисных задач с ограниченным объемом данных и формирование отчетов по результатам работы, при этом отчеты могут быть представлены в стандартном для офисных приложений виде. Большинство пользователей знают MS Access как компонент MS Office, предназначенный для работы с базами данных. Многие ли знают о его возможностях, достоинствах и недостатках? А ведь MS Access — феноменальный программный продукт, реализованный по принципу «все в одном». Он одновременно является и средой разработки на двух языках программирования ( Visual Basic и сильно усеченный диалект SQL ), и CASE -средством, а также мощным и наглядным средством создания отчетов по результатам работы.