Организация
информационного фонда на ЭВМ с использованием баз данных
Организация
информационного фонда на ЭВМ с использованием баз данных (БД) применяется во
многих современных САПР ТП.
База
данных -
совокупность структурированных данных, используемых многими прикладными
программами и хранящихся с минимальной избыточностью.
Система
управления базой данных
(СУБД) - программный комплекс, обеспечивающий создание структуры, ввод,
модификацию, удаление и поиск данных.
Иногда
используется понятие банка данных (БнД), под которым понимается
совокупность БД и СУБД.
Самой
распространенной в настоящее время является СУБД MicrosoftAccess 2002, которая является одним из
продуктов пакета MicrosoftOffice
ХР.
Основные
требования, предъявляемые к базам данных
К
базам данных предъявляется ряд требований, среди которых можно выделить
следующие основные требования:
1.Минимальная избыточность. Каждый элемент данных вводится в
БД один раз и хранится в единственном экземпляре. При вводе данных СУБД
выполняет проверку на дублирование. Этим достигается экономия внешней памяти и
надежность информации.
2.Независимость. Модификация данных и изменения,
вносимые в их структуру в связи с появлением новых пользователей и новых запросов,
не должны отражаться на программах пользователей.
3.
Целостность данных:
-логическая (СУБД должна защищать БД от некорректных действий
пользователей путем восстановления состояния БД на момент, предшествующий
ошибочной операции);
-физическая (защита носителей информации - дисков - от сбоев
путем дублирования, например, двумя параллельно работающими зеркальными
дисками).
4.Секретность. Пользователи должны работать
только с теми данными (фрагментами данных), к которым им разрешен доступ.
Основные
понятия и основы проектирования баз данных
Начнем
с определения понятия «данные». Итак, данные - это информация, представленная в
определенной форме, пригодной для хранения и обработки на ЭВМ. Можно дать и
другое определение: данные - это представленные в цифровом виде сведения
о некоторых объектах окружающего нас мира (об объектах интересующей нас
предметной области).
При
создании любой БД разрабатывается модель данных. При этом интересующая
пользователей БД информация существует в двух представлениях:
1.Логическое представление данных.
2.Физическое представление данных на носителе
информации (диске).
Логическое
представление отражает структуру данных. Модель не содержит конкретных
значений. Она только описывает их структуру. В дальнейшем структура остается
неизменной, а данные могут меняться при вводе и редактировании информации в БД.
Для
определения модели используются следующие понятия:
•объект;
•атрибут;
•
экземпляр;
•
ключ.
В дальнейшем мы укажем на
соответствующие этим понятиям понятия, используемые при описании физического
представления данных и понятия, принятые в СУБД MicrosoftAccess.
Объект представляет собой то, о чем
накапливается информация в БД, например «сверло», «зенкер», «резец» и т.д.
Атрибуты - это интересующие пользователя
характеристики объекта. Например, для объекта «сверло» - это «обозначение»,
«диаметр», «длина общая» и т.д.
Экземпляр объекта - совокупность значений
атрибутов, описывающих конкретную его реализацию. В нашем случае это строка
таблицы.
Ключ - это атрибут, значение которого
однозначно определяет экземпляр. Так в БД по сверлам (см. ниже) ключом может
служить атрибут «обозначение», т.к. значение этого атрибута не дублируется ни в
одной строке (экземпляре). Другие атрибуты не могут быть ключом, потому что
могут принимать одинаковые значения для разных экземпляров. Например, вполне
возможны два сверла с одинаковой длиной, хотя и разного исполнения.
При
описании физического представления данных, а также в терминологии СУБД MicrosoftAccess понятию «атрибут» соответствует
понятие «поле» (столбец таблицы). Понятию «экземпляр» соответствует понятие
«запись» (строка таблицы). Объекту соответствует фрагмент файла данных или файл
данных целиком.
База
данных, состоящая из набора связанных между собой двумерных (плоских) таблиц,
называется реляционной базойданных. Данные в этих таблицах
организованы таким образом, чтобы обеспечить объединение разнородной
информации, исключить ее дублирование, а также предоставить оперативный доступ
к имеющимся сведениям и эффективное сопровождение базы данных в целом.
Реляционные
СУБД используют реляционную модель данных, предложенную в 1970 году Э.Ф-Коддом.
Если говорить упрощенно, то Кодд показал, что набор двумерных таблиц при
соблюдении определенных ограничений может быть использован для хранения данных
об объектах реального мира и моделирования связей между ними. В терминологии
Кодда такие таблицы называются отношениями (англ.relation),
вот почему подобная база данных называется реляционной.
В
реляционной базе данных, в частности, реализованной в СУБД MicrosoftAccess, для однозначного распознавания
экземпляра объекта подобно приведенному выше понятию «ключ» вводится уникальный
идентификатор - первичный ключ. Первичный ключ - это уникальная
характеристика для каждой записи в пределах таблицы. Первичный ключ таблицы
помимо однозначной идентификации записей позволяет реализовать и связи между
таблицами. Благодаря связям информация из одной таблицы становится доступной
для другой. Связи устанавливаются за счет того, что в разных таблицах
присутствуют поля с одинаковыми значениями.
1.Дублируется информация о сотрудниках, т.к.
сотрудник может участвовать в нескольких проектах.
2.В таблицу нельзя вписать тех сотрудников,
которые не заняты в проектах именно сейчас, а также сотрудников, которые вообще
не работают над проектами, иначе таблица не будет сплошной.
3.Если сотрудник увольняется, запись о нем
удаляется из таблицы, а вместе с ней - и проект, хотя работа над ним должна
продолжаться.
Данный
пример является классическим, поскольку отмеченные выше проблемы характерны для
всех сплошных файлов. Снять указанные ограничения и позволяют реляционные базы
данных. В них при проектировании таблиц и определении связей следуют
формализованной процедуре, которая называется нормализацией и опирается
на аппарат теории множеств и реляционной алгебры. Нормализация - это пошаговый
процесс замены одной таблицы другими, имеющими более простую структуру. На каждом
шаге (этапе) нормализации таблицы приводятся к некоторому определенному виду,
который называется нормальной формой.
Ввиду того, что львиная доля работы по проектированию
технологических процессов приходится на работу с данными и при этом
перерабатывается очень большое количество информации, ряд САПР ТП построено на
основе имеющихся СУБД. Это значительно облегчает создание прикладного
программного обеспечения САПР. Так, например, САПР ТП «Техно/Про» построена на
базе уже упоминавшейся СУБДMicrosoftAccess . Информация об этом мощном приложении
изложена в специальной литературе и требует отдельного изучения, что не входит
в рамки данной дисциплины. Отметим только, что физическое представление данных
на диске в данной СУБД организуется в виде одного общего файла, файла
базы данных, который имеет расширение .mdb.