Лекция по теме Технологии хранения, поиска и сортировки данных
Тема «Технологии хранения, поиска и сортировки данных»
Цель лекции: Раскрыть значение и возможности систем управления базами данных для организации и обработки больших массивов информации в автоматизированных информационных системах.
Задачи лекции:
познакомиться с терминологией баз данных;
классифицировать и охарактеризовать базы данных;
рассмотреть основные модели баз данных;
выделить основные функции системы управления базами данных;
дать характеристику основных объектов СУБД Access;
выделить основные этапы работы с базами данных.
Информационное обеспечение:
Михеева Е.В. Информационные технологии в профессиональной деятельности. Технические специальности : учебник для студ. учреждений сред. проф. Образования / Е. В. Михеева, О.И. Титова. – М.: Издательский центр «Академия», 2014.- 416 с.
http://fcior.edu.ru/ - Федеральный центр информационно-образовательных ресурсов
Содержание лекции:
Терминология: информация, данные, знания.
Классификация базы данных.
Назначение и основные компоненты систем баз данных.
Основные модели данных.
Реляционная модель данных.
Системы управления базами данных.
Проектирование и формирование базы данных в среде Access.
Информационный материал.
Терминология: информация, данные, знания
Информация – любые сведения о каком-либо событии, сущности, процессе и т.п., являющиеся объектом некоторых операций: восприятие, передача, преобразование, хранение или использование.Данные – это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения, например, находящаяся в памяти ЭВМ или подготовленная для ввода в ЭВМ.
Подготовка информации – состоит в ее формализации, сборе и переносе на машинные носители.
Обработка данных – это совокупность задач, осуществляющих преобразование массивов данных. Обработка данных включает в себя ввод данных в ЭВМ, отбор данных по каким-либо критериям, преобразование структуры данных, перемещение данных на внешней памяти ЭВМ, вывод данных, являющихся результатом решения задач, в табличном или в каком-либо ином удобном для пользователя виде.
Система обработки данных (СОД) – это набор аппаратных и программных средств, осуществляющих выполнение задач по управлению данными.
Управление данными – совокупность функций обеспечения требуемого представления данных, их накопления и хранения, обновления, удаления, поиска по заданному критерию и выдачи данных.
Предметная область – часть реального мира, подлежащая изучению с целью организации управления и, в конечном итоге автоматизации.
База данных (БД) – совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ. Эти данные относятся к определенной предметной области и организованы таким образом, что могут быть использованы для решения задач многими пользователями.
Введение базы данных – деятельность по обновлению, восстановлению и изменению структуры базы данных с целью обеспечения ее целостности, сохранности и эффективности использования.
Система управления базами данных (СУБД) – это совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами.
Автоматизированная информационная система (АИС) представляет собой совокупность данных, экономико-математических методов и моделей, технических, программных средств и специалистов, предназначенную для обработки информации и принятия управленческих решений.
Банк данных (БнД) - это автоматизированная информационная система, включающая в свой состав комплекс специальных методов и средств (математических, информационных, программных, языковых, организационных и технических) для поддержания динамической информационной модели предметной области с целью обеспечения информационных запросов пользователей.
Классификация баз данных
Развитие средств вычислительной техники и информационных технологий обеспечило возможности для создания и широкого применения автоматизированных информационных систем (АИС) разнообразного назначения. Разрабатываются и внедряются информационные системы управления хозяйственными и техническими объектами, модельные комплексы для научных исследований, системы автоматизации проектирования и производства, всевозможные тренажеры и обучающие системы.
Технологии баз данных одна из наиболее востребованных технологий в практической разработке информационных систем, сформирована широкая сфера самых разнообразных приложений систем баз данных. Обычно БД создается для хранения и доступа к данным из некоторой предметной области.
Под автоматизированной информационной системой (АИС) понимают совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации. АИС, основанная на базе данных, служит для сбора, накопления, хранения информации, а также ее эффективного использования для различных целей. Информация представляется в виде данных, хранимых в памяти ЭВМ.
По сферам применения и правилам организации различают два основных класса АИС, основанных на базе данных: информационно-поисковые (ИПС) и системы обработки данных (СОД).
ИПС ориентированы, как правило, на извлечение подмножества хранимых данных, удовлетворяющих некоторому поисковому критерию. Пользователя ИПС интересует, в основном, сами извлекаемые из базы данных сведения, а не результаты их обработки. Примером ИПС является любая справочная служба: к ней обращаются с запросом и получают в результате те данные, которые удовлетворяют этому запросу.
Обращения пользователя к СОД чаще всего приводят к обновлению данных. Вывод данных может вовсе отсутствовать или представлять собой результат программной обработки хранимых сведений. Пример СОД – банковские системы, осуществляющие открытие\закрытие счетов, пересчет вкладов в зависимости от процентов, прием\снятие сумм и т.п.
В зависимости от характера информационных ресурсов, с которыми имеют дело АИС, их подразделяют на документальные и фактографические. На практике используются также системы комбинированного типа.
Фактографические АИС хранят сведения об объектах предметной области, их свойствах и взаимосвязях. Сведения о каждом объекте могут поступать в систему из множества различных источников. Кроме поиска и модификации данных, фактографические системы поддерживают статистические функции (нахождение суммы, минимума, максимума и т.п.). Фактографические АИС обычно принадлежат к классу систем обработки данных.
В документальной системе объект хранения – документ, который содержит информацию, относящуюся к определенной предметной области. Это могут быть графические изображения (например, географические карты): информация на естественном языке (монографии, тексты законодательных актов, научные отчеты и т.п.); звуковая информация (например, мелодии для системы, хранящей фонотеку) и т.д. Для обработки данных не важно, какие сведения хранятся в документах. Обычно (но не всегда) документальные АИС реализуются в виде информационно-поисковых систем (ИПС).
Назначение и основные компоненты систем баз данных
Система БД включает два основных компонента: собственно базу данных и систему управления базами данных – СУБД (рисунок 3.1.). Большинство СОД включают также программы обработки данных (прикладное программное обеспечение), которые обращаются к данным через СУБД.
Рисунок 3.1. Компоненты системы баз данных
Таким образом, обращение к базе данных возможно только через СУБД. База данных предназначена для хранения данных информационной системы. Пользователи обращаются к базе данных обычно не напрямую через средства СУБД, а с помощью внешнего интерфейса – приложения, входящего в состав АИС. Основной характеристикой баз данных является совместное использование данных многими пользователями.
Основные модели данных
Модель данных - является фундаментом технологий баз данных; на ней базируется конкретная СУБД. Модель описывает набор понятий и признаков, которыми должна обладать конкретная СУБД и управляемые ими базы данных, если они основываются на этой модели. Создавая базу данных, необходимо упорядочить информацию по различным признакам для того, чтобы потом извлекать из нее необходимые данные в любом сочетании. Сделать это возможно, только если данные структурированы. Структура данных упорядочивает элементы информации и описывает их взаимосвязи.
Модель данных – это совокупность правил прохождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значение данных, последовательность их изменения.
История создания и развития СУБД насчитывает около сорока лет. За этот период были разработаны многочисленные модели данных, прежде всего это сетевые, иерархические и реляционные модели данных. Сетевые и иерархические модели в настоящее время считаются устаревшими, но существует множество баз данных созданных на их основе и требующих поддержания их работы.
Сетевая модель БД - модель, в которой принята свободная связь между элементами разных уровней. Сетевая модель позволяет организовывать БД, структура которых представляется графом общего вида. Сетевая база данных является обобщением иерархической, в которой каждый элемент вышестоящего уровня может быть связан одновременно с любым элементом следующего уровня. На связи между объектами в сетевых моделях не накладывается никаких ограничений. Пример сетевой базы данных приведён на рисунке 4.1.
Рисунок 4.1. Пример фрагмента сетевой базы данных
Сетевой базой данных фактически является «всемирная паутина» сети Интернет. Гиперссылки связывают собой сотни миллионов документов в единую сетевую базу данных.
Иерархическая модель позволяет строить БД с иерархической древовидной структурой. В основе иерархической модели лежит понятие дерева. Дерево – это связный неориентированный граф, который не содержит циклов. При работе с деревом выделяют какую-то конкретную вершину, определяют её как корень дерева и рассматривают особо – в эту вершину не заходит ни одно ребро. В этом случае дерево становится ориентированным, ориентация определяется от корня. Иерархическая база данных по своей структуре соответствует иерархической файловой системе.
В иерархических моделях данных используется ориентация древовидной структуры от корня к листьям. Поиск данных в таком случае может осуществляться последовательным «спуском» с одного уровня на другой Пример иерархической базы данных приведён на рисунке 4.2.
Рисунок 4.2. Пример фрагмента иерархической базы данных
Реляционная модель данных
Реляционная модель данных была предложена в 1970 г. математиком Эдгаром Коддом. Широкое распространение реляционной модели объясняется в первую очередь простотой представления и формирования базы данных, универсальностью и удобством обработки данных, которая осуществляется с помощью декларативного языка запросов SQL.
Реляционная модель БД (от английского “ relation” - отношение) представляет собой одну или несколько взаимосвязанных двумерных таблиц, разбитых на строки и столбцы, на пересечении которых расположены данные. Столбцы таблицы называют полями. Каждое поле содержит значения определенного свойства и характеризуется своим именем и типом данных. Строки таблицы являются записями об объекте и содержат набор значений свойств, принадлежащих одному объекту. Записи разбиты на поля столбцами таблицы, поэтому каждая запись представляет набор значений, содержащихся в полях. Ключевое поле (первичный ключ) – это поле (совокупность полей), которое однозначно определяет каждую запись в таблице, т.е. не повторяется у разных записей (простой, составной). Пример реляционной базы данных приведен на рисунке 5.1.
Рисунок 5.1. Пример фрагмента реляционной базы данных
Системы управления базой данных
Развитие информационных технологий привело к созданию компьютерных баз данных. Взаимодействие с базой данных происходит при помощи системы управления базами данных (СУБД), которая расшифровывает запросы пользователя и производит операции с информацией в базе данных. Система управления базами данных – это важнейший компонент АИС, основанный на базе данных. СУБД необходима для создания и поддержки базы данных информационной системы. Программные составляющие СУБД включают в себя ядро и сервисные средства (утилиты).
Ядро СУБД – это набор программных модулей, необходимый и достаточный для создания и поддержания БД, то есть универсальная часть, решающая стандартные задачи по информационному обслуживанию пользователей. Сервисные программы предоставляют пользователям ряд дополнительных возможностей и услуг, зависящих от описываемой предметной области и потребностей конкретного пользователя.
Системой управления базами данных называют программную систему, предназначенную для создания на ЭВМ общей базы данных для множества приложений, поддержания её в актуальном состоянии и обеспечения эффективного доступа пользователей к содержащимся в ней данным в рамках предоставленных им полномочий.
СУБД описывает логическую структуру БД, её организацию в среде хранения и пользовательские представления данных (соответственно концептуальную схему БД, схему хранения и внешние схемы). Обрабатывая эти схемы, СУБД создаёт пустую БД требуемой структуры и предоставляет средства для наполнения её данными предметной области и дальнейшей эксплуатации.
Система управления базой данных (СУБД) – это языковые и программные средства для организации, пополнения, модификации и использования баз данных. В мире существует множество систем управления базами данных. Несмотря на то, что они могут по-разному работать с разными объектами и предоставляют пользователю различные функции и средства, большинство СУБД опираются на единый устоявшийся комплекс основных понятий.
Различают универсальные и специализированные СУБД. Универсальные СУБД являются системами широкого профиля и не имеют четко очерченных границ применения, а специализированные создаются для БД конкретного назначения: банковских, бухгалтерских и т. д. Специализированные СУБД в наибольшей степени учитывают специфику предметной области, что отражается в интерфейсе и процедурах обработки информации.
СУБД организует хранение информации таким образом, чтобы ее было удобно:
просматривать,
пополнять,
изменять,
искать нужные сведения,
делать любые выборки,
осуществлять сортировку в любом порядке.
В связи с распространением сетевых технологий, от современных СУБД требуется возможность работы с отдаленными и распределенными ресурсами, которые находятся на серверах Интернета.
Проектирование и формирование базы данных в среде AccessMicrosoft Access - высокопроизводительная система управления реляционными базами данных, которая входит в состав профессиональной версии интегрированного пакета Microsoft Office (Access в переводе с английского означает «доступ»). СУБД Access поддерживает реляционную модель представления данных и функционирует под управлением операционных систем Windows, используется для разработки настольных баз данных, обеспечивает обработку, сортировку и поиск данных.
Основными функциями СУБД Access являются:
создание пустой структуры базы данных;
наличие средств ее заполнения или импорта данных из таблиц другой базы;
возможность доступа к данным;
наличие средств поиска и фильтрации.
Основные типы данных: текстовый, числовой, дата/время, счетчик (вводится автоматически с вводом каждой записи), поле объекта OLE (содержит рисунки, звуковые файлы, таблицы Excel, документы Word и т.д.).
СУБД Access работает с объектами, к которым относятся таблицы, запросы, формы, отчеты, макросы и модули. Все связанные между собой объекты организованы в один файл, называемый базой данных. Основные разделы главного окна соответствуют типам объектов, которые может содержать база данных Access. Это Таблицы, Запросы, Формы, Отчеты, Макросы и Модули.
Таблица – это основной объект любой базы данных, предназначенный для хранения данных в виде записей (строк) и полей (столбцов). Обычно каждая таблица используется для хранения сведений по одному конкретному вопросу. Таблицы хранят структуру БД (поля, их типы и свойства) и все данные, имеющиеся в БД.
Форма - это объект, предназначенный для ввода данных, позволяющий отображать данные в удобном для восприятия виде. В форме можно разместить элементы управления, применяемые для ввода, изображения и произвести изменения данных в полях таблицы.
Запрос – это объект, позволяющий получить нужные данные по определенным условиям из одной или нескольких таблиц. С помощью запросов выполняют такие операции как отбор данных, их сортировку и фильтрацию.
Отчет – это объект базы данных, предназначенный для печати данных, содержащихся в таблицах и запросах, с использованием элементов оформления.
Макросы - это объект базы данных, предназначенный для автоматизации повторяющихся операций.
Модули - служат для автоматизации работы с базой данных.
Интерфейс работы с объектами базы данных унифицирован. По каждому из них предусмотрены стандартные режимы работы:
Создать – предназначен для создания структуры объектов.
Конструктор – предназначен для изменения структуры объектов.
Открыть – предназначен для работы с объектами базы данных.
Важным средством, облегчающим работу с MS Access для начинающих пользователей, являются мастера – специальные программные надстройки, предназначенные для создания объектов базы данных в режиме последовательного диалога. Для опытных пользователей существуют возможности более гибкого управления ресурсами и возможностями объектов СУБД в режиме конструктора. Специфической особенностью СУБД MS Access является то, что вся информация, относящаяся к одной базе данных, хранится в едином файле. Такой файл имеет расширение “.mdb”.
Основные этапы работы с базами данных в среде MS Access:
1-й этап - проектирование БД. Процесс формирования базы данных в виде таблицы включает создание структуры, т.е. полей из которых будет состоять каждая запись. Определяются имя, тип (текстовый, числовой, логический, объект OLE и др.), размер полей. Кроме того СУБД формирует записи специального типа, содержащие уникальные номера - ключи, с помощью которых можно организовывать связь между таблицами.
2-й этап - наполнение БД содержимым. Осуществляется ввод и редактирование данных. СУБД дает возможность создать с помощью мастера экранную форму окна с кнопками, полями для ввода, т.е. создать удобный пользовательский интерфейс.
3-й этап - визуализация информации. Отбор отображаемых данных в соответствии с заданным критерием, их упорядочение, оформление и последующая выдача на устройства вывода или передачи по каналам связи. Пользователь получает удобное средство для обработки данных – запрос и использовать фильтрацию записей в базе данных. СУБД позволяет пользователю вывести на принтер необходимую информацию в виде отчета, в который можно включить: выборочную информацию из таблицы, новую информацию, информацию из других таблиц.
Терминологический словарь:
Автоматизированная информационная система (АИС) - совокупность программно-аппаратных средств, предназначенных для автоматизации деятельности, связанной с хранением, передачей и обработкой информации. База данных (БД) – совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными.
Введение базы данных – деятельность по обновлению, восстановлению и изменению структуры базы данных с целью обеспечения ее целостности, сохранности и эффективности использования.
Данные – это информация, зафиксированная в некоторой форме, пригодной для последующей обработки, передачи и хранения,
Запрос – объект, предназначенный для извлечения данных из таблиц на основе заданных условий.
Иерархическая модель БД – данные представлены в виде древовидной структуры, состоящей из объектов различных уровней.
Макросы - это объект базы данных, предназначенный для автоматизации повторяющихся операций.
Модель данных – это совокупность правил прохождения структур данных в базе данных, операций над ними, а также ограничений целостности, определяющих допустимые связи и значение данных, последовательность их изменения.
Отчет – объект, предназначенный для печати данных, содержащихся в таблицах и запросах, с использованием элементов оформления.
Реляционная модель БД (от английского “ relation” - отношение) – модель, представленная в виде одной или нескольких взаимосвязанных двумерных таблиц.
Сетевая модель БД - модель, в которой принята свободная связь между элементами разных уровней.
Система управления базами данных (СУБД) – это совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами.
Фильтрация (выборка) данных – способ отображения данных в таблице, которые отвечает заданному условию или нескольким условиям.
Форма – объект, предназначенный для ввода данных, позволяющие отображать данные в удобном для восприятия виде.
Контрольные вопросы:
Как можно классифицировать базы данных?
В чем состоит разница между терминами «база данных» и «система управления базами данных»?
Чем различаются между собой реляционные, иерархические и сетевые базы данных? Приведите примеры.
Какова структура реляционных баз данных?
Какие программные средства обеспечивают работу с базами данных?
Что входит в функции современных СУБД?
Какие этапы выделяют при работе с базами данных?
Что понимается под проектированием базы данных?