Лекцій 1. Основи теорії реляційних баз даних
Тема: " Основи теорії реляційних баз даних ".
Предметною областю зветься будь-яка область життєдіяльності людини, об'єкти якої можна представити як інформаційну модель даних, описати її в термінах інформатики і вести облік цих об'єктів за допомогою обчислювальної техніки.
Моделлю, або схемою даних, зветься формальний опис даних з вказівкою зв'язків між ними. Тип моделі даних визначається трьома компонентами:
- способом представлення і організації даних;
- способами доступу до даних і методами їх опрацювання;
- способами захисту даних від руйнації.
Типи зв'язків між об'єктами:
- один-до-одного;
- один-до-багатьох;
- багато-до-багатьох.
Базою даних зветься структурований набір інформації, який описує об'єкти предметної області з урахуванням зв'язків між ними. База даних розміщується на носіях зовнішньої пам'яті комп'ютера. Доступ до даних і маніпуляція ними здійснюються спеціально написаною для цього програмою.
Історія розвитку баз даних.
- Банки даних або інформаційно-пошукові системи (ІПС) – Банк даних (БнД) - це система спеціально організованих даних, програмних, мовних, організаційних та технічних засобів, призначених для централізованого накопичення та колективного багатоцільового використання даних. Дані знаходилися в окремих непов'язаних між собою файлах. Кожним з таких файлів керувала окрема виконавча програма. Банки даних характеризувалися надлишковістю і неоднозначністю інформації.
- Бази даних – дані знаходилися в файлах, пов'язаних між собою. Всіма ними керує одна виконавча програма. Бази даних характеризуються інформаційною однозначністю і відсутністю інформаційної надлишковості.
- Бази знань – дані обираються не тільки за вказівкою певного критерію, а й за аналізом певної ситуації. Використовуються в експертних системах та системах штучного інтелекту.
Рівні представлення баз даних.
Будь-яку базу даних можна розглядати на трьох рівнях:
- Нижній або фізичний рівень реалізації бази даних – на цьому рівні дані представлені як набір файлів на зовнішніх носіях інформації. Файли бувають: послідовного доступу, прямого доступу і індексовані. Індекси це невеликі позначки, які приписуються до полів інформаційних записів файлів, що дозволяє сортувати записи за проіндексованими полями без фізичного переміщення записів на дисках.
- Середній або концептуальний рівень. На цьому рівні будується інфологічна (інформаційно-логічна) модель даних, яка описує найбільш загальні властивості об'єктів і зв’язки між ними. Інфологічна модель орієнтована на організацію робочих місць з використанням обчислювальної техніки, на опис функціональних завдань на відповідних робочих місцях, на обіг і використання первинних (вхідних) і звітних (вихідних) документів, на відповідні права доступу користувачів.
- Верхній рівень або рівень кінцевого користувача. На ньому будується датологічна модель даних, яка представляє дані з точки зору кінцевого користувача. Ця модель описує назви, типи і розміри інформаційних полів вхідних (первинних) та вихідних (звітних) документів.
Типи баз даних.
Тип бази даних залежить від моделі даних, яка лежить в її основі. Існує три типи баз даних: мережна, ієрархічна і реляційна.
- Мережна база даних. В цій БД доступ до інформаційних об'єктів може здійснюватися через будь-які інші об'єкти. Така БД враховує будь-які типи зв'язків. Даний термін не пов'язаний із розміщенням інформації бази даних на носіях різних комп'ютерів у мережі. Бази даних, у яких дані зберігаються на зовнішніх носіях різних комп'ютерів, називаються розподіленими базами даних.
- Ієрархічна база даних має чітко визначену інформаційну ієрархію. Доступ до інформаційних об'єктів може здійснюватися лише певним шляхом, починаючи з об’єкту верхнього рівня. Зв'язків між об’єктами одного рівня, тобто зв'язків багато-до-багатьох, не існує.
- Реляційна база даних розміщує інформацію у таблицях. Якщо вся інформація міститься в одній таблиці – це "плоска БД", якщо інформація міститься в декількох пов'язаних між собою таблицях, то це "розширена БД". Умови встановлення зв'язку між таблицями:
- назви полів можуть бути довільними;
- типи полів повинні обов'язково співпадати;
- розміри полів, бажано, повинні співпадати, інакше може відбутися втрата інформації у вихідній документації.
Термінологія реляційних БД.
Кінцевий користувач |
Програміст |
Теорія БД |
Таблиця |
Таблиця або файл |
Відношення |
Стовпчик (графа) |
Поле |
Атрибут |
Рядок |
Запис |
Кортеж |
Значення |
Дане |
Домен |
Атрибут – це властивість, яка притаманна будь-якому об'єкту у відношенні.
Кортеж – це набір атрибутів, який повністю описує об’єкт у відношенні.
Ключ – це атрибут або набір атрибутів, який дозволяє однозначно визначити кортеж у відношенні (рядак у таблиці).
Фільтр – це умова, яка накладається на атрибут або декілька атрибутів, з метою вибору частини кортежів з їх загальної кількості у відношенні.