Читайте также:
|
|
Класифікація мір
Для вимірювання інформації вводяться два параметри: кількість інформації і об'єм даних VD.
Ці параметри мають різні вирази й інтерпретацію залежно від форми адекватності. Кожній формі адекватності відповідає своя міра кількості інформації і об'єм даних (рис. 6.2).
Синтаксична міра інформації
Ця міра кількості інформації оперує із знеособленою інформацією, яка не виражає смислового відношення до об'єкта.
Розділ 6 Інформаційні системи та технології як об'єкти безпеки
Рис. 6.2. Міри інформації
Об’єм даних VD у повідомленні вимірюється кількістю символів (розрядів) у цьому повідомленні. У різних системах числення один розряд має різну вагу й відповідно міняється одиниця вимірювання даних:
• у двійковій системі числення [binary notation, binary system] одиниця вимірювання — біт (bit — binary digit — двійковий роз-
ряд);
• у десятковій системі числення [decimal notation, decimal numeration system] одиниця вимірювання — діт [dit] (десятковий
Частина II Основи безпеки інформаційних технологій
розряд).
Кількість інформації [amount of information, information content] І на синтаксичному рівні неможливо визначити без розгляду поняття невизначеності стану системи (ентропії системи). Дійсно, одержання інформації про будь-яку систему завжди зв'язане зі зміною ступеня необізнаності одержувача про стан цієї системи. Розглянемо це поняття.
Нехай до одержання інформації одержувач має деякі попередні (апріорні) відомості про систему а. Мірою його необізнаності є функція Η(α), яка в цей же час служить і мірою невизначеності стану системи.
Після одержання деякого повідомлення β одержувач здобув деяку додаткову інформацію Іβ(α), що зменшила його апріорну необізнаність так, що апостеріорна (після одержання повідомлення β невизначеність системи стала Ηβ(α).
Тоді кількість інформації Іβ(α) про систему, одержаної в повідомленні β, визначається так
,
тобто кількість інформації вимірюється зміною (зменшенням) невизначеності стану системи.
Якщо кінцева невизначеність Ηβ(α) стане рівною нулю, то первинне неповне знання заміниться повним знанням і кількість інформації Ιβ(α) = Η(α). Іншими словами, ентропія системи Η(α) може розглядатися як міра відсутньої інформації.
Ентропія системи Η(α), що має N можливих станів, відповідно до формули Шенона, дорівнює
.
де Рі — ймовірність того, що система знаходиться в i -му стані.
Для випадку, коли всі стани системи рівноймовірні, тобто їхні ймовірності рівні Рі = 1/N, її ентропія визначається співвідношенням
.
Часто інформація кодується числовими кодами в цій чи іншій системі числення, особливо це актуально при представленні інформації
Розділ 6 Інформаційні системи та технології як об'єкти безпеки
в комп'ютері. Природно, що одна й та ж кількість розрядів у різних системах числення може передавати різне число станів відображуваного об'єкта, що можна представити у вигляді співвідношення
,
де N — число можливих відображуваних станів;
m — основа системи числення (різноманіття символів, що застосовується в алфавіті;
n — число розрядів (символів) в повідомлення.
Найбільш часто використовуються двійкові й десяткові логарифми. Одиницями вимірювання будуть відповідно біт і діт.
Коефіцієнт (ступінь) інформативності (лаконічність) повідомлення визначається відношенням кількості інформації до об'єму даних, тобто
,
причому 0 < Υ < 1.
Із збільшенням Υ зменшуються об'єми роботи з перетворення інформації (даних) в системі. Тому прагнуть до підвищення інформативності, для чого розробляються спеціальні методи оптимального кодування інформації.
Семантична міра інформації
Для вимірювання смислового змісту інформації, тобто її кількості на семантичному рівні, найбільше визнання одержала тезаурусна міра, яка зв'язує семантичні властивості інформації зі здатністю користувача сприймати повідомлення, що надійшли. Для цього використовується поняття тезаурус користувача.
Тезаурус [thesaurus] — це сукупність відомостей, якими володіє користувач або система.
Залежно від співвідношення між смисловим змістом інформації S і тезаурусом користувача Sp змінюється кількість семантичної інформації Іс, що сприймається користувачем і включається ним у подальшому у свій тезаурус.
Характер такої залежності показаний на рис. 6.3.
Розглянемо два граничних випадки, коли кількість семантичної інформації Іс дорівнює нулю:
Частина II Основи безпеки інформаційних технологій
Рис. 6.3. Залежність кількості семантичної інформації, що сприймається споживачем, від його тезаурусу
• при Sp ≈ 0 користувач не сприймає, не розуміє інформації, що надійшла;
• при Sp →∞ користувач усе знає й інформація, що надійшла, йому не потрібна.
Максимальна кількість семантичної інформації Іс користувач здобуває при узгодження її смислового змісту S зі своїм тезаурусом Sp (Sp = Sp opt), коли інформація, що надходить є зрозумілою користувачеві й несе йому раніше невідомі (відсутні у його тезаурусі) відомості.
Таким чином, кількість семантичної інформації в повідомлення, кількість нових знань, одержаних користувачем, є величиною відносною. Одне й те ж повідомлення може мати смисловий зміст для компетентного користувача й бути безглуздим (семантичний шум) для користувача некомпетентного.
При оцінюванні семантичного (змістовного) аспекту інформації необхідно прагнути до узгодження величин S і Sp.
Відносною мірою кількості семантичної інформації може правити коефіцієнт змістовності С, який визначається як відношення кількості семантичної інформації до її об'єму:
.
Розділ 6 Інформаційні системи та технології як об'єкти безпеки
Прагматична міра інформації
Ця міра визначає корисність інформації (цінність) для досягнення користувачем поставленої мети. Ця міра також відносна, зумовлена особливостями використання цієї інформації в цій чи іншій системі. Цінність інформації доцільно вимірювати в тих же самих одиницях (або близьких до них), в яких вимірюється цільова функція.
Дата добавления: 2015-07-11; просмотров: 550 | Нарушение авторских прав