Читайте также:
|
|
При передаче и хранении информации с помощью различных технических устройств информацию следует рассматривать как последовательность знаков (цифр, букв, кодов цветов точек изображения), не рассматривая ее содержание.
Алфавит — упорядоченный набор символов, используемый для кодирования сообщений на некотором языке.
Мощность алфавита — количество символов алфавита. (двоичный алфавит содержит 2 символа, его мощность равна двум).
Сообщения, записанные с помощью символов ASCII, используют алфавит из 256 символов. Сообщения, записанные по системе UNICODE, используют алфавит из 65 536 символов.
Алфавитный подход - объективный подход к измерению информации. Он удобен при использовании технических средств работы с информацией, т.к.
· Не зависит от содержания сообщения.
· Кол-во информации зависит от объема текста и мощности алфавита.
· Информационная емкость знаков определяется их количеством в алфавите. Чем из большего количества символов состоит алфавит, тем большее количество информации несет один знак.
Чтобы определить объем информации в сообщении при алфавитном подходе, нужно последовательно решить задачи:
Семантическая мера информации используется для измерения смыслового содержания информации. Наибольшее распространение здесь получила тезаурусная мера, связывающая семантические свойства информации со способностью пользователя принимать поступившее сообщение.
Тезаурус — это совокупность сведений, которыми располагает пользователь или система.
Максимальное количество семантической информации потребитель получает при согласовании ее смыслового содержания со своим тезаурусом, когда поступающая информация понятна пользователю и несет ему ранее не известные сведения.
Иными словами, количество информации, извлекаемой получателем из поступающих сообщений, зависит от степени подготовленности его тезауруса для восприятия такой информации.
В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации I c, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 1.
Рис. 1. Зависимость количества семантической информации, воспринимаемой потребителем,
от его тазауруса Ic = f (S p)
Рассмотрим два предельных случая, когда количество семантической информации I c равно нулю:
· при S p = 0 пользователь не воспринимает (не понимает поступающую информацию;
· при S p à µ пользователь «все знает», и поступающая информация ему не нужна.
Максимальное количество семантической информации потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом S p (S p = S p opt), когда поступающая информация понятна пользователю и несет ему ранее неизвестные (отсутствующие в его тезаурусе) сведения.
Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.
При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и S p.
Относительной мерой семантической информации может служить коэффициент содержательности C, который определяется как отношение количества семантической информации к ее объему:
Еще один подход к семантическим оценкам информации, заключается в том, что в качестве основного показателя семантической ценности информации, содержащейся в анализируемом сообщении, принимается количество ссылок на него в других документах. Конкретные показатели формируются на основе статистической обработки количества ссылок в различных выборках.
Прагматическая мера информации определяет ее полезность, ценность для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе.
Для сопоставления введенные меры информации представим в табл. 2.1.
Таблица 1. Единицы измерения информации и примеры
Мера информации | Единицы измерения | Примеры (для компьютерной области) |
Синтаксическая: Шенноновский подход Компьютерный подход | Степень уменьшения неопределенности Единицы представления информации | Вероятность события Бит, байт, Кбайт и т.д. |
Семантическая: | Тезаурус Экономические показатели | Пакет прикладных программ, персональный компьютер, компьютерные сети и т.д. Рентабельность, производительность, коэффициент амортизации и т.д. |
Прагматическая: | Ценность использования | Емкость памяти, производительность компьютера, скорость передачи данных и т.д. Денежное выражение. Время обработки информации и принятия решений. |
Дата добавления: 2015-07-11; просмотров: 189 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Меры количества информации | | | Системы кодирования. |