Человек воспринимает информацию из внешнего мира с помощью своих органов чувств. Большая часть информации принимается нами через зрение и слух. Органы слуха воспринимают звуковые сигналы, органы

1.4. Кодирование

Информация и сигналы

Человек воспринимает информацию из внешнего мира с помощью своих органов чувств. Большая часть информации принимается нами через зрение и слух. Органы слуха воспринимают звуковые сигналы, органы зрения воспринимают световые сигналы.

Сигнал переносит информацию, представленную в виде значения или

изменения значения физической величины.

Звуковой сигнал связан с изменением давления воздуха, порождённым

звуковой волной и воздействующим на орган слуха. Световые сигналы, воспринимаемые нашим зрением, — это электромагнитные волны в определённом диапазоне частот — диапазоне видимого света.

Различают два вида сигналов: непрерывные и дискретные. Например,

звук — это непрерывный волновой процесс, происходящий в атмосфере или другой сплошной среде. Непрерывный электрический сигнал в технических системах передачи и обработки информации называют аналоговым сигналом. Термин «дискретный» означает «разделённый», состоящий из отдельных частиц, элементов. При цифровой передаче и обработке информации используются дискретные сигналы.

А	А	• —	L	Л	------ с	ц	— ■ —.
В	Б	—...	М	м	______		ч	-------------.
W	В	■ ^^к ^^к	N	н	—		ш	-------------------
G	Г	---------.		о	-------------	Q	щ	---------. —
D	Д	^^к * *	Р	п	* ^^м ^^м *		ъ	- * _ ^^_ * _а___
Е	Е	•	К	р	* ^^н *		1,1
V	Ж	----------	S	с	• • ■	X	ь
Z		— ^^— •»	т	т	—		э -
I	И	• *	и	У	* * H-1-t		ю -
J	Й	• —^ ^^_ —^	F	ф	.. —.		я - 1____________
к	К		Н	X	* * • *

Рис. 1.7. Кодовая таблица азбуки Морзе

бумажной ленте в виде графических точек, тире и пробелов, которые визуально прочитывал телеграфист.

Азбука Морзе является неравномерным кодом, поскольку у разных букв алфавита длина кода разная — от одного до шести символов (точек и тире). По этой причине необходим третий символ — пауза для отделения букв друг от друга.

Равномерный телеграфный код был изобретён французом Жаном Морисом Бодо в 1870 году. В нём использовалось всего два разных вида сигналов. Неважно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала. В кодовой таблице Бодо длина кодов всех символов алфавита одинакова и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятёрка сигналов — это знак текста.

Благодаря идее Бодо, удалось автоматизировать процесс передачи и печать букв. В 1901 году был создан клавишный телеграфный аппарат. Нажатие клавиши с определённой буквой вырабатывает соответствующий пятиимпульсный сигнал, который передаётся по линии связи. Принимающий аппарат под воздействием этого сигнала печатает ту же букву на бумажной ленте.

Следующим важным событием в технике связи стало изобретение телефона. В 1876 году американец Александр Белл получил патент на его изобретение. Годом позже Томас Э. Эдисон изобрёл телефонный аппарат с угольным микрофоном, который можно встретить до сих пор. По телефонной связи на расстояние передается звук посредством непрерывного электрического сигнала, модулированного с частотой звуковых колебаний. В микрофоне говорящего человека создается переменное электрическое напряжение, а в наушнике слушающего оно преобразуется в звуковые колебания.

Телефонная связь — это аналоговый способ передачи. звука.

Благодаря открытию в 1888 году Генрихом Герцем электромагнитных волн стало возможным изобретение радиосвязи. Почти одновременно в 1895 году Александр Попов в России и в 1896 году итальянец Г. Маркони изобрели первые радиопередатчики и радиоприёмники. Современники изобретения называли радио беспроводным телефоном. Принцип передачи звука по радиосвязи заключается в переносе через пространство высокочастотных (несущих) электромагнитных волн, модулированных по амплитуде низкочастотными звуковыми колебаниями. В радиоприёмнике звуковые колебания отделяются от несущей частоты и преобразуются в звук.

Радиосвязь — это аналоговый способ передачи звука.

В XX веке с изобретением телевидения стала возможной передача на расстояние изображения. Телевизионный электромагнитный сигнал — это также аналоговый способ передачи звуковой и видеоинформации.

Во второй половине XX века происходит переход к преимущественно дискретной форме представления информации для её хранения, передачи и обработки. Этот процесс начался с изобретением цифровой вычислительной и измерительной техники. В настоящее время компьютерная обработка становится элементом всех систем связи: телефонной, радио и телевизионной. Развивается цифровая телефония, цифровое телевидение. Интернет как универсальная система связи основан исключительно на дискретной цифровой технологии хранения, передачи и обработки информации.

Система основных понятий

Информация и сигналы
Сигнал переносит информацию, представленную в виде значения или изменения значения физической величины
Аналоговый сигнал: непрерывный сигнал	Дискретный сигнал — состоящий из отдельных (отличимых друг от друга) элементов
Аналоговые способы передачи информации	Дискретные способы передачи информации
Технические средства	Время изобретения	Технические средства	Время изобретения
Телефон	1876 год	Телеграф Морзе	1837 год
Радио	1895 год	Телеграф Бодо	1870 год
Телевидение	1930-е годы	Цифровые технологии связи; электронная почта, цифровая \ телефония, цифровое телеви- i дение, Интернет	Вторая половина XX века

Кодирование

текстовой

информации

Что такое кодирование

Чтобы информацию можно было хранить, передавать и обрабатывать, её нужно представить в удобной для этого форме.

Кодирование — это процесс представления информации в виде последовательности условных обозначений. Кодом называют множество слов — последовательностей символов из некоторого алфавита, используемых при кодировании информации.

Кодирование происходит по определённым правилам. Правила кодирования зависят от назначения кода, т. е. от того, как и для чего он будет использоваться.

Письменность — это способ кодирования устной речи на естественном языке. Письменный текст предназначен для передачи информации от одного человека к другим людям как в пространстве (письмо, записка), так и во времени (книги, дневники, архивы документов и пр.). Правила, по которым люди осуществляют письменное кодирование информации, называются грамматикой языка (русского, английского, китайского и др.), а человека, умеющего читать и писать, называют грамотным чело-веком.

Запись речи — кодирование, а чтение письменного текста — это его де* кодирование. Процесс письменного обмена информацией между людьми можно отобразить следующей схемой:

С изобретением технических средств связи появилась возможность быстрой передачи текстов на большие расстояния. Но этот процесс требует использования дополнительного уровня кодирования. Повторим ещё раз данное выше утверждение: способ кодирования зависит от назначения кода. Если код предназначен для передачи текста по технической системе связи, то он должен быть приспособлен к возможностям этой системы. Примером такого «технического» кода является азбука Морзе.

Процесс передачи телеграфного сообщения с использованием азбуки Морзе можно отразить следующей схемой:

Кодирование текста всегда происходит по следующему правилу: каждый символ алфавита исходного текста заменяется на комбинацию символов алфавита кодирования. Для азбуки Морзе эти правила представлены на рис. 1.7.

В таблице азбуки Морзе для кодирования 32 букв русского алфавита (буква Ё стала использоваться в письменном тексте только в середине XX века) применяются два символа: точка и тире. Однако при передаче слов из-за неравномерности кодов различных букв приходится применять ещё пропуск между буквами: пауза во времени передачи или пробел на телеграфной ленте. Поэтому фактически алфавит телеграфного кода Морзе содержит три символа: точка, тире, пропуск. Это троичный код.

Телеграфный код Бодо является двоичным равномерным пятиразрядным кодом. На его основе в 1932 году был разработан международный телеграфный код IT А2, кодовая таблица которого представлена на рис. 1.8.

Двоичные коды символов свернуты в формат двузначных шестнадцате-ричных чисел, в которых первая цифра — это 0 или 1. Есть три типа сим-

волов: буквы (letters), цифры и знаки (figures), управляющие символы (control chars). Переключение в режим ввода букв происходит по коду 1F₁₆ (двоичная форма 1 1111). Буква А имеет код 03₁₆ (О ООН); код буквы R — 0А₁₆ (0 1010). Этот же код в режиме ввода цифр обозначает цифру 4. Слово BODO в шестнадцатеричной форме кодируется так: 19 18 09 18. Длина двоичного кода этого слова равна 20.

Во второй половине XX века создаются и распространяются компьютеры. Для компьютерной обработки текстов потребовалось создать стандарт кодирования символов. В 1963 году был принят стандарт, который получил название ASCII — Американский стандартный код для информационного обмена. ASCII — семиразрядный двоичный код, представлен в табл. 1.4.

Кодировка ASCII

.'■'

.с

NUL

SOH

STX

ЕТХ

EOT

ENQ

AC К

BEL

TAB

DLE

DC1

DC2

DC3

DC 4

NAK

SYN

ETB

CAN

SUB

ESC

■

(

;

[

б.

{

DEL

Код символа — это его порядковый номер в кодовой таблице, определяется номером строки и столбца. Он может быть представлен в десятичной, в двоичной и в шестнадцатеричной системах счисления. Код в памяти компьютера — семиразрядное двоичное число. В табл. 1.4 код ASCII пред-итсшлеы ** свернутой шестнадцатеричной форме. При развёртывании в двоичную форму коды представляют собой семиразрядные целые двоичные числа в диапазоне от 668 6666₂ = 66_1б = б до Ш 11Н,- 7F_!6 = 127. Всего с помощью этого кода представляются 2 = 128 символов.

Первые 32 символа (от 00 до IF) называются управляющими символами. Они не отражаются какими-либо знаками на экране монитора или при печати, но определяют некоторые действия при выводе текста. Например, по коду 08_ie (BS) происходит стирание предыдущего символа; по коду 07₁₆ (BEL) — вывод звукового сигнала; код OD_I₆ (CR) означает переход к началу строки (возврат каретки). Эти символы унаследованы ещё от кодировки для телетайпной связи, для которой первоначально использовался ASCII, поэтому сохранились такие архаичные термины, как «каретка».

Символы, имеющие графическое отображение, начинаются с кода 20₁₆. Это код пробела — пропуска позиции при выводе. Важным свойством таблицы ASCII является соблюдение алфавитной последовательности кодировки прописных и строчных букв, а также десятичных цифр. Это свойство чрезвычайно важно для программной обработки символьной информации, в частности для алфавитной сортировки слов.

Расширение кода ASCII* Восьмиразрядная двоичная кодировка позволяет кодировать алфавит из 2⁸ = 256 символов. Первая половина восьмиразрядного кода совпадает с ASCII. Вторая половина состоит из символов с кодами от 128 = 80₁₆ = 1000 0000₂ до 255 = FF₁₆ -1111 ПП₂. Эта часть таблицы кодировки называется кодовой страницей (СР — code page). На кодовой странице размещают нелатинские алфавиты, символы псевдографики и некоторые другие знаки, не входящие в первую половину.

В табл. 1.5—1.7 приведены кодовые страницы с русским алфавитом. СР866 используется в операционной системе MS DOS, СР1251 — в операционной системе Windows. Кодировка KOI8-R используется в операционной системе Unix.

Обратите внимание на то, что не во всех кодировках соблюдается правило последовательного кодирования русского алфавита. Существуют и другие стандарты символьной кодировки, где присутствует русский алфавит.

16-разрядный стандарт UNICODE. В 1991 году был разработан шестнадцатиразрядный международный стандарт символьного кодирования Unicode, который позволяет закодировать 2¹⁶ = 65536 символов. В такую кодовую таблицу помещаются английский (латиница), русский (кириллица), греческий алфавиты, китайские иероглифы, математические символы и многое другое. Отпадает потребность в кодовых страницах. Диапазон кодов символов в шестнадцатеричной форме: от 0000 до FFFF.

В начале кодовой таблицы, в области от 0000₁₆ до 007F₁₆, содержатся символы ASCII. Под символы кириллицы выделены области знаков с кодами от 0400₁₆ до 052F₁₆, от 2DE0₁₆ до 2DFF₁₆, от А640₁₆ до A69F₁₆.

Позднее стали разрабатываться новые стандарты на Unicode. К 2010 году сменилось 6 вариантов стандарта. Благодаря более сложной организации кода, при сохранении его 16-разрядности появилась возможность кодировать 1112 064 символа. В настоящее время из этого количества реально используется около 107 тысяч кодов.

Учимся программировать

(обработка символьной информации)

Рассмотрим программу на Паскале, по которой на экран будет выводиться таблица кодировки в диапазоне кодов от 20 до 255.

Program Tabl^code; uses CRT;

{Подключение библиотеки управления символьным выводом} var kod: byte; {Целые числа от 0 до 255} begin

clrscr; {Очистка экрана символьного вывода} for kod:=20 to 2-55 do {Перебор кодов символов} begin

{Перевод строки через 10 шагов} if (koci mod 10=0) then writeln;

Дата добавления: 2015-09-29; просмотров: 54 | Нарушение авторских прав

<== предыдущая лекция	\|	следующая лекция ==>
Мы – польская фирма специализирующая в токарно-фрезерных работах CNC. Являемся одним из быстро развивающихся предприятий на польском рынке. Предлагаем свои услуги на наивысшем мировом уровне,	\|	Первенство ДЮСШ-8. 18 октября 2014 года.

mybiblioteka.su - 2015-2024 год. (0.04 сек.)