|
1.4. Кодирование
Информация и сигналы
Человек воспринимает информацию из внешнего мира с помощью своих органов чувств. Большая часть информации принимается нами через зрение и слух. Органы слуха воспринимают звуковые сигналы, органы зрения воспринимают световые сигналы.
Сигнал переносит информацию, представленную в виде значения или
изменения значения физической величины.
Звуковой сигнал связан с изменением давления воздуха, порождённым
звуковой волной и воздействующим на орган слуха. Световые сигналы, воспринимаемые нашим зрением, — это электромагнитные волны в определённом диапазоне частот — диапазоне видимого света.
Различают два вида сигналов: непрерывные и дискретные. Например,
звук — это непрерывный волновой процесс, происходящий в атмосфере или другой сплошной среде. Непрерывный электрический сигнал в технических системах передачи и обработки информации называют аналоговым сигналом. Термин «дискретный» означает «разделённый», состоящий из отдельных частиц, элементов. При цифровой передаче и обработке информации используются дискретные сигналы.
А | А | • — | L | Л | ------ с | ц | — ■ —. |
| |
В | Б | —... | М | м | ______ |
| ч | -------------. |
|
W | В | ■ ^^к ^^к | N | н | — |
| ш | ------------------- |
|
G | Г | ---------. | о | ------------- | Q | щ | ---------. — |
| |
D | Д | ^^к * * | Р | п | * ^^м ^^м * |
| ъ | - * _ ^^_ * а___ |
|
Е | Е | • | К | р | * ^^н * |
| 1,1 |
| |
V | Ж | ---------- | S | с | • • ■ | X | ь |
| |
Z | — ^^— •» | т | т | — |
| э - |
| ||
I | И | • * | и | У | * * H-1-t |
| ю - |
| |
J | Й | • —^ ^^_ —^ | F | ф | .. —. |
| я - 1____________ |
| |
к | К |
| Н | X | * * • * |
|
|
|
|
Рис. 1.7. Кодовая таблица азбуки Морзе
бумажной ленте в виде графических точек, тире и пробелов, которые визуально прочитывал телеграфист.
Азбука Морзе является неравномерным кодом, поскольку у разных букв алфавита длина кода разная — от одного до шести символов (точек и тире). По этой причине необходим третий символ — пауза для отделения букв друг от друга.
Равномерный телеграфный код был изобретён французом Жаном Морисом Бодо в 1870 году. В нём использовалось всего два разных вида сигналов. Неважно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала. В кодовой таблице Бодо длина кодов всех символов алфавита одинакова и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятёрка сигналов — это знак текста.
Благодаря идее Бодо, удалось автоматизировать процесс передачи и печать букв. В 1901 году был создан клавишный телеграфный аппарат. Нажатие клавиши с определённой буквой вырабатывает соответствующий пятиимпульсный сигнал, который передаётся по линии связи. Принимающий аппарат под воздействием этого сигнала печатает ту же букву на бумажной ленте.
Следующим важным событием в технике связи стало изобретение телефона. В 1876 году американец Александр Белл получил патент на его изобретение. Годом позже Томас Э. Эдисон изобрёл телефонный аппарат с угольным микрофоном, который можно встретить до сих пор. По телефонной связи на расстояние передается звук посредством непрерывного электрического сигнала, модулированного с частотой звуковых колебаний. В микрофоне говорящего человека создается переменное электрическое напряжение, а в наушнике слушающего оно преобразуется в звуковые колебания.
Телефонная связь — это аналоговый способ передачи. звука.
Благодаря открытию в 1888 году Генрихом Герцем электромагнитных волн стало возможным изобретение радиосвязи. Почти одновременно в 1895 году Александр Попов в России и в 1896 году итальянец Г. Маркони изобрели первые радиопередатчики и радиоприёмники. Современники изобретения называли радио беспроводным телефоном. Принцип передачи звука по радиосвязи заключается в переносе через пространство высокочастотных (несущих) электромагнитных волн, модулированных по амплитуде низкочастотными звуковыми колебаниями. В радиоприёмнике звуковые колебания отделяются от несущей частоты и преобразуются в звук.
Радиосвязь — это аналоговый способ передачи звука.
В XX веке с изобретением телевидения стала возможной передача на расстояние изображения. Телевизионный электромагнитный сигнал — это также аналоговый способ передачи звуковой и видеоинформации.
Во второй половине XX века происходит переход к преимущественно дискретной форме представления информации для её хранения, передачи и обработки. Этот процесс начался с изобретением цифровой вычислительной и измерительной техники. В настоящее время компьютерная обработка становится элементом всех систем связи: телефонной, радио и телевизионной. Развивается цифровая телефония, цифровое телевидение. Интернет как универсальная система связи основан исключительно на дискретной цифровой технологии хранения, передачи и обработки информации.
Система основных понятий
Информация и сигналы | |||
Сигнал переносит информацию, представленную в виде значения или изменения значения физической величины | |||
Аналоговый сигнал: непрерывный сигнал | Дискретный сигнал — состоящий из отдельных (отличимых друг от друга) элементов | ||
Аналоговые способы передачи информации | Дискретные способы передачи информации | ||
Технические средства | Время изобретения | Технические средства | Время изобретения |
Телефон | 1876 год | Телеграф Морзе | 1837 год |
Радио | 1895 год | Телеграф Бодо | 1870 год |
Телевидение | 1930-е годы | Цифровые технологии связи; электронная почта, цифровая \ телефония, цифровое телеви- i дение, Интернет | Вторая половина XX века |
Кодирование
текстовой
информации
Что такое кодирование
Чтобы информацию можно было хранить, передавать и обрабатывать, её нужно представить в удобной для этого форме.
Кодирование — это процесс представления информации в виде последовательности условных обозначений. Кодом называют множество слов — последовательностей символов из некоторого алфавита, используемых при кодировании информации.
Кодирование происходит по определённым правилам. Правила кодирования зависят от назначения кода, т. е. от того, как и для чего он будет использоваться.
Письменность — это способ кодирования устной речи на естественном языке. Письменный текст предназначен для передачи информации от одного человека к другим людям как в пространстве (письмо, записка), так и во времени (книги, дневники, архивы документов и пр.). Правила, по которым люди осуществляют письменное кодирование информации, называются грамматикой языка (русского, английского, китайского и др.), а человека, умеющего читать и писать, называют грамотным чело-веком.
Запись речи — кодирование, а чтение письменного текста — это его де* кодирование. Процесс письменного обмена информацией между людьми можно отобразить следующей схемой:
С изобретением технических средств связи появилась возможность быстрой передачи текстов на большие расстояния. Но этот процесс требует использования дополнительного уровня кодирования. Повторим ещё раз данное выше утверждение: способ кодирования зависит от назначения кода. Если код предназначен для передачи текста по технической системе связи, то он должен быть приспособлен к возможностям этой системы. Примером такого «технического» кода является азбука Морзе.
Процесс передачи телеграфного сообщения с использованием азбуки Морзе можно отразить следующей схемой:
Кодирование текста всегда происходит по следующему правилу: каждый символ алфавита исходного текста заменяется на комбинацию символов алфавита кодирования. Для азбуки Морзе эти правила представлены на рис. 1.7.
В таблице азбуки Морзе для кодирования 32 букв русского алфавита (буква Ё стала использоваться в письменном тексте только в середине XX века) применяются два символа: точка и тире. Однако при передаче слов из-за неравномерности кодов различных букв приходится применять ещё пропуск между буквами: пауза во времени передачи или пробел на телеграфной ленте. Поэтому фактически алфавит телеграфного кода Морзе содержит три символа: точка, тире, пропуск. Это троичный код.
Телеграфный код Бодо является двоичным равномерным пятиразрядным кодом. На его основе в 1932 году был разработан международный телеграфный код IT А2, кодовая таблица которого представлена на рис. 1.8.
Двоичные коды символов свернуты в формат двузначных шестнадцате-ричных чисел, в которых первая цифра — это 0 или 1. Есть три типа сим-
волов: буквы (letters), цифры и знаки (figures), управляющие символы (control chars). Переключение в режим ввода букв происходит по коду 1F16 (двоичная форма 1 1111). Буква А имеет код 0316 (О ООН); код буквы R — 0А16 (0 1010). Этот же код в режиме ввода цифр обозначает цифру 4. Слово BODO в шестнадцатеричной форме кодируется так: 19 18 09 18. Длина двоичного кода этого слова равна 20.
Во второй половине XX века создаются и распространяются компьютеры. Для компьютерной обработки текстов потребовалось создать стандарт кодирования символов. В 1963 году был принят стандарт, который получил название ASCII — Американский стандартный код для информационного обмена. ASCII — семиразрядный двоичный код, представлен в табл. 1.4.
Кодировка ASCII
| .0 | Л | .2 | .3 | .4 | .5 | .'■' | .7 | .8 | .9 | A | .B | .с | .D | E | .r |
0. | NUL | SOH | STX | ЕТХ | EOT | ENQ | AC К | BEL | BS | TAB | LF | VT | FF | CR | SO | SI |
1. | DLE | DC1 | DC2 | DC3 | DC 4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | us |
2. |
| ! | « | # | S | % | & | ■ | ( | > | * | + | i | - |
| / |
3. | 1 | : | ; | < | = | > | ||||||||||
4. | в | А | В | С | D | E | F | G | H | I | J | К | L | M | N | O |
5. | Р | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | A |
| |
б. |
| а | Ь | с | d | e | f | h | j. | j | к | 1 | m | n | О | |
7. | Р | q | г | s | t | u | V | w | X | У | z | { | \ | - | DEL |
Код символа — это его порядковый номер в кодовой таблице, определяется номером строки и столбца. Он может быть представлен в десятичной, в двоичной и в шестнадцатеричной системах счисления. Код в памяти компьютера — семиразрядное двоичное число. В табл. 1.4 код ASCII пред-итсшлеы ** свернутой шестнадцатеричной форме. При развёртывании в двоичную форму коды представляют собой семиразрядные целые двоичные числа в диапазоне от 668 66662 = 661б = б до Ш 11Н,- 7F!6 = 127. Всего с помощью этого кода представляются 2 = 128 символов.
Первые 32 символа (от 00 до IF) называются управляющими символами. Они не отражаются какими-либо знаками на экране монитора или при печати, но определяют некоторые действия при выводе текста. Например, по коду 08ie (BS) происходит стирание предыдущего символа; по коду 0716 (BEL) — вывод звукового сигнала; код ODI6 (CR) означает переход к началу строки (возврат каретки). Эти символы унаследованы ещё от кодировки для телетайпной связи, для которой первоначально использовался ASCII, поэтому сохранились такие архаичные термины, как «каретка».
Символы, имеющие графическое отображение, начинаются с кода 2016. Это код пробела — пропуска позиции при выводе. Важным свойством таблицы ASCII является соблюдение алфавитной последовательности кодировки прописных и строчных букв, а также десятичных цифр. Это свойство чрезвычайно важно для программной обработки символьной информации, в частности для алфавитной сортировки слов.
Расширение кода ASCII* Восьмиразрядная двоичная кодировка позволяет кодировать алфавит из 28 = 256 символов. Первая половина восьмиразрядного кода совпадает с ASCII. Вторая половина состоит из символов с кодами от 128 = 8016 = 1000 00002 до 255 = FF16 -1111 ПП2. Эта часть таблицы кодировки называется кодовой страницей (СР — code page). На кодовой странице размещают нелатинские алфавиты, символы псевдографики и некоторые другие знаки, не входящие в первую половину.
В табл. 1.5—1.7 приведены кодовые страницы с русским алфавитом. СР866 используется в операционной системе MS DOS, СР1251 — в операционной системе Windows. Кодировка KOI8-R используется в операционной системе Unix.
Обратите внимание на то, что не во всех кодировках соблюдается правило последовательного кодирования русского алфавита. Существуют и другие стандарты символьной кодировки, где присутствует русский алфавит.
16-разрядный стандарт UNICODE. В 1991 году был разработан шестнадцатиразрядный международный стандарт символьного кодирования Unicode, который позволяет закодировать 216 = 65536 символов. В такую кодовую таблицу помещаются английский (латиница), русский (кириллица), греческий алфавиты, китайские иероглифы, математические символы и многое другое. Отпадает потребность в кодовых страницах. Диапазон кодов символов в шестнадцатеричной форме: от 0000 до FFFF.
В начале кодовой таблицы, в области от 000016 до 007F16, содержатся символы ASCII. Под символы кириллицы выделены области знаков с кодами от 040016 до 052F16, от 2DE016 до 2DFF16, от А64016 до A69F16.
Позднее стали разрабатываться новые стандарты на Unicode. К 2010 году сменилось 6 вариантов стандарта. Благодаря более сложной организации кода, при сохранении его 16-разрядности появилась возможность кодировать 1112 064 символа. В настоящее время из этого количества реально используется около 107 тысяч кодов.
Учимся программировать
(обработка символьной информации)
Рассмотрим программу на Паскале, по которой на экран будет выводиться таблица кодировки в диапазоне кодов от 20 до 255.
Program Tabl^code; uses CRT;
{Подключение библиотеки управления символьным выводом} var kod: byte; {Целые числа от 0 до 255} begin
clrscr; {Очистка экрана символьного вывода} for kod:=20 to 2-55 do {Перебор кодов символов} begin
{Перевод строки через 10 шагов} if (koci mod 10=0) then writeln;
Дата добавления: 2015-09-29; просмотров: 54 | Нарушение авторских прав
<== предыдущая лекция | | | следующая лекция ==> |
Мы – польская фирма специализирующая в токарно-фрезерных работах CNC. Являемся одним из быстро развивающихся предприятий на польском рынке. Предлагаем свои услуги на наивысшем мировом уровне, | | | Первенство ДЮСШ-8. 18 октября 2014 года. |