Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Человек воспринимает информацию из внешнего мира с помощью сво­их органов чувств. Большая часть информации принимается нами через зрение и слух. Органы слуха воспринимают звуковые сигналы, органы



1.4. Кодирование

Информация и сигналы

Человек воспринимает информацию из внешнего мира с помощью сво­их органов чувств. Большая часть информации принимается нами через зрение и слух. Органы слуха воспринимают звуковые сигналы, органы зрения воспринимают световые сигналы.

Сигнал переносит информацию, представленную в виде значения или

изменения значения физической величины.

Звуковой сигнал связан с изменением давления воздуха, порождённым

звуковой волной и воздействующим на орган слуха. Световые сигналы, воспринимаемые нашим зрением, — это электромагнитные волны в опре­делённом диапазоне частот — диапазоне видимого света.

Различают два вида сигналов: непрерывные и дискретные. Например,

звук — это непрерывный волновой процесс, происходящий в атмосфере или другой сплошной среде. Непрерывный электрический сигнал в тех­нических системах передачи и обработки информации называют аналого­вым сигналом. Термин «дискретный» означает «разделённый», состоя­щий из отдельных частиц, элементов. При цифровой передаче и обработке информации используются дискретные сигналы.


А

А

• —

L

Л

------ с

ц

— ■ —.

 

В

Б

—...

М

м

______

 

ч

-------------.

 

W

В

■ ^^к ^^к

N

н

 

ш

-------------------

 

G

Г

---------.

 

о

-------------

Q

щ

---------. —

 

D

Д

^^к * *

Р

п

* ^^м ^^м *

 

ъ

- * _ ^^_ * а___

 

Е

Е

К

р

* ^^н *

 

1,1

 

V

Ж

----------

S

с

• • ■

X

ь

 

Z

 

— ^^— •»

т

т

 

э -

 

I

И

• *

и

У

* * H-1-t

 

ю -

 

J

Й

• —^ ^^_ —^

F

ф

.. —.

 

я -

1____________

 

к

К

 

Н

X

* * • *

 

 

 

 

Рис. 1.7. Кодовая таблица азбуки Морзе

бумажной ленте в виде графических точек, тире и пробелов, которые ви­зуально прочитывал телеграфист.

Азбука Морзе является неравномерным кодом, поскольку у разных букв алфавита длина кода разная — от одного до шести символов (точек и тире). По этой причине необходим третий символ — пауза для отделения букв друг от друга.

Равномерный телеграфный код был изобретён фран­цузом Жаном Морисом Бодо в 1870 году. В нём использо­валось всего два разных вида сигналов. Неважно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала. В кодовой таблице Бодо длина кодов всех символов ал­фавита одинакова и равна пяти. В таком случае не возни­кает проблемы отделения букв друг от друга: каждая пятёрка сигналов — это знак текста.



Благодаря идее Бодо, удалось автоматизировать про­цесс передачи и печать букв. В 1901 году был создан кла­вишный телеграфный аппарат. Нажатие клавиши с опре­делённой буквой вырабатывает соответствующий пятиимпульсный сиг­нал, который передаётся по линии связи. Принимающий аппарат под воздействием этого сигнала печатает ту же букву на бумажной ленте.

Следующим важным событием в технике связи стало изобретение телефо­на. В 1876 году американец Александр Белл получил патент на его изобрете­ние. Годом позже Томас Э. Эдисон изобрёл телефонный аппарат с угольным микрофоном, который можно встретить до сих пор. По телефонной связи на расстояние передается звук посредством непрерывного электрического сиг­нала, модулированного с частотой звуковых колебаний. В микрофоне гово­рящего человека создается переменное электрическое напряжение, а в на­ушнике слушающего оно преобразуется в звуковые колебания.


Телефонная связь — это аналоговый способ передачи. звука.

Благодаря открытию в 1888 году Генрихом Герцем электромагнитных волн стало возможным изобретение ра­диосвязи. Почти одновременно в 1895 году Александр По­пов в России и в 1896 году итальянец Г. Маркони изобрели первые радиопередатчики и радиоприёмники. Современ­ники изобретения называли радио беспроводным телефо­ном. Принцип передачи звука по радиосвязи заключается в переносе через пространство высокочастотных (несущих) электромагнитных волн, модулированных по амплитуде низкочастотными звуковыми колебаниями. В радио­приёмнике звуковые колебания отделяются от несущей частоты и преобразуются в звук.

Радиосвязь — это аналоговый способ передачи звука.

В XX веке с изобретением телевидения стала возможной передача на расстояние изображения. Телевизионный электромагнитный сигнал — это также аналоговый способ передачи звуковой и видеоинформации.

Во второй половине XX века происходит переход к преимущественно дискретной форме представления информации для её хранения, передачи и обработки. Этот процесс начался с изобретением цифровой вычислитель­ной и измерительной техники. В настоящее время компьютерная обработ­ка становится элементом всех систем связи: телефонной, радио и телевизи­онной. Развивается цифровая телефония, цифровое телевидение. Интернет как универсальная система связи основан исключительно на дискретной цифровой технологии хранения, передачи и обработки информации.

Система основных понятий

 

Информация и сигналы

Сигнал переносит информацию, представленную в виде значения или изменения значения физической величины

Аналоговый сигнал: непрерыв­ный сигнал

Дискретный сигнал — состоящий из отдельных (отличимых друг от друга) элементов

Аналоговые способы передачи информации

Дискретные способы передачи информации

Технические средства

Время изобретения

Технические средства

Время изобретения

Телефон

1876 год

Телеграф Морзе

1837 год

Радио

1895 год

Телеграф Бодо

1870 год

Телевидение

1930-е годы

Цифровые технологии связи; электронная почта, цифровая \ телефония, цифровое телеви- i дение, Интернет

Вторая поло­вина XX века


Кодирование

текстовой

информации

Что такое кодирование

Чтобы информацию можно было хранить, передавать и обрабатывать, её нужно представить в удобной для этого форме.

Кодирование — это процесс представления информации в виде после­довательности условных обозначений. Кодом называют множество слов — последовательностей символов из некоторого алфавита, использу­емых при кодировании информации.

Кодирование происходит по определённым правилам. Правила коди­рования зависят от назначения кода, т. е. от того, как и для чего он будет использоваться.

Письменность — это способ кодирования устной речи на естественном языке. Письменный текст предназначен для передачи информации от одного человека к другим людям как в пространстве (письмо, записка), так и во времени (книги, дневники, архивы документов и пр.). Правила, по которым люди осуществляют письменное кодирование информации, называются грамматикой языка (русского, английского, китайского и др.), а человека, умеющего читать и писать, называют грамотным чело-веком.

Запись речи — кодирование, а чтение письменного текста — это его де* кодирование. Процесс письменного обмена информацией между людьми можно отобразить следующей схемой:


С изобретением технических средств связи появилась возможность быстрой передачи текстов на большие расстояния. Но этот процесс требу­ет использования дополнительного уровня кодирования. Повторим ещё раз данное выше утверждение: способ кодирования зависит от назначе­ния кода. Если код предназначен для передачи текста по технической сис­теме связи, то он должен быть приспособлен к возможностям этой систе­мы. Примером такого «технического» кода является азбука Морзе.

Процесс передачи телеграфного сообщения с использованием азбуки Морзе можно отразить следующей схемой:

Кодирование текста всегда происходит по следующему правилу: каж­дый символ алфавита исходного текста заменяется на комбинацию симво­лов алфавита кодирования. Для азбуки Морзе эти правила представлены на рис. 1.7.

В таблице азбуки Морзе для кодирования 32 букв русского алфавита (буква Ё стала использоваться в письменном тексте только в середине XX века) применяются два символа: точка и тире. Однако при передаче слов из-за неравномерности кодов различных букв приходится применять ещё пропуск между буквами: пауза во времени передачи или пробел на те­леграфной ленте. Поэтому фактически алфавит телеграфного кода Морзе содержит три символа: точка, тире, пропуск. Это троичный код.

Телеграфный код Бодо является двоичным равномерным пятиразряд­ным кодом. На его основе в 1932 году был разработан международный те­леграфный код IT А2, кодовая таблица которого представлена на рис. 1.8.

 

Двоичные коды символов свернуты в формат двузначных шестнадцате-ричных чисел, в которых первая цифра — это 0 или 1. Есть три типа сим-


волов: буквы (letters), цифры и знаки (figures), управляющие символы (control chars). Переключение в режим ввода букв происходит по коду 1F16 (двоичная форма 1 1111). Буква А имеет код 0316 (О ООН); код буквы R — 0А16 (0 1010). Этот же код в режиме ввода цифр обозначает цифру 4. Слово BODO в шестнадцатеричной форме кодируется так: 19 18 09 18. Длина двоичного кода этого слова равна 20.

Во второй половине XX века создаются и распространяются компьюте­ры. Для компьютерной обработки текстов потребовалось создать стандарт кодирования символов. В 1963 году был принят стандарт, который полу­чил название ASCII — Американский стандартный код для информаци­онного обмена. ASCII — семиразрядный двоичный код, представлен в табл. 1.4.

Кодировка ASCII

 

 

.0

Л

.2

.3

.4

.5

.'■'

.7

.8

.9

A

.B

.D

E

.r

0.

NUL

SOH

STX

ЕТХ

EOT

ENQ

AC К

BEL

BS

TAB

LF

VT

FF

CR

SO

SI

1.

DLE

DC1

DC2

DC3

DC 4

NAK

SYN

ETB

CAN

EM

SUB

ESC

FS

GS

RS

us

2.

 

!

«

#

S

%

&

(

>

*

+

i

-

 

/

3.

             

1

   

:

;

<

=

>

 

4.

в

А

В

С

D

E

F

G

H

I

J

К

L

M

N

O

5.

Р

Q

R

S

T

U

V

W

X

Y

Z

[

\

 

A

 

б.

 

а

Ь

с

d

e

f

 

h

j.

j

к

1

m

n

О

7.

Р

q

г

s

t

u

V

w

X

У

z

{

\

 

-

DEL

Код символа — это его порядковый номер в кодовой таблице, определя­ется номером строки и столбца. Он может быть представлен в десятичной, в двоичной и в шестнадцатеричной системах счисления. Код в памяти компьютера — семиразрядное двоичное число. В табл. 1.4 код ASCII пред-итсшлеы ** свернутой шестнадцатеричной форме. При развёртывании в двоичную форму коды представляют собой семиразрядные целые двоич­ные числа в диапазоне от 668 66662 = 66 = б до Ш 11Н,- 7F!6 = 127. Всего с помощью этого кода представляются 2 = 128 символов.

Первые 32 символа (от 00 до IF) называются управляющими символа­ми. Они не отражаются какими-либо знаками на экране монитора или при печати, но определяют некоторые действия при выводе текста. На­пример, по коду 08ie (BS) происходит стирание предыдущего символа; по коду 0716 (BEL) — вывод звукового сигнала; код ODI6 (CR) означает пере­ход к началу строки (возврат каретки). Эти символы унаследованы ещё от кодировки для телетайпной связи, для которой первоначально ис­пользовался ASCII, поэтому сохранились такие архаичные термины, как «каретка».


Символы, имеющие графическое отображение, начинаются с кода 2016. Это код пробела — пропуска позиции при выводе. Важным свойством таб­лицы ASCII является соблюдение алфавитной последовательности коди­ровки прописных и строчных букв, а также десятичных цифр. Это свой­ство чрезвычайно важно для программной обработки символьной инфор­мации, в частности для алфавитной сортировки слов.

Расширение кода ASCII* Восьмиразрядная двоичная кодировка позво­ляет кодировать алфавит из 28 = 256 символов. Первая половина вось­миразрядного кода совпадает с ASCII. Вторая половина состоит из симво­лов с кодами от 128 = 8016 = 1000 00002 до 255 = FF16 -1111 ПП2. Эта часть таблицы кодировки называется кодовой страницей (СР — code page). На кодовой странице размещают нелатинские алфавиты, символы псевдо­графики и некоторые другие знаки, не входящие в первую половину.

В табл. 1.5—1.7 приведены кодовые страницы с русским алфавитом. СР866 используется в операционной системе MS DOS, СР1251 — в опера­ционной системе Windows. Кодировка KOI8-R используется в операцион­ной системе Unix.


Обратите внимание на то, что не во всех кодировках соблюдается прави­ло последовательного кодирования русского алфавита. Существуют и дру­гие стандарты символьной кодировки, где присутствует русский алфавит.

16-разрядный стандарт UNICODE. В 1991 году был разработан шест­надцатиразрядный международный стандарт символьного кодирования Unicode, который позволяет закодировать 216 = 65536 символов. В такую кодовую таблицу помещаются английский (латиница), русский (кирил­лица), греческий алфавиты, китайские иероглифы, математические сим­волы и многое другое. Отпадает потребность в кодовых страницах. Диапа­зон кодов символов в шестнадцатеричной форме: от 0000 до FFFF.

В начале кодовой таблицы, в области от 000016 до 007F16, содержатся символы ASCII. Под символы кириллицы выделены области знаков с ко­дами от 040016 до 052F16, от 2DE016 до 2DFF16, от А64016 до A69F16.

Позднее стали разрабатываться новые стандарты на Unicode. К 2010 году сменилось 6 вариантов стандарта. Благодаря более сложной органи­зации кода, при сохранении его 16-разрядности появилась возможность кодировать 1112 064 символа. В настоящее время из этого количества ре­ально используется около 107 тысяч кодов.

Учимся программировать

(обработка символьной информации)

Рассмотрим программу на Паскале, по которой на экран будет выво­диться таблица кодировки в диапазоне кодов от 20 до 255.

Program Tabl^code; uses CRT;

{Подключение библиотеки управления символьным выводом} var kod: byte; {Целые числа от 0 до 255} begin

clrscr; {Очистка экрана символьного вывода} for kod:=20 to 2-55 do {Перебор кодов символов} begin

{Перевод строки через 10 шагов} if (koci mod 10=0) then writeln;


Дата добавления: 2015-09-29; просмотров: 54 | Нарушение авторских прав




<== предыдущая лекция | следующая лекция ==>
Мы – польская фирма специализирующая в токарно-фрезерных работах CNC. Являемся одним из быстро развивающихся предприятий на польском рынке. Предлагаем свои услуги на наивысшем мировом уровне, | Первенство ДЮСШ-8. 18 октября 2014 года.

mybiblioteka.su - 2015-2024 год. (0.04 сек.)