Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Текстовая информация

Читайте также:
  1. I. При каких условиях эта психологическая информация может стать психодиагностической?
  2. I. Эта информация может оказаться для Вас бесценной.
  3. IX. Дополнительная информация
  4. Uuml; Регистрация и дополнительная информация по телефону 33-444-99, на сайтах www.4dk-seminar.ru, zaznaniem.ru и или или в группе «ВКонтакте» http://vk.com/club46437375
  5. V. ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ
  6. V. Информация о дистанциях.
  7. VIII. Информация утверждений по содержанию текста; a) верна, b) неверна, c) текст не содержит данной информации.

Принципиально важно, что текстовая информация уже дискретна — состоит из отдельных знаков. Поэтому возникает лишь технический воп­рос, как разместить ее в памяти компьютера.

Напомним о байтовом принципе организации памяти компьютеров, об­суждавшемся в базовом курсе информатики. Вернемся к рис. 4.7. Каждая клеточка на нем обозначает бит памяти. Восемь подряд расположенных битов образуют байт памяти. Байты пронумерованы. Порядковый номер байта определяет его адрес в памяти компьютера. Именно по адресам про­цессор обращается к данным, читая или записывая их в память (рис. 4.12).

байт № 1 байт № 2

Рис. 4.12. Байтовая организация памяти

Модель представления текста в памяти весьма проста. За каждой бук­вой алфавита, цифрой, знаком препинания и иным общепринятым при записи текста символом закрепляется определенный двоичный код, дли­на которого фиксирована. В популярных системах кодировки (ASCII, KOI8 и др.) каждый символ заменяется на 8-разрядное целое положитель­ное двоичное число; оно хранится в одном байте памяти. Это число являет­ся порядковым номером символа в кодовой таблице. Согласно главной формуле информатики, определяем, что размер алфавита, который мож­но закодировать, равен: 28 = 256. Этого количества вполне достаточно для размещения двух алфавитов естественных языков (английского и русского) и всех необходимых дополнительных символов.

Поскольку в мире много языков и много алфавитов, то постепенно со­вершается переход на международную 16-битовую систему кодировки Unicode. В ней каждый символ занимает 2 байта, что обеспечивает 216 = 65 536 кодов для различных символов.

При работе с электронной почтой почтовая программа иногда нас спрашивает, не хотим ли мы прибегнуть к кодировке Unicode для пере­сылаемых сообщений. Таким способом можно избежать проблемы несо­ответствия кодировок, из-за которой иногда не удается прочитать рус­ский текст.

Не следует представлять себе текст, хранимый в памяти компьютера или на внешнем носителе, лишь как поток байтов, каждый из которых яв­ляется лишь кодом символа текста. Форматы хранения текстовой инфор­мации определяются форматами текстовых файлов, используемых той или иной программой обработки текстов. Файлы, создаваемые с по­мощью текстовых процессоров (например, Microsoft Word), включают в себя не только коды символов алфавита, но и данные формата: тип и раз­мер шрифта, положение строк, поля и отступы и прочую дополнительную информацию.


Дата добавления: 2015-07-20; просмотров: 66 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Дискретные модели данных в компьютере. Представление текста, графики и звука| Графическая информация

mybiblioteka.su - 2015-2024 год. (0.007 сек.)