Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Текстовые стандарты, форматы

Читайте также:
  1. Векторный и растровый форматы
  2. Видеоформаты. Звуковые форматы. Vrml-моделирование.
  3. Внутритекстовые (скрытые в тексте) заголовки
  4. Графические форматы
  5. Стандарты и форматы памяти переводов
  6. Статья 151 Основные стандарты, регулирующие процесс заключения государственных контрактов
  7. Текстовые блоки

 

Основу большинства электронных изданий, как и печатных изданий, составляет текстовой материал. Именно на текст ложится основная семантическая нагрузка. Текстовой материал электронных изданий может подготавливаться в текстовых редакторах или программных пакетах верстки и оформляться в соответствии с требованиями, предъявляемыми к печатным изданиям. При подготовке публикации каждая из указанных программ подготавливает текстовые файлы в своем формате, однако последующая печать на твердый носитель обеспечивает одинаковые возможности по восприятию текстовой и графической информации.

Иное дело в электронных изданиях. Здесь восприятие текстовой информации осуществляется на основе представления любого издания на экране монитора ПЭВМ или специального электронного устройства. Поскольку такие издания могут подготавливаться в различной программной среде, для воспроизведения электронного документа необходима именно эта среда или другая, но программно и информационно совместимая с ней. Таким образом, на ПЭВМ должны быть инсталлированы все наиболее вероятные программные средства прочтения электронных изданий.

Одной из возможностей избежать подобной ситуации является использование стандартных текстовых форматов. Но на сегодняшний день существуют стандарты (юридические) только на способы кодирования символов. Поэтому в электронных изданиях и гипертекстовых электронных HTML-документах применяют коды ASCII, ASNI или двухбайтовый код UNICODE. Такой же подход избран и при подготовке электронных документов по Help-технологиям.

Фирма Adobe Systems предложила свой подход к решению проблемы программно-информационной совместимости электронных изданий. В качестве стандартного (де-факто) текстового формата выбран формат разметки текста PDF. Это объясняется тем, что практически в каждой программе текстовых редакторов или пакетов верстки имеются трансляторы формата документа, созданного в определенной программе, в формат PDF. Поэтому любой электронный документ можно представить в едином виде (в стандарте де-факто PDF) и осуществить его просмотр в программе Adobe Acrobat.

В некоторых электронных документах текстовой материал используется в качестве комментария к графическим или анимационным элементам электронных изданий. К таким электронным изданиям относят гиперграфические и мультимедийные издания.

Исходный текстовой материал электронного издания может подготавливаться традиционными способами: с помощью клавиатурного набора; сканирования текстовых блоков исходного документа с последующим распознаванием символов в среде соответствующих программ распознавания текста; переноситься на компьютер с помощью магнитных носителей; передаваться по сети и т.д.

В электронных документах текст играет двоякую роль. Прежде всего он несет основную семантическую нагрузку в большинстве видов электронных изданий. Как правило, этот текстовой материал выступает в виде текстовых блоков или разделов, которые в дальнейшем будут объединяться в нечто целое в режиме просмотра электронного издания или навигации по нему.

С другой стороны, текстовая информация является системообразующим элементом электронных изданий, поскольку используется для навигации по электронному изданию. Текстовая информация вводится непосредственно в процессе формирования элементов навигации.

Для автоматизации подготовки электронных документов созданы специальные программы: Macromedia Dreamweaver, Microsoft FrontPage 2000, Adobe Page Mill, Claris Home Page, SoftQuad, HotMetal Pro, Allaire HomeSite, Symantec Visual Page, NetObject Fusion, Sausage Software HotDog Professional, Licon Beach Software FlexSite и т.д.

Rich Text Format (RTF, «формат обогащённого текста» (rich с английского — богатый) — проприетарный[1][2] межплатформенный формат хранения размеченных текстовых документов, предложенный группами программистов, основавшими компании Microsoft и Adobe, как метатэговский формат для редактора Word в 1982 году. С тех пор спецификация формата несколько раз изменялась. RTF-документы поддерживаются всеми современными текстовыми процессорами. После разрыва отношений с Microsoft компания Adobe продолжила развитие метатэговского языка, заложенного в основу RTF, создав в 1985 году язык PostScript. В RTF для обмена документами используются только представимые символами коды из ASCII-, MAC- и PC-символьного набора. Кроме текста, файл в RT-формате в читаемой форме содержит команды управления.

Стандарт представления символов ASCII - это 7-битовое описание кода символа. Поскольку в персональных компьютерах используются байты, состоящие из 8 бит, производители компьютеров часто определяют наборы символов, использующие 256 кодов вместо 128 кодов ASCII. В результате получается «расширенный набор символов» (extended character set), который включает в себя набор символов ASCII и до 128 других символов.

Расширенный набор символов, который Windows и программы для Windows в большинстве случаев используют, называется набор символов ANSI ( ANSI character set), фактически он является международным стандартом ISO.

В нашей стране кодовые комбинации начиная со 128 используются для кодирования символов кириллицы, математических символов и другой информации. Причем для каждой платформы используется свое расположение символов в кодовой таблице. Так, известны кодировки Windows, Mac, DOS-OS/2, ISO (Dec) и КОИ-8. Поэтому приходится осуществлять перекодировки символов кириллицы электронных изданий в зависимости от используемой платформы.

Стандарт кодировки символов UNICODE. Стандарт Unicode был предложен некоммерческой организацией Unicode Consortium, образованной в 1991 г. Для представления каждого символа в этом стандарте используются два байта: один байт для кодирования символа, другой для кодирования признака. Тем самым обеспечивается информационная совместимость данного способа кодирования со стандартом ASСII.

Двухбайтовое описание кодов символов позволяет закодировать очень большое число символов из различных письменностей. Так, в документах Unicode могут соседствовать русские, латинские, греческие буквы, китайские иероглифы и математические символы.

 

 


Дата добавления: 2015-08-09; просмотров: 176 | Нарушение авторских прав


Читайте в этой же книге: Роль и место электронных изданий | Формы электронных документов и изданий | Электронная форма представления материала на этапе допечатной подготовки | Гипертекстовая и гиперграфическая формы изданий | Электронные издания в науке и технике | Требования к электронным публикациям | Основные компоненты электронных изданий | Структурированный текст, полутоновые и полноцветные изображения, анимационная графика, цифровая видео- и аудиоинформация | Инструментальные средства интерактивного взаимодействия пользователя с электронным изданием | Видеоформаты. Звуковые форматы. Vrml-моделирование. |
<== предыдущая страница | следующая страница ==>
Представление информации в электронных изданиях| Графические форматы

mybiblioteka.su - 2015-2024 год. (0.006 сек.)