Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Типы коммуникативных форматов

Табличная информация и ее обработка | Технологии распознавания изображений | Предметные технологии | Компоненты и структуры АИС | Классификация АИС | Типы баз данных | Международная система по атомной науке и технике INIS | Техническое обеспечение АИС | Программное обеспечение | Типы, структуры, форматы данных и документов в информационных системах |


Читайте также:
  1. Абсолютное большинство респондентов ездят в торговые центры несколько раз в неделю, что говорит о высокой посещаемости подобных форматов торговли.
  2. Нарушение коммуникативных функций
  3. ОПРОСНИК КОС (КОММУНИКАТИВНЫХ И ОРГАНИЗАТОРСКИХ СКЛОННОСТЕЙ).
  4. ПОДГОТОВКА К ШКОЛЕ - РАЗВИТИЕ ВОЛЕВЫХ И КОММУНИКАТИВНЫХ НАВЫКОВ
  5. Тема 1. (Часть 2) Изучение коммуникативных умений дошкольников.
  6. Формирование речевых, коммуникативных умений, совершенствование речевой деятельности

Коммуникативные форматы разделяются на следующие категории:

• форматы обмена библиографической информацией (МЕКОФ,
карточный формат и пр.);

• форматы обмена библиотечно-справочной информацией (семейство MARC);

• форматы обмена полнотекстовой документальной информацией (языки процедурной и описательной разметки документов,
средства моделирования документов) — RTF, ODA, SGML,
HTML.

Форматы первой группы удовлетворяют спецификациям ISO 2709 — рекомендациям Международной организации по стандарти­зации (ISO) и различаются наполнением и применением — МЕ­КОФ предназначен для распространения библиографических БД, а MARC — для онлайновых библиотечных каталогов (ОРАС).

Карточный формат (рис. 1.10) представляет каждый документ (запись) БД как совокупность строк с одинаковым номером (RN), в каждой из которых указана метка (три цифры), идентифицирующая поле или группу полей.

Рис. 1.10. Пример документа БД IN IS, представленного в карточном формате:

VI — вид документа; TI — заглавие; AU — автор; СО — корпоративный автор;

АВ — реферат; CL — рубрика INIS; CY — страна публикации

 

Формат МЕКОФ. Стандарт для коммуникативного формата МЕКОФ устанавливает структуру записи и ее наполнения для обме­на библиографическими или другими данными на машиночитаемых носителях (рис. 1.11).

Содержание позиций Позиции символов Наполнение
Маркер - 0-4 5 6-9 10 11 12-16 17 18,19 Длина записи Статус записи Коды применения Длина индикатора Длина идентификатора Базовый адрес данных Набор кодов Зарезервировано
    План справочника 20 21 22 23 Длина «длины поля данных» Длина «позиции начального символа» Длина «части, определяемой при применении» Зарезервировано
Справочник Статья - Метка Длина поля данных Позиция начального символа Часть, определяемая при применении
    - - Статья Статья Разделитель поля
Поля данных - - Идентификатор записи Разделитель поля записи
    Резервные поля   Резервное поле Разделитель поля Резервное поле Разделитель поля
    Библиографические поля - Данные Разделитель поля
    - - Разделитель записи
    - - Следующая запись

 

Рис 1.11. Структура записи формата МЕКОФ

В отличие от карточного формата, для интерпретации которого необходимо описание данных в программе загрузки или в таблицах словаря данных, МЕКОФ содержит максимально полное описание в собственно записи. Оно находится в маркере записи и справочнике, причем маркер описывает справочник, а справочник — собственно данные, чем достигается высокая степень независимости данных от программ обработки.

Библиографическая запись — совокупность данных, включающая: маркер данных; справочник; поля данных; разделитель записи.

Маркер — структурный компонент, находящийся в начале каж­дой записи, содержащий параметры для ее обработки и состоящий из следующих компонентов: длина записи, статус записи, коды примене­ния; длина идентификатора, длина индикатора (количество символов индикатора); базовый адрес данных, набор кодов, план справочника.

Справочник — указатель местонахождения полей данных в запи­си. Состоит из переменного числа статей, каждая из которых иден­тифицирует соответствующее поле данных и содержит следующие компоненты — метка; длина поля данных, позиция начального симво­ла поля.

Поле данных (поле) — часть библиографической записи, имею­щая переменную длину, следующая за справочником и связанная с одной из его статей; может содержать одно или несколько подполей и должно заканчиваться разделителем.

План справочника — набор параметров, определяющих структуру статей справочника.

Идентификатор — элемент, состоящий из одного или несколь­ких символов, непосредственно предшествующий подполю и иден­тифицирующий его.

Индикатор — элемент, расположенный в начале поля и несу­щий дополнительную информацию о содержании поля, взаимосвя­зи с другими полями или об операциях, требуемых при определен­ной обработке данных.

Метка — три символа, связанные с полем и идентифицирую­щие его.

Разделитель — управляющий символ, разделяющий данные.

Форматы серии MARC имеют иерархическую структуру, которая поддерживает отношения между компонентами внутри записи и по­зволяет комбинировать связанные записи.

Аналогичное назначение и структуру имеет Единый Коммуника­тивный Формат (CCF) ЮНЕСКО, содержащий три компонента:

• правила структуризации среды хранения (включая физические
размеры элементов среды — длина блоков и т. п.);

• идентификационные коды элементов данных (поля, подполя,
метки, разделители);

• правила представления содержимого элементов данных (словари и алгоритмы индексирования и кодирования информации).

Форматы полнотекстовых документов. Понятие модель документа охватывает аспекты создания, преобразования, хранения, поиска, передачи и отображения документов. Принято рассматривать струк­туру документа в двух аспектах: логическом (содержание) и физиче­ском (макетном) — представление [30].

Логическая структура определяет составные компоненты и их соотношения в понятиях, отвечающих взгляду на документы как смысловые структуры. Например, к основным смысловым компо­нентам относятся: авторские данные (имя автора, место работы), ан­нотация, оглавление, главы, разделы, параграфы, рисунки, сноски.

На рис. 1.12 приведен пример структуры документа «Поясни­тельная записка к дипломному проекту (работе)». Здесь выделены такие базовые понятия структуры, как обязательность/необязательность элемента, уникальность или повторяемость, вхождение ниже­стоящих элементов в вышестоящие по принципу «И» (оба типа дан­ных должны или могут входить в элемент) либо «ИЛИ» (только ка­кой-либо один из типов данных может или должен входить в элемент).

Макетная структура содержит описание документа в терминах физических единиц — страниц, полос, колонок, колонтитулов, ра­мок для рисунков, шрифтов, стилей и пр.

Подходы к моделированию документов опираются на два стан­дарта:

ISO 8613 (О DA Office Document Architecture — архитектура
управленческой документации);

ISO 8879 (SGMLStandard Generalized Markup Language —
стандартный обобщенный язык разметки).

 

Рис. 1.12. Иерархическая структура документа «Пояснительная записка к ди­пломной работе»:

# — уникальный элемент; * — повторяющийся элемент;? — необязательный элемент;! — обязательный элемент; & — вхождение типа И; | — вхождение типа ИЛИ

 

Документ в ODA представлен в виде профиля и собствен­но документа, организованных в форме древовидной структуры.

Профиль содержит информацию о документе в целом и его про­хождении, формальные признаки — дата составления, вид, регист­рационный номер и т. д.

Собственно документ содержит текст и сведения о его структуре и стиле, а именно:

• структура документа — заглавие, параграфы, оглавление
и т. п. (логическая структура), а также абзацы, расположение
текста, шрифты (физическая структура);

• архитектура содержания — набор графических элементов, вы­
деление определенных слов, строк и т. п.;

• коммуникативный формат — способы кодирования объектов,
признаков и содержания документов.

Язык SGML разработан на базе программного продукта DCF GML фирмы IBM и представляет собой метод создания струк­турированных документов, а также языков для их разметки.

В системах обработки текстов в документ включается дополни­тельная информация, называемая разметкой и выполняющая сле­дующие функции:

• выделение логических элементов данного документа;

• задание функций обработки выделенных элементов,

В обычных текстовых процессорах существуют встроенные ко­манды включения/выключения шрифтов и другие, аналогичные ко­мандам управления размещением информации на экране или при печати (Escape-последовательности). Такой подход называется ко­мандной или процедурной разметкой (табл. 1.13).


 

Таблица 1.13. Примеры разметки текстовых файлов (управление представлением)

Примечание. Аналогично могут быть рассмотрены — управление размером и формой шрифта, вставка математических символов и пр.

Альтернативный способ разметки заключается в выделении час­ти текста без указания способа обработки, который затем назначают другие команды. Такая разметка называется описательной (дескрип­тивной). Она включает метки (tags, тэги) начала и окончания эле­мента текста и указывает, как интерпретировать данный фрагмент. Изменяя набор процедур, сопоставленный описательной разметке, можно изменить внешнее представление одного и того же докумен­та. Развитие идей описательной разметки привело к определению разметки как формального языка, что позволяет проверить правиль­ность разметки и минимизировать разметки за счет подстановки умолчаний.

В языке SGML каждый документ включает:

• декларации языка SGML, привязывающие к определенным
значениям параметры обработки, а также имена синтаксиса;

• пролог, состоящий из деклараций о типе документа. Они определяют типы элементов, их взаимосвязи и атрибуты, а также
условные обозначения, которые могут быть задействованы
при разметке;

• данные, которые состоят из разметки документа и собственно информации.

Основные типы конструкций языка — описания элементов <!ELEMENT...>, объектов <!ENTITY...> и атрибутов <!ATTRIBUTE LIST...>, образующих структуру документа (документов), при этом элемент является основной его компонентой, объект — группа, род элементов, атрибут — характеристика элемента. Все «квадратики», приведенные на рис. 1.13, являются элемента­ми. Запишем одну из возможных конструкций, соответствующую выделенной на рис. 1.13 цепочке элементов («Подраздел» — «параграф» — «текст»...):

<!ELEMENT SUBDIV (PAR*)> подраздел состоит из

параграфов (повт.)

<!ELEMENT PAR (TEXT | TABLE? | PICT?)> параграф - из текста или

таблицы (необяз.) или рисунка (необяз.);

<!ELEMENT PICT(IMAGE & САРТ)> рисунок - из изображения и подписи

 

Декларации и пролог на языке SGML задают структуру доку­мента и, будучи отделенными от размеченного текста, образуют описание типа документа (DTD — Document Type Definition). На сегодня известно более 5000 DTD, соответствующих различным нацио­нальным и международным стандартам, из которых наиболее важ­ным является HTML.


Дата добавления: 2015-07-20; просмотров: 446 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Проблема обмена информацией и коммуникативные (обменные) форматы| Лексическое обеспечение

mybiblioteka.su - 2015-2024 год. (0.009 сек.)