Читайте также: |
|
Рассмотрим основные компоненты информационной структуры издательства. Основные компоненты системы локализуются на сервере или нескольких серверах. В частности, отдельный сервер обычно используют для ведения издательской базы данных. Иногда может быть выделен специальный сервер доставки информации клиенту, реже – сервер для поиска нужных электронных изданий. Для интеграции сервера (серверов) с клиентскими компьютерами используется издательская интрасеть. Наконец, посредством экстрасети и сети Интернет могут быть подключены территориально удаленные сотрудники издательства и некоторые контрагенты, с которыми поддерживается
регулярная информационная связь.
Ядром любой издательской информационной системы является хранилище изданий. Естественно, издания хранятся в электронной форме, т. е. хранилище электронных
изданий - основной компонент информационной системы издательства. Поэтому
требования к этому компоненту и особенности организации хранения электронных
изданий будут рассмотрены в специальном параграфе. Здесь следует лишь отметить, что
для организации эффективного поиска изданий необходимо хранить атрибутивную
информацию или метаданные, т. е. имя автора или авторов, название издания, время
первой публикации издания, название издательства, кому принадлежат авторские права,
характер представления данных (тип файла) и пр.
Загрузчик является той частью издательской системы, которая должна сделать ввод
изданий и документов настолько эффективным, насколько это возможно. Поскольку
количество вводимой информации велико, становится понятно требование минимизации
ручного труда в этом процессе.
При вводе документов одновременно должны генерироваться метаданные для
каталогизации и индексирования, на основе которых документы могут затем извлекаться
пользователями. Известно несколько способов автоматизации, соответствующих разным
методам доступа к данным. Наиболее известен и хорошо отработан метод автоматической
индексации полного текста. Самые прогрессивные средства индексации текста
базируются на технологии семантических сетей, в которой значения слов определяются
по контексту, а не просто подбором унифицированных терминов для отдельных слов,
однако пока работу программных средств нельзя назвать безупречной. Представляется
оправданным включение в метаданные ключевых слов и выражений, отобранных автором
(иногда редактором), так как никто лучше них не сможет подобрать набор ключевых слов,
оптимально характеризующих как тематическую область издания, так и его отличия от
близких по тематике. Возможен отбор этих слов из уже имеющегося в атрибутивной базе
данных набора, но иногда оправдано и расширение этого общего набора путем ввода
дополнительных элементов, характерных для нового издания.
В издательской деятельности возможна автоматическая генерация связей для отношений
«содержится» и «используется в» путем разбора языка компоновки страниц и выделения
элементарных объектов из составных документов. Чем более структурирован язык
составления страниц, тем легче выделять информацию: форматы с высоким уровнем
структуризации, подобные Adobe FrameMaker, SGML и XML, удобнее, чем форматы со
специальной структурой типа QuarkXPress и Word, хуже всего интерпретируются
форматы, не имеющие четко выраженной структуры - PostScript и, в меньшей степени, PDF.
До сих пор не существует общих средств автоматического выделения нетривиальной
информации из изображений, аудио и видео, но некоторые разработчики (Kodak,
LivePicture, Virage, Excalibur) занимаются исследованиями в этой области. Иногда
атрибутивные метаданные могут генерироваться просто путем извлечения информации из
определенных форматов данных. Лучший пример этого - форматы файлов Adobe
PhotoShop, которые содержат массу полезной информации.
При загрузке добавляются не только метаданные, но и вспомогательные представления
документов, в частности, миниатюры, представляющие внешний вид издания. Генерация
миниатюр может быть автоматизирована. Например, большинство графических форматов
содержат свои собственные миниатюры, для других, например для изображений с
высоким разрешением, можно сгенерировать их «на лету». Аналогично можно
спроектировать загрузчик таким образом, чтобы он, получая цифровые аудио-объекты,
создавал клипы первых нескольких секунд (например, в форма те WAV 10 КГц). Таким
же образом видео MPEG-2 может преобразовываться в клипы QuickTime длительностью в
5 или 10 с.
Существует два базовых способа доставки цифровых документов пользователю: передача файлов - ее можно использовать для текстов, изображений, аудио и видео с низким качеством, и поточная передача для высококачественного «движущегося» медиа-аудио, видео и анимации. Этот последний способ налагает очень серьезные требования на
возможности сервера. При хранении мультимедиа-данных требования к вычислительным ресурсам, необходимым для передачи документов, качественно отличаются от требований к подсистеме хранения. Поэтому, во многих случаях, выделяется отдельный сервер
доставки данных. В первую очередь этот сервер должен иметь высокую пропускную
способность для передачи мультимедийных объектов из хранилища на клиентские
компьютеры. В идеале медиа-память должна допускать многосерверный доступ так,
чтобы хранилище разделялось между сервером хранения и сервером доставки данных.
Сервер доставки аудио/видео должен обеспечивать гарантированную пропускную полосу для потока данных, поэтому в архитектуре сервера должны быть сбалансированы ресурсы процессора, периферия ввода / вывода и сетевых интерфейсов. Программное обеспечение сервера доставки, во-первых, должно включать средства низкого уровня для работы с файлами, обеспечивающие различные режимы проигрывания медиа. Во-вторых, нужно, чтобы это ПО определяло стандартные интерфейсы для разработки приложений -«плейеров» на клиентской стороне и реализовывало серверную часть этих интерфейсов.
В большинстве случаев используется сквозное проигрывание (playthrough), что дает возможность начать просмотр мультимедийного издания еще до того, как он полностью
загружен на сервер доставки. Например, сервер MediaCenter фирмы Sun позволяет начать
воспроизведение аудио- или видео-данных уже через пять секунд после начала загрузки.
Сквозное проигрывание необходимо для приложений с быстрым и непрерывным
обновлением содержания. Режим playthrough развивает метод оперативной загрузки,
который заключается в способности сервера одновременно загружать один и
воспроизводить другой документ.
На уровне операционной системы видеоматериалы представляются взаимосвязанной
совокупностью файлов. Так, для фильма в цифровой форме хранятся файлы одного или
нескольких видеопотоков и файл для аудиопотока. В дополнение к файлам содержания
существуют вспомогательные файлы, которые поддерживают распределение первичного
файла по разным дискам (striping), синхронизацию между видео и аудио, обеспечивают
разные режимы воспроизведения.
Браузер представляет собой интерфейс пользователя для доступа и просмотра
электронных изданий. Отделение браузера от уровня клиентских сервисов подчеркивает
тот факт, что он может быть реализован с помощью любого стандартного Web-браузера,
что дает множество преимуществ, например независимость от платформы. Наращивание
функциональных возможностей может происходить путем добавления сервисов в рамках
задаваемой браузером общей организации.
Браузер обеспечивает интерфейс с сервисом запросов и должен обеспечивать следующие
функции:
· иерархический доступ каталог/файл, аналогичный менеджеру файлов;
· интерфейсы для поиска;
· просмотр списка ответов, включающего миниатюры;
· навигацию по связям между документами.
Если данный клиент обладает правами доступа к хранилищу изданий, он может, выбрав
одну из миниатюр, сформировать запрос к хранилищу изданий на получение соответствующего документа. После определенного времени ожидания, связанного с
выбором соответствующего информационного носителя в хранилище, сервер доставки
начнет передачу клиенту запрошенной информации.
Второй главный компонент браузера - средства просмотра для мультимедийных изданий.
Для этого компонента существенно, чтобы медиа-документы были представлены в
распространенных форматах либо легко преобразовывались в них. Браузер, однако,
должен быть способен получать документы в их родных форматах и активизировать
соответствующие приложения обработки, например чтобы пользователь мог
редактировать документы.
Дата добавления: 2015-10-30; просмотров: 112 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Проектирование структуры хранилища электронных изданий. | | | Электронных изданий. |