Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Total Document Solution реально воплощается

Тема 1.1. Задачи корпоративных информационных систем | Управление системой. | Совместимость. | Финансово-хозяйственной деятельностью предприятия | В корпоративных системах | Автоматизированных систем управления промышленным предприятием | Для различных отраслей народного хозяйства | Вычисления в системах бухгалтерского учета | Тема 2.1. Информационные системы в логистике | Их применение |


Читайте также:
  1. ENGINE ROOM DOCUMENTATION
  2. I. Реальность как западня: постмодернистское разложение XXI века
  3. I. Реальность как западня: постмодернистское разложение XXI века
  4. II.Read the following document and define the type of it. Choose one of the
  5. II.Read the following document and define the type of it. Choose one of the
  6. Purpose of the Software Requirements Document
  7. Rule 30. Voting on Draft Resolution

С участием Auburn Corp. (см. сайт www.auburn.ukrbiz.net) было разработано Решение TDS (Total Document Solution) для нового офиса крупной корпоративной структуры, имеющей ожидаемый документопоток свыше 15,6 млн. стр/год. На основе анализа характера работы, выполняемого персоналом и геометрии помещений, расположения сетевых портов, анализа других вводных Заказчика, было решено остановиться на программно-аппаратном Решении (TDS) – «PCSM – GW-аппараты серии Aficio». Printer Cost and Security Manager 2.5 (PCSM 2.5) - менеджер стоимости и безопасности печати - продвинутое программное решение, которое делает управление выводом, анализ, контроль легче обычного. Нет других программно-аппаратных решений, которые позволили бы вам проникнуть столь глубоко в вашу систему – для точного мониторинга, измерений и генерирования отчетов по документообороту, дающих вам представление о стоимости печатных работ в ваших подразделениях, возможность контролировать и влиять на объемы печати в подразделениях, видеть загруженность средств вывода на печать. Чтобы максимально обезопасить ваши секретные документы, они могут быть снабжены электронной меткой, не позволяющей выводить на печать или копировать такие документы, чтобы быть распечатанными только у определенного конечного пользователя на его средстве вывода. Это суть системы тотальной безопасности документопотока. Документ будет доступен только ограниченному кругу лиц. Его не сможет прочесть даже сетевой администратор. Поскольку PCSM не изменяет внутренней структуры документа, можно одинаково хорошо работать с текстовой, графической и смешанной информацией на любых языках и в любой национальной кодировке. Особенность взаимодействия программы PCSM и аппаратов серии Aficio позволяет отслеживать какой именно документ работник скопировал вручную благодаря имеющимся кодам доступа пользователей к аппарату. Для этого в состав аппаратной части включены жесткие диски и устройства ввода кодов доступа, в т.ч. по смарт-карточке. Как показывает зарубежный опыт, применение PCSM позволяет в крупной корпоративной структуре добиться 30% экономии затрат на печать и копирование только за счет перераспределения документопотоков. Например, документы с объемом печати, скажем, более 4-х страниц (2стрх2экз) перенаправляются на мощные устройства для рабочих групп с более дешевым выводом. Дуплексирование и буклетирование документов на производительных МФА позволяет снизить затраты бумаги в 2-4 раза! Аппараты серии AFICIO для этого Решения от Auburn Corp. будет поставлять Довира-трейдинг, сервис и гарантия - Довира-сервис.[2]

Система управления потоком документов «Слово и Дело». Система организации работы руководителя «Референт», система подготовки мероприятий «Организатор». Система «Архивариус».

Отрасль Управление включает директивные и административные органы, суды и юридические учреждения, некоторые внебюджетные фонды, фонд медицинского страхования. По международной классификации прикладных программ системы информационного обеспечения директивных органов называются средствами обеспечения информационного комфорта для лиц, принимающих решения. В соответствии с таким пониманием назначения данных программ, к ним можно отнести пакеты РЕФЕРЕНТ и ОРГАНИЗАТОР фирмы Элко -технология.

Для административных органов управления большинство информационных систем было разработано фирмой ИНСОФТ. Это «АСУ ЗАГС», «Паспортный стол», «Архивариус», «ГАИ» и т.п. Однако к моменту их широкого распространения (1996 г.) появилась универсальная программа АРХИВ фирмы Элко- технология, сделанная под Windows и решающая все задачи информационных систем «АСУ ЗАГС», «Паспортный стол», «Архивариус». Эта программа пользуется популярностью в правительственных учреждениях и постоянно совершенствуется. В правительственных учреждениях также широко используется СИСТЕМА ОБРАБОТКИ И АНАЛИЗА СООБЩЕНИЙ ИЗ СРЕДСТВ МАССОВОЙ ИНФОРМАЦИИ, ПРЕДСТАВЛЕННЫХ В INTERNET, ФИЛЬТР-СМИ фирмы Элко-технология.

Для управления фондом медицинского страхования есть автоматизированные реестры и системы формирования статотчетности, разработанные Минздравом. Системы управления внебюджетными фондами на рынке программных продуктов не встречаются.

Система информационного обслуживания и планирования деятельности руководителя «РЕФЕРЕНТ» фирмы Элко- технология (http:/www.elco.ru/) предназначена для эффективного распределения рабочего времени руководителя, планирования мероприятий и встреч, организации совместной работы руководителя и его помощников, а также автоматического приема, обработки и рассылки документов и распоряжений любого вида (тексты, изображение, звук).

Все входящие документы - от стандартного листа А4 до рукописной заметки на клочке бумаги - сразу же сканируются и вводятся в компьютер. Обеспечивается ввод и хранение в электронном виде и других видов информации - звукозаписи, фото-, видео-, документов. При этом исключается возможность потери или забывания информации. Документы в системе можно привязывать к конкретным мероприятиям, а также назначать ответственное лицо, контролирующее документ. Упорядоченность документов значительно сокращает объемы обрабатываемой референтами информации.

Мероприятия группируются по тематикам, которые пользователь может задавать самостоятельно. Можно также указать степень значимости мероприятия (выбрать наиболее важную встречу из нескольких). За каждым мероприятием закрепляется ответственное лицо. Кроме того, с мероприятием может быть связан набор входных (т.е. подготовительных) и выходных документов (т.е. поручений, приказов).

Планировать рабочее время руководителя можно по дням, неделям, месяцам. Для этого заранее должен быть составлен регламент - набор обязательно и регулярно проводимых мероприятий (например: планерка, обед). На составляемое расписание рабочего времени накладывается регламент и планируемые мероприятия.

Если у руководителя запланирована встреча, то в систему можно занести не только анкетные данные лица, с которым эта встреча будет происходить, но и его фотографию. О переносе или отмене встречи его можно известить по телефону, факсу или электронной почте. «РЕФЕРЕНТ» позволяет получать самые разнообразные отчеты. Например, можно получить отчет обо всех мероприятиях, подготовленных данным человеком.

Пакет построен в архитектуре клиент/сервер и обеспечивает одновременную согласованную работу нескольких референтов в единой компьютерной сети.

ПАКЕТ ПРИКЛАДНЫХ ПРОГРАММ ОРГАНИЗАЦИИ ИНФОРМАЦИОННЫХ РЕСУРСОВ РУКОВОДИТЕЛЯ «ОРГАНИЗАТОР» фирмы Элко-технология предназначен для эффективной работы с базой данных документов, писем, обращений и заявлений, поступающих в канцелярию или приемную руководителя. База данных пакета представляет собой совокупность рубрик, подрубрик и документов. Рубрики могут содержать подрубрики или непосредственно документы, подрубрики могут содержать другие подрубрики или непосредственно документы. Каждый документ может хранить наряду с наименованием, кратким описанием и другими структурированными атрибутами произвольные объекты, создаваемые и обслуживаемые приложениями Windows: документы Word, электронные таблицы, фотографии, графики и диаграммы, звуковые фрагменты, видеоизображения.

Для реорганизации информационных ресурсов руководитель применяет удобную технологию «Drag-and-Drop», которая позволяет мышью перемещать произвольные структуры документов и подрубрик.

В пакете есть программа «Видеоконференция», которая дает возможность проводить селекторные совещания с любым числом участников, вести переговоры с партнерами в любых странах, осуществлять коллегиальное управление с помощью обычной телефонной линии и компьютера.

Кроме того, пакет «ОРГАНИЗАТОР» обеспечивает автодозвон до удаленных абонентов, регистрацию входящих и исходящих вызовов в канцелярию и приемную, их статистическую обработку и классификацию

Пакет «ОРГАНИЗАТОР» работает в архитектуре клиент/сервер и обеспечивает согласованную работу подразделений и отдельных лиц, привлекаемых руководителем к управлению.

Важной задачей сотрудников административных органов является работа с документальными архивами.

Хотя по своему принципиальному предназначению (хранение документов, отбор по требуемым критериям и предоставление документов пользователю) электронные архивы сходны с системами управления базами данных, к ним предъявляется ряд специфических требований. Поэтому, как правило, для решения архивных задач формируются специальные программные средства, дополняющие традиционную функциональную СУБД. Основными особенностями архивным систем являются:

· поддержка записывающих устройств с высокой надежностью хранения данных (например, магнитооптических или перезаписываемых компакт-дисков);

· программно-аппаратная поддержка встроенных процедур автоматического восстановления данных при сбоях сервера;

· поддержка больших баз с приемлемым временем доступа к данным;

· обеспечение защиты данных;

· прием документов различного типа- бумажных, поступающих по факсимильной связи, программно- формируемых, таких как документы MS Word, таблицы MS Excel и т. п.;

· дружественный пользовательский интерфейс.

Архивные решения используются в различных областях: от государственного и муниципального управления до пенсионного и социального обеспечения. Существуют базовые решения в виде архивных систем, готовых для немедленного использования. Они могут использоваться в любых административных органах. Альтернативно существуют решения, которые могут быть настроены на индивидуальные требования пользователя. Поэтому пользовательский интерфейс, структура и управление хранилищем и документами должны быть адаптивными.

Архивная система должна быть интегрирована в существующую инфраструктуру обработки документов, предусматривать использование стандартов, таких как NFS, TCP/IP, X/Windows и MS-Windows и обеспечивать эффективное распределение системных ресурсов между несколькими серверами.

Технологии хранения архивных документов предусматривают использование оптических носителей (WORM, MO or CD-ROM) через FMWORM и магнитных дисков. Эти два вида носителей могут использоваться параллельно на одном или нескольких компьютерах и, совместно, они образуют средства, необходимые для кратковременного и долговременного архивирования. Предусматривается кэширование, минимизирующее время доступа к часто используемым документам, которые уже выбирались с оптического носителя.

Архивная система должна также включать обычные функции защиты данных. Для этого соответствующую информацию базы данных также следует хранить на оптическом носителе.

Ввиду повсеместного распространения операционной системы MS-Windows должно существовать клиентское решение, ориентированное на MS-Windows. Оно представляет собой стандартное решение с гибким пользовательским интерфейсом для таких архивных операций, как сканирование документов, индексирование и поиск. Списки возможных значений, результаты поиска и документы могут, например, сохраняться как объекты на «Рабочем столе». Пользователям обеспечивается непосредственный доступ к множеству объектов архива. Всю необходимую конфигурационную информацию следует автоматически запрашивать с сервера, где она сохраняется администратором архива для всех архивных рабочих станций. Это означает, что функции, обычно необходимые пользователям в архивной среде, могут быть обеспечены без конфигурационных работ на ПК.

Традиционная технология архивирования документов предусматривает:

· предварительный ввод и обработка документов;

· индексирование;

· сохранение в архиве;

· поиск документов в архиве;

· вывод результатов поиска в требуемой форме.

Архивная система предусматривает различные сценарии ввода документов- от использования простых сканеров рабочих станций до использования мощных сканеров поточного ввода. Качество отсканированных документов может проверяться на рабочих станциях. Документы могут быть автоматически перевернуты, повернуты, масштабированы и удалены. Затем они помещаются в отдельную персональную рабочую область. Последовательность процесса ввода может конфигурироваться индивидуально для каждой станции.

Подлежащие архивации документы и информация могут быть взяты из различных источников и представлены в различной форме:

· как введенные со сканера оригиналы документов (форматы tif, bmp и т. п.),

· как файлы персонального компьютера и серверов (файлы doc, xls, ppt и т. п.),

· как факсимильные сообщения и т. п.

На рабочих станциях предусматривается возможность брать документы, созданные другими приложениями. Архивная система назначает каждому документу соответствующий тип. Когда документ выбирается, тип документа используется для запуска приложения, которое создало оригинальный документ.

Документы могут поступать через факс и электронную почту, приниматься с использованием средств Internet, проходить через процедуры автоматического распознавания текстов или другие процедуры предварительной автоматической обработки.

Индексирование означает, что документам присваиваются критерии (значения атрибутов), в соответствии с которыми они могут выбираться. Эта процедура применяется как к отсканированным документам, так и документам из других источников, таких как факсы, документы, созданные на рабочих станциях и документы с хост-приложений.

Индексирование может выполняться различными способами. Оно может выполняться вручную через индексное окно, полуавтоматически с помощью ранее сохраненных атрибутов или автоматически, например, с помощью распознавания штрих-кода.

Документ также может быть отложен, т.е. индексироваться позднее. Типы индексирования и используемые методы определяются исходя из постановки задачи.

Проиндексированный документ хранится в архиве совместно со значениями атрибутов. Для быстрого поиска значения атрибутов также хранятся в индексной базе данных. Специальные транзакционные процедуры защищают архив от нарушения целостности и потери данных.

Архив может быть разделен на логические документальные области (подархивы). Для сохранения информации на специфических архивных носителях создаются пулы дисков. Данные подархивов могут хранится совместно, ускоряя таким образом скорость передачи.

Ко всем архивным документам может осуществляться доступ любого клиента через сеть. Как простые запросы, так и сложные могут быть построены путем задания аргументов с соответствующими связями. Для обеспечения полнотекстового поиска предварительно происходит распознавание соответствующих текстов. Результатом поиска является список найденных документов, содержащий значения требуемых атрибутов. Документы могут быть выбраны из списка и из архива для дальнейшей обработки. Стандартные функции обработки включают:

· просмотр (открытие);

· переиндексацию (изменение значений атрибутов);

· печать;

· посылку факсом;

· создание примечаний.

Другие функции могут быть введены на базе требований проектов.

Для обеспечения рассмотренного технологического процесса работу пользователей архива должен регламентировать административный сервер сети. Пользователю могут быть назначены права, такие как право на переиндексирование или выполнение администрирования, и могут быть назначены подархивы (документальные области или домены), доступные, для выборки данных. Для каждого пользователя может быть установлен свой язык. Сервер распределяет устройства и носители данных, определяет права доступа пользователей архива, запускает и контролирует вычислительные процессы.

Рассмотренная технология может включать различные элементы, требуемые для реализации архивирования документов в соответствии с потребностями конкретного предприятия.

В качестве примера можно привести использование автоматического распознавания штрих-кода для автоматизации процесса заполнения учетных архивных карточек. Штрих-код документа может быть опознан без специальной аппаратуры. Распознанный код может быть назначен документу как атрибут.

Архивная система предназначена для создания и использования электронных архивов с высокой степенью надежности хранения информации. Высокая степень надежности хранения информации достигается за счет использования в качестве архивных носителей сменных магнитооптических дисков и записываемых компакт-дисков. Ускорение процедур поиска информации обеспечивается за счет использования для индексного поиска реляционных (Oracle, Informix, Ingres) и полнотекстовой (FulText/Fulcrum) баз данных. Автоматические процедуры восстановления целостности архива позволяют полностью восстановить атрибутивную информацию из архива на носителе при полном разрушении базы данных.

В качестве дополнительной серверной компоненты для длительного хранения архива документов, использующего оптические носители, может предоставляться файловая система FMWORM. Этот модуль базируется на продукте FMOD (File Management for optical disks) и может использоваться для доступа к носителям данных WORM/MO и CD.

Для обеспечения правовых требований следует протоколировать все основные операции по обработке документов (сканирование, сохранение, поиск и т.д.). Операции и документальные области, для которых должны генерироваться протоколы, определяются через интерфейс администратора.

Для решения архивных задач фирмами Siemens Nixdorf и Элко-технология создан пакет ARCIS (ARCIVING AND IMAGING SYSTEM).

ARCIS можно условно разделить на три части: базовую систему, клиентские приложения и расширения.

Базовый серверный пакет ARCIS предоставляет полный набор функций, необходимых для поддержки всех стандартных архивных операций. Как носитель данных используется магнитный диск. В пакет входит конвейер документов, интерфейс к базе данных, клиент для Windows, средство администрирования через административного клиента. Базовый пакет содержит также средства конфигурации для создания документальных областей. Стандартный клиент ACW (ARCIS CLENT WINDOWS) поддерживает основные функции по поиску и представлению документов. При выборе документа по типу архивированного файла определяется и вызывается соответствующая программа обработки (просмотр отсканированных оригиналов, Ms Word, MS Excel и т. п.).

Стандартный клиент ARCIS ACW поддерживает рабочее место первичного ввода документов со сканера. ACW имеет встроенную поддержку для сканеров производства Fujitsu, Bell&Hawell, Kodak, Hewlett-Packard. Возможно включение собственных программ сканирования с сохранением всей последующей технологии обработки на клиенте и сервере.

По умолчанию сканирование генерирует черно-белые изображения. Эти изображения могут использоваться для формирования одно- или многостраничных документов на рабочих станциях. Созданный таким образом документ может затем быть передан для индексирования, которое может выполняться на других PC или UNIX станциях ARCIS. Во время сканирования может выполняться автоматическое разделение документов по определенным правилам, например, путем вставления разделителя в виде черных листов в пачку, которая должна сканироваться.

Стандартная версия ARCIS-ACW включает функции индексирования и поиска. ARCIS-ACW имеет развитый интерфейс настройки, который обеспечивает адаптацию к требованиям пользователя.

С помощью интерфейса DDE возможно включение в стандартного клиента дополнительных пунктов меню, формирующих удобную для конкретного пользователя среду.

Система ARCIS является "открытой" в том смысле, что позволяет интегрировать в серверную и клиентскую часть собственные программы пользователя. Существует также инструментарий для включения в процесс обработки собственных пользовательских UNIX-программ.

Гибкость и открытость достигается с помощью объектно-ориентированной архитектуры, основанной на новейших программных стандартах, таких как OLE2 и C++. Все архивные функции включены в ядро ARCIS-ACW и могут вызываться через различные интерфейсы, что обеспечивает долговременную стабильность.

Для продуктов, предлагаемых на российском рынке, существенны вопросы поддержки национального языка. В ARCIS поддерживается технология NLS, которая позволяет одновременно работать на английском, немецком и русском языках.

Встроенный программный модуль COLD (COLD = Computer Output on Laser Disk) позволяет ARCIS архивировать спул-файлы или любые другие файлы с хост-приложений, заменяя таким образом микрофильмирование.. Файлы сохраняются вместе с соответствующими поисковыми аргументами. Это позволяет искать отдельные документы, расположенные в файле.

Система ARCIS строится по технологии "клиент-сервер" и легко наращивается, позволяя создавать электронные архивы как для больших предприятий.

Решения ARCIS могут выполняться как на UNIX-системах, так и на MS-Windows

Система ARCIS поддерживает распределенную многосерверную конфигурацию как на базе RISC-компьютеров Siemens Nixdorf RM200, RM300, RM400, так и на базе серверов SGI, HP9000, SunSPARC. Актуальная версия - ARCIS 3.0. Для простых и относительно небольших архивов существует упрощенная и дешевая версия ARCIS под Windows NT. Клиентские рабочие места функционируют на IBM PC (Windows 3.11, Windows 95, Windows NT 4.0), а также на рабочих станциях RW (SGI), RM200 под UNIX.

Для сервера ARCIS (RM200 / RM300 / RM400) требует минимум 128MB памяти, CD-ROM, диск SCSI с объемом минимум 2ГБ, второй контроллер SCSI для присоединения оптических устройств, второй диск для базы данных (обеспечение производительности), соединение LAN.

Для клиента UNIX требуется минимум 64MB памяти, CD-ROM, диск SCSI с объемом минимум 2ГБ, второй контроллер SCSI для присоединения оптических устройств, второй диск для базы данных для обеспечения производительности, соединение LAN.

Для рабочей станции поиска клиента Windows требуется процессор от i486, 33МГц, минимум 16MB оперативной памяти, диск объемом от 200МБ, разрешение экрана минимум 800x600. Для рабочей станции индексирования клиента Windows требуется процессор от i486, 66МГц, минимум 32MB оперативной памяти, диск объемом от 300МБ, разрешение экрана минимум 1024x768. Для рабочей станции ввода клиента Windows с использованием сканера ARS2/3 требуется процессор от i486, 66МГц, минимум 32MB оперативной памяти, диск объемом от 500МБ, разрешение экрана минимум 1024x768. Для рабочей станции ввода клиента Windows с использованием высоко производительного сканера ARS4 требуется процессор от Pentium 90MHz, минимум 32MB оперативной памяти, диск объемом от 1 ГБ, разрешение экрана минимум 1024x768.

Периферийные устройства включают:

Оптические устройства. Можно использовать все устройства, поддерживаемые FMWORM версии 3.1.

Сканеры. Сканеры на рабочих станциях ввода должны работать под управлением DIP (компоненты клиента UNIX/SINIX) или DCT (компоненты клиента MS-Windows).

Принтеры. Принтеры должны включать средства декомпрессии данных, которые существенно ускоряют вывод растровых изображений. Подключаемые принтеры должны уметь обрабатывать формат изображений TIFF G4.

Печать и отправка/получение документов, используя факс-модем, осуществляется через сеть. Задания на печать и отправку факсов могут направляться с любой рабочей станции. Для поддержки данного режима требуется стандартная программа сервера печати/факса.

Расширения системы ARCIS позволяют поддерживать архивы чертежей, карт, банковских книг и реализовать все известные алгоритмы поиска в упорядоченных, бинарных и динамических структурах и их (структур) идентификацию.

ARCIS-IRS (ARCIS - Information Retrieval System) позволяет осуществлять поиск документов в архиве не только по регистрационным данным, но и по содержимому документа. Для этого, при вводе, документ распознается системой OCR. В настоящий момент в качестве программы OCR на российском рынке интегрирована программа FineReader (BIT Software). Распознанный файл сохраняется в архиве наряду с электронным оригиналом. Для поиска по содержимому формируется полнотекстовый индекс в системе управления полнотекстовыми базами данных FulText/Fulcrum.

ARCIS-COLD (ARCIS - Computer Output on Laser Disk) предназначен для архивации, выборки и печати на бланках больших Spool-файлов с хост-компьютеров (типа BS2000, 1ВМ360, ЕС ЭВМ). ARCIS-COLD предоставляет возможность направить в архив большие отчеты, которые ранее выводились на АЦПУ хост-компьютеров. По описанию структуры Spool-файла ARCIS-COLD автоматически определит атрибуты отдельных документов в Spool'e и предоставит их для просмотра по запросу пользователя. Таким образом, возможна модернизация старых, но еще функционирующих систем управления на хост-компьютерах.

COLD обеспечивает автоматическую передачу хост-данных (спул-файлов). Распознавание документов, индексирование и преобразование кодов или сжатие данных и выполняется полностью автоматически. Обеспечиваются интерфейсы для пользовательских индексных программ, фильтров и программ сжатия. Как альтернатива к обычному управлению индексами через реляционные базы данных, может использоваться вторичный индекс для управления большими наборами атрибутов. В этой технологии значения атрибутов архивируются.

Компонента COLD позволяет передавать и воспроизводить документы из спул-файлов на ПК (ACW). Текст совмещается с соответствующей формой, таким образом воссоздавая оригинальный документ. Соответствующие приложения для отображения, печати и передачи по факсу документов COLD могут запускаться с ПК.

Базовый модуль COLD состоит из серверных компонент, которые содержат функции для передачи файлов в архив. Они включают параметрически управляемую автоматическую выборку поисковых аргументов и дополнительные действия по преобразованию кодов, сжатию и разделение больших файлов. Для представления, печати и передачи по факсу для текстовых данных используются формуляры. Вместо представления COLD могут использоваться внешние приложения Windows. Клиент Windows предоставляет администратору средства для размещения текстовых данных в форме.

Не во всех случаях все поисковые атрибуты хранятся в базе данных. Огромные спул-файлы со многими документами, содержащими много поисковых аргументов, могут переполнить базу данных таким образом, что эффективный поиск не будет возможен. Поэтому была разработана технология, где поисковые аргументы документов из спул-файлов размещаются на магнитном носителе. Эта форма управления индексом известна как "вторичный индекс". В ARCIS-COLD вторичный индекс содержит все поисковые аргументы документов, тогда, как база данных содержит аргументы, относящиеся к спул-файлу. Поиск документа, используя вторичный индекс, выполняется в два этапа. На первом этапе выбирается спул-файл, на втором этапе ищется документы в этом файле. Вторичный индекс COLD - серверный модуль, для которого базовый модель COLD является необходимым.

Пользователь, который желает иметь доступ к архиву ARCIS, может сделать это с клиентских рабочих станций UNIX или MS-Windows. При проектировании интерфейсов использовались стандартные соглашения и понятия. Это позволяет пользователю легко освоить приложения ARCIS.

Наряду с электронным архивом, необходимым элементом информационной системы правительственных учреждений являются программы анализа средств массовой информации. Ярким примером такой программы является СИСТЕМА ОБРАБОТКИ И АНАЛИЗА СООБЩЕНИЙ ИЗ СРЕДСТВ МАССОВОЙ ИНФОРМАЦИИ, ПРЕДСТАВЛЕННЫХ В INTERNET (ФИЛЬТР-СМИ) фирмы Элко-технология (ЗАО «ЭЛКО Технологии»,117311, г. Москва, проспект Вернадского, 9/10.Телефон - (095) 131-55-55, 131-83-83.Факс - (095) 131-16-84).

Система «Фильтр-СМИ» предназначена для ввода, предварительной обработки, статистического и фактографического анализа, автоматического индексирования и хранения больших потоков сообщений из средств массовой информации и других информационных источников, представленных в Internet.

Система «Фильтр-СМИ» позволяет автоматически обрабатывать и анализировать ежедневные потоки неструктурированных оперативных сообщений. К таким сообщениям относятся, например, сообщения информационных агентств «ИТАР-ТАСС», «Интерфакс», «AK&M», «Финмаркет» и др., электронные версии газет, коммерческие предложения. В качестве исходных данных могут выступать также существующие информационные массивы документов или информация с WWW-страниц Internet.

Система предполагает распознавание в текстах исходных сообщений некоторых элементов, число и характеристики которых задаются пользователями (сведений об источнике, дате и времени формирования, заголовка и других). «Фильтр-СМИ» позволяет также индексировать потоки исходных неструктурированных текстов с помощью классификаторов и словарей, которые могут вводиться, настраиваться и изменяться самими пользователями (или формироваться с помощью какой-либо автоматической процедуры по их заказу).

Система подразделяется на две подсистемы. Первая из них, называемая «автоматическим администратором», предназначена для осуществления автоматической предварительной обработки потоков документов в соответствии с указанной пользователем технологией,. Вторая обеспечивает выполнение информационных, поисковых и сервисных функций.

Система строится в архитектуре «клиент/сервер» и предусматривает работу с тремя типами баз данных:

корпоративными;

локальными;

персональными.

В качестве серверной части корпоративных и локальных баз данных используются SQL-серверы (Oracle, SQLBase или другие). СУБД персональных баз данных «Фильтр-СМИ» имеет собственный формат, открытый для других приложений.

«Фильтр-СМИ» предусматривает наличие трех типов пользователей:

администратора БД, осуществляющего изменения в структуре БД и настройкой автоматического администратора;

оператора, осуществляющего контроль за процессом ежедневного ввода новой информации в автоматическом режиме и, возможно, принимающего участие в ее дополнительной интеллектуальной обработке;

конечного пользователя, осуществляющего поиск и отбор информации с возможностью выполнения сервисных функций и дальнейшей ее обработки после копирования в персональные БД.

Документ является основным информационным объектом системы (в качестве документа могут выступать как реальные документы, так и их фрагменты или отдельные признаки, например, «страны»). Каждому документу системы ставится в соответствие текст и информационно-поисковая карточка, состоящая из набора атрибутов. Пользователь может сам описать атрибуты, указать их тип и способы изменения значений, поставить в соответствие некоторым из этих атрибутов многоуровневые иерархические классификаторы и составить или подсоединить к классификаторам словари, предназначенные для автоматического индексирования исходных сообщений.

Возможны различные способы редактирования словарей (автоматически - на основе заданного перечня классификаторов или с подключением внешних процедур, путем анализа тестов, например, путем переноса словосочетаний из текстов контрольной выборки).

Технология обработки документов в «Фильтр-СМИ» предполагает наличие рабочего места администратора, оператора системы для предварительной обработки, формирования и обновления баз данных и рабочих мест пользователей для поиска, отбора и выдачи требуемой информации. В индивидуальном режиме работы пользователь персональных баз данных является также и их администратором.

Большинство функций администратора оперативных баз данных может выполняться автоматическим администратором. Он оказывает существенную помощь администраторам и пользователям баз данных и требует их вмешательства, как правило, лишь при необходимости изменения структуры представления данных или возникновения каких-либо нестандартных ситуаций. Автоматический администратор может включать более 100 различных процедур и настраивается в минимальные сроки с учетом конкретных пожеланий пользователей.

Для автоматического определения значений атрибутов система использует алгоритмы, учитывающие:

· способы набора фрагментов текста;

· месторасположение в тексте отдельных слов, фраз или комбинаций символов;

· расположение в тексте одних элементов относительно других;

· вхождение в текст определенных слов или комбинаций символов;

· наличие в текстах слов и словосочетаний из входных словарей.

Система позволяет задавать различные поисковые запросы. Как правило, окончательная выборка из текстов или их фрагментов получается после непродолжительного диалога с системой. Например, такой диалог может выглядеть следующим образом:

· сначала отобрать все документы по заданным значениям некоторых поисковых атрибутов;

· затем непосредственно исключить некоторые документы из полученного списка после просмотра их названий и (или) текстов;

· затем провести дополнительный уточняющий запрос по некоторым (возможно, другим) поисковым атрибутам;

· затем исключить из результирующего списка идентичные документы.

«Фильтр-СМИ» позволяет выполнять запросы следующих видов:

· по произвольным словам или словосочетаниям текстов (с учетом или без учета формы слова);

· по комбинациям значений атрибутов;

· по выделенным из текстов фактам (например, встречающимся датам);

· по выделяемым словам при просмотре текста;

· последовательные запросы.

Помимо поиска информации, предусмотрена возможность выполнения операций над списком баз данных («списком досье»), а также над списками выбранных документов, например, дополнение списка или исключение идентичных или эквивалентных документов.

В качестве результатов поиска могут выступать:

· списки документов;

· списки фрагментов (например, абзацев) документов;

· выходные формы заданного вида, автоматически формируемые в Microsoft Word или Microsoft Excel;

· формы для последующего экспорта данных.

«Фильтр-СМИ» настраивается в соответствие с установленными пользователями постановками задач и техническими требованиями и в соответствие с этой настройкой может использоваться на любом количестве компьютеров в пределах одной организации (подразделения) и перемещаться с одного компьютера на другой (индивидуальные и сетевые версии настраиваются различным образом).

Система «Фильтр-СМИ» позволяет специалистам аналитических отделов не только оперативно обрабатывать информацию, но и проводить ее первичный анализ. В качестве примера можно привести алгоритм определения настроения рынка по анализу высказываний его участников. Для этого используются следующие функции системы:

· выбор используемых источников информации (например, «ИТАР-ТАСС» и «Интерфакс»);

· создание для сообщений этих источников поискового атрибута “Доля оптимистических настроений”;

· установка для рассмотрения при индексировании фрагментов сообщений с прямой речью (заключенных в кавычки);

· определение словарей, состоящих из слов и словосочетаний, характеризующих оптимистические и пессимистические высказывания.

Для эффективной работы системы необходимо иметь:

· АРМ администратора (IBM-совместимый компьютер не ниже Pentium-133, от 32 Мбайт оперативной памяти, свободное дисковое пространство от 50 Мбайт);

· сервер для хранения баз данных при работе с корпоративными и (или) локальными БД (под Windows NT, Novell или UNIX);

· АРМы пользователей, обеспеченные модемной связью или входящие в состав вычислительной сети (IBM-совместимые компьютеры не ниже Pentium-100, от 16 Мбайт оперативной памяти, свободное дисковое пространство от 30 Мбайт).

Из программного обеспечения для функционирования комплекса ФИЛЬТР-СМИ нужны:

· Операционная система Windows 98, Windows 95 или Windows NT;

· Microsoft Office;

· сетевое программное обеспечение.

В системе предусмотрена возможность работы с документами, поисковыми образами и выходными формами в Microsoft Word и Microsoft Excel. Кроме того, осуществляется импорт и экспорт данных в ряд других приложений, например, Lotus Notes.

В качестве сервера для хранения данных могут использоваться SQL-серверы (Oracle, SQL Base или др.).

Предусмотрена работа с другими приложениями через буфер обмена.

Файлы системы (кроме индексных) имеют открытую структуру и возможно их непосредственное использование в других приложениях.

Пользователям системы предлагается следующая программа сервисного обслуживания:

· настройка автоматического администратора;

· настройка классификаторов и словарей;

· сопровождение;

· обучение пользователей и администратора, помощь в освоении системы;

· построение сервисных приложений на базе «Фильтр-СМИ»;

· бесплатное обновление версий в течение полугода;

· разработка специализированных версий автоматического администратора «Фильтр-СМИ» на основе анализа пользовательских задач.

 

Контрольные вопросы

1. Назначение АСУ «ЗАГС».

2. Какие информационные объекты используются в системе электронного документооборота?

3. Где применяется программно-технический комплекс «Сканирование и обработка бланков»?

 


Дата добавления: 2015-08-26; просмотров: 62 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Системы электронного документооборота| Основной вид деятельности рынка ценных бумаг

mybiblioteka.su - 2015-2024 год. (0.037 сек.)