Читайте также:
|
|
АИСЗ являются частью следующих типов юридических информационных систем [32, 44].
1. Справочно-информационные системы общего назначения, ориентированные на доступ пользователей любой профессиональной ориентации к нормативно-правовым актам. К этим системам относятся
АИСЗ ЮРИУС, Консультант, Гарант, Кодекс и др. (Российская Федерация).
2. Глобальные информационные службы (хост-системы), предоставляющие доступ удаленным пользователям к библиографической,
полнотекстовой или другой информации. Крупнейшей в мире коммерческой службой, обеспечивающей доступ к юридической информации, является система LEXIS (США). Начало ее разработки относится к 1967 г., когда было заключено соответствующее соглашение между коллегией адвокатов шт. Огайо и фирмой Mead Data Corp.
Известны другие системы данного типа:
• JURIS GmbH (Саарбрюккен, ФРГ), которая предоставляет
интерактивный доступ к правовой информации, включающей
научную литературу, тексты законов, отчеты о судебной практике, а также пресс-релизы Федерального конституционного суда и других высших федеральных судов;
• ITALGIURE/FIND (Италия), WESTLAW (США) и пр.
3. Системы информационной поддержки деятельности правотворческих органов (законодательные и конституционные собрания, конгресс, Госдума, сенат и пр.). Спецификой таких систем является необходимость хранения и поиска многих версий и редакций нормативно-правовых документов с учетом вносимых поправок и изменений.
4. Системы автоматизации делопроизводства судов, полиции, и
других правоприменительных или правоохранительных органов. Не
обходимо заметить, что в странах с прецедентным правом (США)
судопроизводство также может рассматриваться как деятельность во
многом правотворческого характера, в связи с чем данные системы
интегрируются с приведенными выше (п. 3).
5. Прочие виды систем — автоматизация юридических библиотек
и вузов, консультационных пунктов, юридические экспертные системы и пр.
Основными особенностями юридических АИС являются:
• необходимость предоставления адресного доступа к полным
текстам, причем в области автоматизированных систем правовой информации основное место занимает спор между сторонниками контролируемого индексирования и поиска по ключевым словам (КС) из текста;
• в информационных языках для поиска в БД по законодательству необходим учет контекстных связей, возможность использования в запросе предлогов и частиц (И, ИЛИ, НЕ), регламентированных прилагательных (типа «обязательный», «произвольный» и пр.), что отличает их от обычных документальных АИПС;
• тексты нормативных актов должны подвергаться так называемой юридической обработке (вид аналитико-синтетической обработки), при котором тексту (или контексту) приписываются не только классификационные индексы, ключевые слова или дескрипторы (как при обычном индексировании), но и комментарии специалистов, ссылки на предшествующие версии, связанные документы, решения судов и пр.
Интегральный банк юридической информации ЮРИУС/JURIUS (тематическая, логическая, физическая структура)
ЮРИУС — Юридическая универсальная информационная система — представляет собой совокупность средств и методов поиска текстовой юридической информации и подробно рассматривается здесь, поскольку является первой отечественной полнотекстовой информационной системой [3, 31, 44].
Тематическая и логическая структура БД. С тематической точки зрения ИБ состоит из следующих основных БД, которые приведены в табл. 4.1 (в хронологическом порядке разработки и выпуска в рамках проекта ЮРИУС).
Таблица 4.1. Тематическая структура баз данных ЮРИУС (по состоянию на 1994 г. )
С логической точки зрения входящие в ЮРИУС БД имеют относительно стандартную структуру и включают две компоненты: регистрационные карты (РК) и полные тексты. РК представляют собой форматированные записи, содержащие относительно стандартный набор библиографических данных, а также ссылку на соответствующий полный текст (рис. 4.1). Полные тексты документов состоят из страниц двух типов:
• логических, т. е. структурных единиц текста (пункт, параграф,
статья);
• физических (принудительное разбиение длинного неструктурированного текста на фрагменты одинаковой длины).
Строго говоря, вышеизложенное описание (как и рис. 4.1) в точности соответствует только базам данных НЗС, НЗР, ФЗ, в которых поиск осуществляется по цепочкам: Термин — РК — Документ — Страница (интерфейс IX), или Термин — Страница — Документ — РК (интерфейс DC), или Термин — Страница — Термин — Страница —... (гипертекстовый документальный интерфейс DCH). В базе данных СЗ используется измененная последовательность: Термин — РК -— Страницы — Документ, поскольку каждый документ задается начальной и конечной страницей, указанными в РК.
Кроме этого, в БД «СЗ» имеется возможность отнесения документа к тому или иному тому СЗ (с номерами 1 — 10). Это связано с традицией выпуска Свода законов в форме десятитомного печатного издания.
Физическая структура БД ЮРИУС (рис. 4.2) является примером реализации документальной ИС в среде системы программирования с элементами реляционной СУБД (см. также графу 4 табл.
Рис. 4.1. Логическая структура БД ЮРИУС
Файл текстовой части БД (szdoc.dbf) — один или несколько файлов, в которых содержатся полные тексты актов (см. также рис. 4.10). На логическом уровне образует иерархическую структуру: БД (том), документ, страница (см. рис. 4.1).
Словарный файл текстовой части (dcfrv.dbf) — представляет собой список слов и стандартных словосочетаний (например «статья 256», «п. 13», «TV 1400-РП»), извлеченных из текста, сопровождаемых частотами появления в данной БД (см. рис. 4.7, 4.8). Практика выделения словосочетаний при индексировании с целью включения их в словарь и инверсный список является достаточно известной.
Рис. 4.2. Физическая структура БД и использование файлов модулями пользовательского интерфейса (БД НЗР)
Инверсный файл текстовой части (dcind.dbf) — список кодов слов и словосочетаний, сопровождаемых номерами страниц. Словарный и инверсный файл используются для сквозного полнотекстового поиска.
Справочно-поисковые файлы (СПФ) (до девяти различных файлов sfl.dbf — sf9.dbf). Стандартным является файл регистрационных карт нормативных актов (РК) — sfl.dbf, запись которого содержит наименование, дату, номер, вид, ссылки на страницы БД и другие поля, перечень которых может изменяться для конкретной БД (рис. 4.3).
Рис. 4.3. Взаимодействие программных компонент ЮРИУС в процессе создания и использования БД
Словарь справочно-поисковых файлов (ixfrv.dbf) содержит значения и коды полей (например РК) совместно с частотой появления (рис. 4.3) и ссылкой на номер файла СПФ.
Инверсный файл СПФ (ixind.dbf) содержит коды слов и словосочетаний. Словарный и инверсный файлы используются для поиска записей СПФ (РК, рубрики указателя и т. д.) с доступом к странице БД.
Файл синонимов (ixtrc.dbf) служит для расшифровки кодов или аббревиатур, а также для обеспечения двуязычного поиска в словарных файлах (см. рис. 4.2).
Файл описания СПФ (словарь данных ixddm.dbf — табл. 4.2) — содержит данные о полных, сокращенных и внутренних именах полей каждого СПФ, типах данных, разделителях слов, методах обработки числовых кодов и т. д. Используется при поиске через СПФ и при построении словарных и инверсных файлов.
Содержание колонок табл. 4.2 (см. также прил. 3—4):
• FLDNB — номер поля;
• FLDNM — имя поля в файле sfl.dbf;
• HDR01 — полное название поля (выводится в строке комментария, рис. 4.4);
Рис. 4.4. Поиск в частотном словаре (по заголовкам)
• HDR02 — краткое название (выводится в строке меню,
рис. 4.4.);
• MULTI — поле элементарное, форматное (1) или множественное, текстовое (число большее 1);
• DESCR ~- инвертируемое (пусто) или нет (непустое значение);
Таблица 4.2. Пример словаря данных для регистрационных карт БД по финансовому законодательству (ФЗ) |
• FLENG — длина поля в БД (в файле sfl.dbf);
• LONGF — короткое (1) или длинное (более 1) поле. Длинное
поле логически содержится в нескольких полях sfl.dbf. В дан
ном случае «Заглавие документа» помещается в поля N1, N2,
N3 файла sfl.dbf;
• HINMB — «гистограмма» значений — количество различных
значений поля, накопленных в частотном словаре;
• INITV — начальное значение, с которого частотный словарь
выдается в меню интерфейса пользователя (см. рис. 4.4);
• TERMW— разделители слов (используются для извлечения
слов из множественного поля);
• PURGW — удаляемые символы;
• RLENG — длина термина, выделяемого из поля и помещаемого в частотный словарь;
• FIDEC — число цифровых позиций в поле (слове), если поле
имеет тип N или X;
• DATYP — тип поля (А — символьное, N — числовое, X —
смешанное);
• TRCOD — использовать или нет расшифровку аббревиатур
или перевод слова при его выдаче в составе частотного словаря.
Файлы хранимых запросов (sql.dbf-sq9.dbf) содержат запросы к СПФ БД, отлаженные и сохраненные пользователем.
Файл заметок (notabene.dbf) позволяет пользователю дополнить СПФ собственными именованными прямыми ссылками на страницы БД.
Программные средства БД ЮРИУС. Рассмотрим структуру программных средств ИБД ЮРИУС (рис. 4.3).
Средства администратора БД и АРМ подготовки данных. Программные средства ЮРИУС позволяют осуществлять выделение тематических фрагментов БД на основе дескрипторного поиска и объединения нескольких фрагментов и БД (нескольких БД) при установке у пользователя.
Функции интерфейса оператора подготовки данных (ОПД) встроены в интерфейс АБД, однако в состав ЮРИУС входит также автоматизированное рабочее место (АРМ) ОПД, предназначенное для децентрализованного использования в пунктах подготовки данных.
АРМ оператора подготовки данных реализует следующие функции:
• ввод текстов актов и регистрационных карт;
• поиск РК по названию, дате, номеру;
• просмотр и корректировка РК и текста акта. Различаются: центральный интерфейс АБД, предназначенный для создания и поддержания дистрибутивной версии БД, и локальный интерфейс администратора базы данных, предназначенный для выполнения на ПЭВМ конечного пользователя (единичного или в режиме сети).
Центральный интерфейс АБД обеспечивает функции:
• построение словарного и инверсного файлов для СПФ;
• корректировка (вставка, удаление, редактирование элементов) СПФ с соответствующим обновлением ассоциированных файлов;
• построение словарного и инверсного файлов для полнотекстового словарного поиска;
• просмотр словарей, визуальное обнаружение ошибок, исправление словарей и текста;
• дозагрузка данных в БД;
• слияние нескольких БД (соединение и обновление файлов,
описанных выше). Построение частотных словарей сопровождается накоплением статистики словопоявлений с целью создания критериев отбора терминов индексирования.
Основные операции при загрузке БД в рамках центрального интерфейса (случай поиска по РК) включают построение на основе файла SF1 файлов IXIND, IXFRV, управление процессом загрузки (типом обработки полей) осуществляется с помощью файла IXDDM, структура и содержание основных полей которого приведены в табл. 4.2.
Локальный интерфейс АБД реализует следующие функции при установке БД на машине пользователя: определение и выбор устанавливаемого фрагмента БД; инсталляция выбранного фрагмента БД; объединение нескольких фрагментов БД (нескольких БД из ЮРИУС).
Интерфейсы конечного пользователя.
Интерфейс ZYобеспечивает поиск по значениям полей РК с последующим переходом к соответствующему полному тексту.
Первоначально пользователю предъявляются частотные словари полей РК в форме PullDown-меню (см. рис. 4.4). Выбранные из словаря значения комбинируются в логическое выражение запроса. Найденные РК могут просматриваться в сокращенном (рис. 4.5) или полном (рис. 4.6) форматах, затем пользователь может перейти к просмотру полного текста (рис. 4.7).
Рис. 4.5. После поиска. Найдено 4 документа (сокращенный формат) |
После запуска интерфейсной программы на экране терминала появляется
заставка системы, а после инициализации — Главное меню.
Рис. 4.6. Просмотр РК в полном формате |
Рис. 4.7. Просмотр полного текста (начало документа)
Структура Главного меню определяется структурой поискового файла, содержащего РК документов, и состоит из следующих строк и компонент (см. рис. 4.4):
• строка горизонтального меню. Перемещение по горизонталь
ному меню осуществляется с помощью клавиш <←> и < → >;
• строки вертикального меню, зависящие от выбора горизонтальной рубрики. Активизация вертикальной рубрики производится клавишами <↑>, < ↓ > и нажатием <Enter>;
• строка запроса, строка предупреждений, строка комментария.
Рис. 4.8. Поиск в частотном словаре полных текстов
Рубрики горизонтального меню разделяются на две группы:
· постоянные рубрики — пункты *Команда*, *3апрос*, *NotaBenq*;
· переменные рубрики — список поисковых полей регистрационных карт. Этот список определяется составом РК (содержанием ixddm.dbf. табл. 4.2) и может меняться для различных БД из Банка ЮРИУС.
Рис. 4.9. После поиска. Найдено 12 страниц
Рис. 4.10. Первая из найденных 12 страниц
При поиске в словаре по Значению необходимо в экранном окне набрать несколько первых символов отыскиваемого в словаре термина (рис. 4.4). На экране отображается страница словаря, начиная с первого термина, содержащего введенные символы. После формирования запроса необходимо перейти к рубрике * Команда* и выполнить запрос. Результат поиска (в сокращенном формате одна запись — одна строка экрана) представлен на рис. 4.5, в полном (одна запись РК на экране) — на рис. 4.6. Для перехода к просмотру полного текста (рис. АЛ) необходимо подвести курсор к соответствующей строке (рис. 4.5) или к позиции Текст (рис. 4.6) и нажать <Enter>.
Поисковый критерий генерируется автоматически в процессе ввода пользователем (или выбора из словаря) списка значений. Основные принципы построения запроса следующие:
• критерии для разных полей соединяются связкой and (И);
• критерий для поля составляется из нескольких значений через
and (И) (для множественного поля) либо or (или) (элементарное поле);
• отрицание (связка не) задается знаком '—' («минус») перед со
ответствующим словом (значением).
Например, если пользователь выбрал значения АКАДЕМИЯ, НАУК для поля Загл и 93.04.01, 95.07.07 для поля Дата, эквивалентный поисковый критерий будет выглядеть следующим образом:
(Загл='АКАДЕМИЯ') AND (Загл='НАУК') AND (Дата='93.04.01' OR Дата='95.07.07').
Интерфейс полнотекстового поиска (DC), Пример главного меню DC-интерфейса приводится на рис. 4.8. Поиск в частотном словаре активизируется рубрикой Значение.
Для поиска страниц, содержащих термин запроса, необходимо установить курсор на термин и нажать <Enter> (рис. 4.9). Переход к полному тексту (рис. АЛО) осуществляется активизацией рубрики Текст Главного меню.
Дата добавления: 2015-07-20; просмотров: 221 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Отечественные АИСЗ | | | Офисные информационные системы |