Читайте также:
|
|
Рассмотрение начнем с основного структурного элемента любого текста и любой информационной модели — алфавита (набора графических элементов), который используется для представления информации.
Используемый алфавит накладывает самые существенные ограничения на представление документальных ресурсов. 376
•<> Алфавиты считаются различными, если они отличаются набором разрешенных символов (хотя бы единственного), и/или методом кодирования символов (хотя бы одного), и/или принятыми в системе отношениями лексикографического упорядочения символов (хотя бы для одного символа), и/или принятой системой транслитерации символов, отсутствующих в алфавите технических средств.
Как правило, алфавит задается в описании технических средств или конкретного программного средства, но часто с большой степенью неопределенности.
При этом предпочитают не акцентировать внимание на последствиях подобных преобразований таблиц-кодировок:
! — резкое снижение возможностей по представлению латин- а. " ских символов с диакритическими и другими знаками;
— отключение греческой части алфавита, и/или графических символов;
— изменение в лексикографическом порядке следования символов, которые приводят к изменению порядка упорядочения информации;
,— возможность появления кодовой синонимии, которая ве-: дет к дезинформации из-за неправильного прочтения «русифицированного текста» при определенных процессах обработки и т.п.
Поэтому пользователю необходимо, прежде чем он приступит к разработке информационной модели объекта, определить действительный объем требуемого алфавита представления данных. Только в этом случае он может при переходе к использованию конкретных технических и программных средств выявить всё «неявные», скрытые «по умолчанию» ограничения на алфавит системы и сформулировать их в явной форме (см. рис. 15, 16, 17, 18, 19).
, Алфавит, используемый для представления данных, должен обеспечить принятый в системе уровень однозначности кодирования данных (обрабатываемых и управляющих обработкой).
При этом необходимо учитывать следующее:
— информация, включаемая в информационную модель
объекта, как правило, многоязычна. А каждый язык —
это свой алфавит со своим набором символов и своими ___ правилами лексикографического упорядочения; 377
Дата добавления: 2015-08-02; просмотров: 59 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Ииформацнотш мадии аашти: падщы к разработке и стандартизации | | | Раздел В |