Читайте также: |
|
Мщшрмацшиш мцш о!шш: идхцы к разрабвш и стандартизации
аЗАДгёёжжззйййийккцбсст УУУУУШуччьцл ААААГЁЁЖЖЗЗЙЙЙПККК НОССТУУУУ^УУУ^ХЧчй 5ШУУШЧЧЙ** ААААГЁЁЖЖЗЗЙЙЙПККК аёё&ГёёжжэзнШЩкнбсст ШАгйВЖЖЗЭйййПКкк ЯШЮжж5зййй1Щкнд($т | уууууу$у?ччвхх | ГБпклн.вууцчЧ,'с |
Рис. 17. Греческий алфавит без акцентов и с акцентами 379 ^Щ |
— требуемый объем алфавита (определяемый обрабатываемой информацией) превышает реальный объем алфавита, используемый в большинстве широкодоступных технических и программных средствах;
— невозможно избежать искажений данных (появления кодовой дезинформации), если не наложены жесткие ограничения на алфавит и не отработаны правила (нормативные документы), определяющие правила представления символов;
— программные средства, как правило, обеспечивают ввод и обработку линейных последовательностей символов, но реальные элементы данных могут потребовать для своего кодирования нелинейных последовательностей (символов с верхними и нижними индексами, многоуровневыми индексами, структурные формулы и т.п.). Для работы с такими данными должны быть разработаны специальные методы преобразования нелинейных текстов и индексов в линейные;
— для всех символов и транслитерационных кодов должны быть разработаны правила лексикографического упорядочения данных. Иначе будет существенно затруднена работа с выходными документами.
Некоторое представление о требуемом объеме алфавита можно проиллюстрировать следующими примерами:
— суммарный алфавит, допускающий набор текстов на 90 основных языках, имеющий в своей основе только латинский и русский алфавиты, содержит около 400 символов (прописные и строчные символы считаются различными);
— только строчных букв особого начертания и букв с диакритическими знаками для русского алфавита не менее 93, а для алфавита на латинской основе — 176;
— в греческом алфавите 49 символов и только строчных букв с акцентами — 105;
— существует не менее 50 математических знаков;
— по прогнозу ВИНИТИ объем алфавита для подготовки информационных изданий (без учета изменений кегля и линии шрифта) оценивается в 1 500 символов.
Проблему лексикографического упорядочения информации можно проиллюстрировать следующими примерами: 1. Символы одного и того же начертания имеют различный порядок следования в алфавитах разных „,„языков,:,,[„,. 378
аёакаёёёёща'ёС6с$ёёёёёёёёе§#&
ЦПШП&1пй()пЙ1?бдддд6ддё&§6$ Нг{ййййййййцйй№?уу'угНа56
АААААААА/[АСССМОЁЁЕЁЁ
ТТтООООООООуСОП??
тиле
айёта-йа.&ас(еёёёёёё6ё(Ш иттЩЛАШубббддбдбМНэ НМйиййййййцбй Щу$уШ&ё
Рис. 16. Разрешенные (употребляющиеся) сочетания латинских букв с диактическими знаками |
Рйе1 15.Разрешенные употребляющиеся сочетания кириллических букв с диактическими знаками и дополнительные символы из алфавитов народов РФ и стран восточной Европы
Кегль 24 светлый
Дата добавления: 2015-08-02; просмотров: 88 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Алфавит представления данных | | | АВГДЕШеИШШЕОПР ЕТУФХте |