Читайте также:
|
|
статистический (простой) – список словоформ текста сопоставляется со списком эталонных текстов; те, что встречаются один раз, помечаются как возможно ошибочные.
полиграммный – основан на вероятности сочетаний символов в графике (гэ, йй, ъо, ьо, ъ_, жэ); возможное использование в подсказке или в качестве дополнительного.
Ошибки бывают разными, как и принципы орфографии
Передача буквами фонемного состава
слитно/раздельно/через дефис
прописные/строчные
Правила переноса
Правила графических сокращений
Эти разделы по-разному реализованы в WinOrfo.
Разные орфограммы
требуют привлечения разноуровневого автоматического анализа: от чисто графематического (применяется везде) до (!) семантического.
А в некоторых случаях не обойтись без акцентного анализа, что само по себе невозможно (никто – некто).
Передача буквами фонем
Гласные
Безударные
После шипящих и Ц
Е/Э
Согласные
глухие/звонкие
Непроизносимые
удвоенные/неудвоенные (в том числе Н и НН)
Употребление Й
Основные проблемы раздела
Омофония (остальные формы легко подаются списком); омофония и омография не только целых слов, но и их частей (случайное разбиение слов при наборе).
Встречаемость малочастотных буквосочетаний (например, в аббревиатурах)
Дата добавления: 2015-07-11; просмотров: 51 | Нарушение авторских прав