Читайте также:
|
|
Можливості програми:
• підтримує протокол TWAIN. Зі сканерами фірм Microtec і Hewlett Packard може працювати безпосередньо;
• забезпечує автоматичну настройку на нові шрифти;
• має вбудовану систему перевірки орфографії для швидкого виявлення невірно розпізнаних слів;
• розпізнає таблиці зі збереженням їхньої структури;
• підтримує більш як 40 мов, може розпізнавати тексти на мішаних мовах, наприклад російсько-українські, англо-українські тощо, причому користувач може самостійно визначити мову або групу мов для тексту, який розпізнається;
• може працювати у пакетному режимі, що значно скорочує тривалість оброблення багатосторінкових документів. Пакет — це сукупність сторінок, об'єднаних загальним заголовком і впорядкованих за номерами;
• забезпечує передачу розпізнаних документів до Microsoft Word та Microsoft Excel.
Запуск програми здійснюється звичайними для середовища Windows засобами: або клацанням мишею на значку програми, або за командою ПУСК—Программы-ABBYY FineReader—FineReader. Після закінчення завантаження на екрані з'являється робоче вікно програми.
Програма FineReader може видавати повідомлення для користувача на кількох мовах. Вибір мови здійснюється за командою Сервис — Опции (Tools — Options). На вкладці «Общие» («General») у списку «Язык интерфейса» необхідно вибрати потрібну мову і підтвердити вибір клацанням мишею на кнопці «ОК».
Основні операції оброблення документа у програмі FineReader виконуються за допомогою панелі інструментів або за допомогою Майстра Scan&Read.
Майстер Scan&Read викликається клацанням мишею на кнопці «Scan&Read». Робота користувача при цьому полягає у послідовному виконанні рекомендацій Майстра.
Кращих результатів можна досягти в разі сканування поетапно, використовуючи панелі інструментів, оскільки при цьому забезпечується більший контроль проміжних підсумків і можна, оперативно втрутившись, поліпшити якість сканування.
Процес оброблення документа складається з п'яти етапів:
1. Сканування документа (кнопка 1).
2. Сегментація документа (вертикальна панель інструментів або меню Изображение).
3. Розпізнавання документа (кнопка 2).
4. Редагування і перевірка результату (кнопка 3).
5. Збереження документа (кнопка 4).
Із кожною кнопкою панелі інструментів пов'язано меню, один із пунктів якого є в даний момент активним.
На етапі сканування проводиться здобуття зображень за допомогою сканера і збереження їх у вигляді, зручному для подальшого оброблення. Якщо потрібна точна настройка параметрів сканування, а також коли різні сторінки сильно різняться за якістю, краще працювати зі сканером через драйвер TWAIN. Як правило, в цьому режимі можна вибрати роздільну здатність, задати тип документа (текст, чорно-білий рисунок, чорно-білий напівтоновий рисунок, кольоровий малюнок та ін.). Для підключення драйвера TWAIN необхідно встановити позначку «Показывать диалог TWAIN-драйвера сканера» на вкладці «Сканирование», яка викликається за командою Сервис — Опции.
Щоб почати сканування, треба ввімкнути сканер і клацнути мишею на кнопці «1. Сканировать» панелі інструментів «Scan&Read» вікна програми FineReader.
Потім завантажується вікно TWAIN-драйвера відповідного сканера. В ньому спочатку виконується попереднє сканування: сканується вся область документа.
Після завершення попереднього сканування потрібно виділити відповідну область для повного сканування, провести корекцію зображення, зокрема горизонтальне та вертикальне вирівнювання, і визначити параметри зображення, такі як: чіткість зображення, режим кольору, яскравість та контрастність, роздільну здатність тощо. Під час вибору роздільної здатності потрібно мати на увазі, що чим вона вища, тим точніше результат відповідає оригіналу, але при цьому різко зростають розміри документа і збільшується тривалість сканування. Як правило, для текстових документів доброї якості можна вибрати роздільну здатність 200—300 точок/дюйм. Для того щоб здобути високоякісні зображення, необхідно встановити максимально можливу оптичну роздільну здатність.
Встановлення оптимальних параметрів повного сканування дає змогу зменшити обсяг інформації, яка передається зі сканера до програми, і тривалість її оброблення. Після встановлення нових параметрів може бути автоматично проведене повторне сканування.
Після закінчення сканування вікно TWAIN-драйвера закривається.
У момент завершення передачі у вікні «Пакет» програми FineReader оброблена сторінка відображається у вигляді значка, а на основній частині робочої області з'являється вікно «Изображение», що містить зображення поточної сторінки.
Вікно програми FineReader із зображенням документа
За допомогою кнопок панелі інструментів зображення можна повернути на кут, кратний 90°. У нижній частині вікна можна побачити збільшений фрагмент зображення, який вибирається у вікні «Изображение» клацанням мишею. Масштаб зображення в кожному вікні можна вибрати в контекстному меню або в меню Вид.
На цьому процес сканування закінчується. Подальше оброблення сканованого зображення можна зробити відразу ж або пізніше, зберігши його у вигляді графічного файла за командою Файл—Сохранить копию изображения..., а потім відкривши за командою Файл—Открыть.... За цими командами відкриваються стандартні вікна збереження і відкривання файла.
Наступний етап оброблення документа — сегментація, коли відбувається розбиття сканованого зображення на окремі фрагменти (блоки). Різні типи блоків обробляються програмою по-різному. Програма FineReader підтримує такі типи блоків:
• текстовий («Текст») — на етапі розпізнавання перетворюється на текст;
• табличний («Таблица») — набір комірок, вміст яких перетворюється на текст окремо;
• зображення («Картинка») — вставляється в документ без зміни як графічний об'єкт;
• що містить штрих-код («Штрих-код») — розпізнається як штрих-код;
• зайвий («Нераспознаваемый») — під час розпізнавання ігнорується.
Процес автоматичної сегментації починається після клацання мишею на кнопці «Анализ макета страницы». При цьому різні типи блоків відображаються у вигляді прямокутних рамок різних кольорів зі своїм номером у лівому верхньому кутку.
Якщо структура сторінки досить складна, то можна скористатися ручною сегментацією або провести корекцію результатів автоматичної сегментації. Новий блок створюється "протягуванням" миші по діагоналі блока, який треба створити.
Для корекції блок спочатку необхідно виділити клацанням мишею (блок 2 на рисунку нижче),
Вікно програми FineReader після сегментації зображення
а потім за допомогою кутових маркерів змінити розмір або позицію поточного блока.
Команди редагування блоків винесено на вертикальній панелі інструментів у вигляді кнопок:
1 2 3 4 5 6 7 8 9 10 11 12
Кнопки (в порядку їх нумерації) дають змогу:
1. Виконати автоматичну сегментацію.
2. Виділити і зробити аналіз поточного блоку.
3. Виділити текстовий блок.
4. Виділити табличний блок.
5. Виділити блок малюнку.
6. Виділити для редагування поточний блок.
7. Додати вертикальну лінію в табличному блоці.
8. Додати горизонтальну лінію в табличному блоці.
9. Вилучити вертикальну лінію із табличного блоку.
10. Зменшити масштаб перегляду у вікні «Изображение».
11. Збільшити масштаб перегляду у вікні «Изображение».
У контекстному меню можна вилучити один або всі блоки, змінити тип блока, очистити блок. Після сегментації можна розпочинати розпізнавання тексту.
Етап розпізнавання тексту починається після клацання мишею на кнопці «2.Распознать» і повністю автоматизується. З метою зменшення помилок розпізнавання необхідно правильно встановити мову документа, вибравши її зі списку на панелі інструментів за допомогою миші. Якщо документ містить фрагменти на різних мовах, то потрібні мови вибираються встановленням в списку прапорців напроти відповідної мови.
Процес розпізнавання супроводжується забарвленням текстових і табличних блоків у вікні «Изображение» блакитним кольором. Нерозпізнані символи забарвлюються синім кольором. У ході розпізнавання можуть з'являтися повідомлення з рекомендаціями про додаткові настройки з метою підвищення якості розпізнавання, наприклад провести повторне сканування з підвищеною роздільною здатністю. Після завершення розпізнавання текстовий документ відображається у вікні «Текст».
Невпевнено розпізнані слова в тексті позначено блакитним кольором. Кнопки на панелі «Форматирование» дають змогу перейти до наступного та попереднього невпевнено розпізнаних слів. За необхідності невпевнено розпізнані слова можна відредагувати.
Відредагувати текст можна, використовуючи панель інструментів «Форматирование». Способи форматування у програмі FineReader подібні до тих, що застосовуються у відомих текстових редакторах, наприклад WordPad, Word 97, Word 2000. Крім того, програма дає змогу перевірити орфографію (кнопка «3.Проверить».
Оброблений документ може бути збережений в буфері обміну або у файлі, пересланий електронною поштою, а також переданий для подальшого оброблення текстовому редактору Microsoft Word або табличному процесору Microsoft Excel. Усі режими можна вибрати з меню, яке викликається на екран після клацання мишею на кнопці «4.Сохранить». Фрагмент вікна програми FineReader із цим меню показано на рис:
Збереження документа є заключним етапом роботи для перетворення в електронний вид.
Контрольні питання:
1. Як виконати сканування текстового документа?
2. Як виконати сканованого зображення на окремі частини?
3. Як встановити мову розпізнання тексту?
4. Як виконати розпізнання тексту?
5. Як передати документ в програму Microsoft Word?
Лекція 11. Програми перекладу тексту Play Ruta та Promt
План заняття
1. Автоматизоване перекладання документів
2. Програма перекладу тексту Play Ruta
3. Програма перекладу тексту Promt
1. Автоматизоване перекладання документів
.
Ідея використання комп'ютера для автоматичного перекладу текстів виникла ще на початку появи ОТ. Для автоматичного перекладу документів з однієї мови на іншу розроблено багато різних програм. Однак через складнощі опису семантики природних мов до цього часу остаточно проблему перекладу ще не вирішено.
Значно полегшити роботу з документами можна, користуючись програмним забезпеченням, орієнтованим на автоматичний переклад та автоматичну перевірку правопису. Розробники програмних пакетів пішли ще далі у процесі підвищення зручності для користувача: більшість із цих програм при інсталяції інтегруються в пакет Microsoft Office.
Дата добавления: 2015-07-20; просмотров: 296 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Робота з колонтитулами | | | Програма перекладу тексту Play Ruta |