Підготовка скану до якісного розпізнавання
- 16.08.13, 18:59
Готуємо скани до розпізнавання
1. Відкриваємо в Фотошопі
2. Редагування Трансформація … Виставляємо потрібне положення
3. Зображення Розмір зображення
Виставляємо знявши позначку з інтерполяції розширення 300, ОК.
Повторюємо Зображення Розмір зображення
Ставимо позначку на інтерполяції та знімаємо з «Зберегти пропорції».
Виставляємо в «розмірі друкованого відтиску» 21 см ширини та 29 см висоти. ОК
Ще раз Зображення Розмір зображення
Виставляємо позначки коло «Масштабувати стилі» та «Зберегти пропорції». ОК.
(цю операцію при бажанні можна автоматизувати через «Вікно операції (Alt F9)»)
4. Виділення все (Ctrl A)
За допомоги напрямних (клацнути на лінійці та перетягнути на зображення) та опцій
Редагування Трансформація Деформація
або в залежності від ситуації
Фільтр перекручування корекція дисторсії
виставляємо більш-менш рівне положення строк
5. Якщо треба зробити більш чітким зображення використовуємо наступний прийом
Шар Створити дублікат шару ОК
Фільтр Інші Кольоровий контраст
Радіус – 4 ОК
Зображення Корекція Знебарвити
На правій панелі «Шари» установлюємо режим «М’яке світло»
Далі «Шар об’єднати видимі» ОК
6. Може бути проблема неоднакового освітлення. Для її вирішення проведемо наступні операції
Шар створити дублікат шару ОК
Фільтр ескіз ксерокопія
Деталізація – 24, затемнення – 2. ОК
Зображення зовнішній канал
Накладення – множення
Повторити останню операцію до появи чіткого малюнку.
За допомоги інструменту «Чарівна палиця» виділяємо всі темні літери (прослідкувати щоб на віконці суміжні пікселі не стояла позначка, і щоб літери були виділенні повністю з усіма відтінками).
Виділення модифікація розширення 1 піксель.
Повторити
(при бажанні можна автоматизувати всі операції після виділення)
Шар видалити шар
Редагування скопіювати (Ctrl C) Редагування вклеїти (Ctrl V)
Фільтр ескіз ксерокопія
Ми отримуємо значно якіснішу ксерокопію, яку за потреби можна затемнити виставивши не 2, а більший параметр затемнення.
Клацнути на початковий шар
Шар видалити шар
7. За допомоги гумки та інструментів видалення почистити зображення від зайвих деталей
Для полегшення роботи бажано залити прозорі частини зображення білим кольором
Отримуємо наступний результат:
8. Зберігаємо зображення в розширенні tiff (можна jpg, але бажано найкращої якості)
9. Можна додатково вирівняти за допомогою програми BookRestorer.exe
В цій програмі спочатку за допомоги інструмента «New» (Ctrl N) створюємо новий проект, а потім клацнувши на Section 1 правою клавішею мишки імпортуємо потрібний нам файл.
10. Клацнувши на іконку ми активізуємо файл, а на «Geometrical correction» ми запускаємо механізм вирівнювання зображення
11. Через «Book Publish» зберігаємо файл в потрібному нам місці
12. Відкриваємо файл в ABBYY FineReader.
13. Повиправляємо за потреби через «Сторінка редагувати зображення сторінки», розпізнаємо
14. Виходить досить якісний скан з мінімальною потребою редагування тексту.
P.S. Можна, звісно не використовувати Fotoshop та BookRestorer.exe, а спробувати опрацювати та розпізнати зразу в ABBYY FineReader, однак в випадку неякісного зображення результат буде набагато гірше, і потребувати значної вичитки та доводки тексту.