Оболочка YAGF предоставляет графический интерфейс для консольных программ распознавания тектов cuneiform и tesseract на платформе Linux. Кроме того, YAGF позволяет управлять сканированием изображений, импортом страниц из документов PDF, их предварительной обработкой и собственно распознаванием из единого центра. Программа YAGF также упрощает последовательное распознавание большого числа отсканированных страниц.
YAGF необходимы библиотеки Qt версии 4.6 или более поздней и пакет проверки орфографии aspell. Если вы хотите управлять сканированием изображений напрямую из YAGF, установите программу XSane. Для распознвания текста потребуется либо cuneiform, либо tesseract. Для импорта страниц из файлов PDF необходимо установить утилиту pdftoppm либо пакет GhostScript (который содержит программу gs).
Работа в YAGF состоит из нескольких этапов: получение изображения (серии изображений) страниц; подготовка к распознаванию (если необходимо); распознавание; сохранение результатов.
Вы можете использовать файлы изображений, сохраненные на жестком диске, или отсканировать новое изображение. Для того чтобы загрузить изображение, воспользуйтесь командой Файл/Открыть (вы можете открыть несколько фалов сразу). Вы также можете перетащить графически файлы мышью на темную полосу в левой части главного окна программы, в результате чего они будут загружены в программу. YAGF поддерживает все основные растровые гафические форматы (JPEG, PNG, BMP, TIFF, GIF, PNM, PPM, PBM и другие). Если имя открытого файла имеет вид nameXXX.ext, где XXX - последовательность цифр, вы можете переходить к предыдущему/следующему файлам с помощью кнопок перехода, расположенных на панели быстрого доступа. Например, если вы открыли файл MyPage06.jpg, то при щелчке кнопки перехода к следующему изображению программа попытается открыть файл MyPage07.jpg.
Если буфер обмена содержит растровое изображение, ывв можете добавить это изображение к списку изображений YAGF с помощью соответствующей команды.
Вы можете получать изображения напрямую со сканера с помощью программы XSane. Находясь в YAGF, скомандуйте Файл/Сканировать. Будет запущена программа XSane. Настройте параметры сканирования в XSane и нажмите кнопку "Сканировать". По окончании сканирования в окне просмотра изображений YAGF появится отсканированное изображение. Если вам нужно отсканировать несколько изображений, выполняйте эти операции несколько раз (в окне просмотра изображений всегда будет открыто последнее отсканированное изображение, вы можете перейти к предыдущим изображениям, используя команды перемещения). Вы можете работать в YAGF, не закрывая окно XSane. Если вам нужно отсканировать очередное изображение, просто щелкните кнопку XSane "Сканировать". При выходе из YAGF открытое программой окно XSane будет закрыто автоматически. Для перехода к другим отсканированным изображениям пользуйтесь кнопками с панели быстрого доступа, как было описано выше. Все полученные изображения отображаются в уменьшенном виде на панели изображений в левой части главного окна программы. Вы можете сохранить эти изображения в отдельную директорию с помощью кнопки "Сохранить".
Вы так же можете импортировать страницы из незашифрованных файлов PDF. Для этого воспользуйтесь командой "Файл>>Импорт из документа PDF...". В открывшемся диалоговом окне вам будет предожено выбрать файл PDF и режм экспорта (интервал страниц или весь документ). Затем вам будет предожено выбрать пустую директорию для сохранения импортированных страниц или создать новую директорию.
В YAGF вы можете выполнть простые операции подготовки отсканированного изображения: выделение блока текста для распознавания и поворот. Если изображение ориентировано неправильно, его можно повернуть на 90 градусов по и против часовой стрелки или на 180 градусов. Делается это с помощью кнопок панели быстрого доступа в окне просмотра изображений. Если вы хотите передать на распознавание не все отсканированное изображение, а его часть, вы можете выделить мышью один или несколько прямоугольных блоков в окне просмотра изображений. Если щелкнуть левой кнопкой мыши по существующему блоку, его цвет изменится на розовый. Теперь размер выбранного блока можно изменить, "ухватившись" мышью за край блока. Если щелкнуть в окне изображения правой кнопкой мыши, появится контекстное меню, с помощью которого можно удалить все выделенные блоки, удалить выбранный блок, распознать текст выбранного блока.
Для удобства выделения блоков вы можете уменьшить или увеличить размеры изображения в окне просмотра (эта операция не влияет на размеры изображения, передаваемого программе cuneiform). Изменение видимых размеров изображения можно выполнить так же с помощью комбинаций клавиш Ctrl++ и Ctrl+- или вращая колесико мыши, удерживая при этом клавишу Ctrl (точно так же можно изменить размеры шрифта в окне просмотра текста).
Если в программе открыто несколько страниц и для кадой выбраны своя ориентация, свой масштаб и выделены свои блоки, YAGF запомнит эти параметры для каждой страницы.
Если страница отсканирована неровно, с наклоном, вы можете попробовать исправить наклон с помощью новой функции "Исправить наклон страницы". Для этого нажмите соответсвующую кнопку. Вы так же можете исправить наклон страницы, используя выделеный блок в качестве образца текстового фрагмента. На странице с наклоном выделите блок, содержащий большой фрагмент текста, щелкните по блоку правой кнопкой мыши и в открывшемся контекстном меню выберите команду "Выровнять блок".
Начиная с версии 0.8.7, вы можете выбирать программу распознавания - cuneiform или tesseract (меню "Настройки>>Настройки программ распознавания"). Программа tesseract, начиная с версии 3.0, позволяет распознавать некоторые языки, не поддерживаемые cuneiform (греческий, финский и т.д.). Соответствующие языки помечены в списке языков распознавания меткой "только tesseract". Если вы выбрали tesseract для распознвания текстов, убедитесь, что в вашей системе установлены файлы данных для тех языков, на которых вы собираетесь выполнять распознавание.
Приступая к распознаванию, вы должны выбрать подходящий язык распознавания (или пару языков, если распознаваемый документ написан на нескольких языках). Основная версия cuneiform позволяет вам распознавать тексты почти на всех европейских языках (см. докуентацию по cuneiform), а также тексты, содержащие пару языквов русский-английский.
Каждый новый распознанный фрагмент текста (выделеный блок или новая страница) добавляется в редактор распознанного текста в виде нового абзаца.
По умолчанию YAGF выполняет проверку орфографии распознанного текста с помощью libaspell. Обычно в вашей системе устанавливаются орфографические словари для "родной" локали система и английского. Если вы хотите проверять орфографию для текстов на других языках, установите соответстующие словари (они должны быть в репозитории вашей системы). Если YAGF не находит нужного словаря для проверки орфографии для заданного языка распознавания, программа предупреждает вас об этом. Отключите проверку орфорграфии, если не хотите получать такие предупреждения.
Если вам нужно распознать текст сразу с нескольких изображений, вы можете воспользоваться пакетным распознаванием. Для этого все изображения, которые требуется распознать, должны быть открыты на панели изображений (в левой части окна программы). Щелкните кнопку "Распознать все страницы". Все открытые изображения будут загружаться и распознаваться автоматически. При этом будет выведено диалоговое окно, отображающее прогресс распознавания. Вы можете остановить процесс пакетного распознавания, щелкнув кнопку "Прервать". Если на распознаваемых страницах выделены блоки, будет распознан только текст внутри блоков.
Распознанный текст может быть сохранен на диске в текстовом формате (кодировка UTF-8), в формате HTML или скопирован в буфер обмена. Кнопка "Копировать текст в буфер обмена" копирует в буфер выделеный фрагмент распознанного текста или весь текст, если в редакторе отсутствует выделение.
Иногда может возникнуть ситуация, при которой YAGF запускает сканирование через XSane, но результаты сканирования в YAGF не передаются. В этом случае необходимо закрыть программу YAGF и открыть директорию /var/tmp и удалить из нее файл yagf.fifo (для этого могут понадобиться права root).
Новейшая версия YAGF - 0.8.9, обновлена 18 декабря 2011 года. тексты (для сборки требуется CMake и Qt верси 4.6 или более поздней):
yagf-0.8.9.tar.gz
Патч, предоставленный Штефаном Гарте (распознавание немецкого и швдеского, набранных готическим шрифтом, с помощью tesseract 3.0)
Контакты: anb@symmetrica.net
Понравился контент? Нажми: