Маленький обзор OCR для Lnux

Автор Udachnik, 16 февраля 2011, 20:26:47

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Udachnik

Надо сказать, что совсем недавно ситуация с системами оптического распознавания текста (Optical character recognition или сокращённо OCR) для Linux складывалась просто катастрофическая. Gocr, Ocrad и прочие консольные программы мало того что распознавали текст крайне некорректно, так ещё и не давали никакого удобства при работе. Ну а как обстояли дела с распознаванием кириллицы это вообще отдельная история, при чём ещё более печальная.
Но, в последние год - полтора наконец наметился сдвиг. Связано это, в первую очередь, с появлением более качественных открытых движков OCR - Tesseract и Cuneiform. Задачей этого маленького обзора будет рассмотреть две программы для распознавания текста, использующие эти движки.

1. OCRFeeder. Домашняя страница http://live.gnome.org/OCRFeeder
Программа написана на GTK+ и по заявлению разработчиков может использовать в качестве движка что угодно. И действительно, программа без проблем обнаружила установленные у меня на компьютере Tesseract и Cuneiform. При этом выбирать для распознавания можно и тот и другой.
Получить изображение можно и со сканера и путём импорта уже отсканированного материала. К сожалению, при попытке сканирования OCRFeeder выдал мне лишь маленький кусочек от исходного листа:

Пришлось сканировать лист отдельно. И надо сказать, работа с изображением тут построена очень неплохо.

Программа умеет отличать текст от изображения, работать с текстовыми блоками и даже форматировать распознанный текст. Но, к сожалению, посмотреть на работу всех этих функций у меня не получилось. Программа просто отказалась что-либо распознавать:

Вот такое окно у меня висело минут пять. Смена движка с Tesseract на Cuneiform ничего не дала. Вот так всё печально.

2. YAGF. Домашняя страница http://symmetrica.net/cuneiform-linux/yagf-ru.html
Это уже отечественная разработка на Qt4. Работает только с Cuneiform. Интерфейс программы немного корявый и сделан без изысков. Но и так неплохо. Программа так же как и OCRFeeder умеет получать изображение как со сканера так и из файла. Но тут работа ведётся с помощью xsane (или иной программы для сканирования, установленной в системе):

С распознаванием текста полный порядок. Но вот про форматирование можно забыть:

Так же имеется возможность работать с блоками текста:

Ну, и наконец, сохранение текста. YAGF умеет экспортировать текст в формат txt или копировать его в буфер обмена. Конечно, скромно, но и на том спасибо:


В конце можно подвести маленький промежуточный итог. С распознаванием текста для Linux до сих пор всё плохо. Но не ужасно, как пару лет назад, а просто плохо. Но, надеюсь, в ближайшее время ситуация будет только улучшатся. И к этому есть все предпосылки.
Что касается двух программ, то можно сказать следующее. OCRFeeder более наворочен   функционален. Но вот заставить его работать мне так и не удалось. YAGF хоть и страшненький, со своей работой справляется. и хотя о сохранении форматирования, и уж тем более о распознавании таблиц речи не идёт, имеющиеся возможности уже огромный прогресс.

Программы взяты из репозитория http://notesalexp.org/
  •  
    Users thanked this post: BULATUS

sharabdin

дай Бог ,чтоб ОСR в Linux е была лучшая и с открытым кодом  :)
  •  

SeHELLioN

#2
кстати, tesseract в тестинге наконец-то 3, теперь он поддерживает русский язык (и еще большую кучу других);  работоспособность проверю позже

Сообщение объединено: 02 марта 2012, 00:12:13

ocrfeeder + tesseract
всё очень печально...даже с английским много проблем, даже со скриншотов...не говоря уже о сканах и фотках... :(
  •  

leonid

А как установить YAGF для чайника? Он есть в деб пакете чтоб установить в один клик?
  •  

I-Jurij

Цитата: leonid от 11 марта 2012, 23:01:24
А как установить YAGF для чайника? Он есть в деб пакете чтоб установить в один клик?
Здесь есть http://notesalexp.org/
  •  

leonid

Цитата: I-Jurij от 11 марта 2012, 23:17:03Здесь есть http://notesalexp.org/
Око видит, да зуб неймет. Мне бы для чайника - делай раз, делай два...
  •  

SeHELLioN

Открыть содержимое (спойлер)
ЦитироватьОко видит, да зуб неймет. Мне бы для чайника - делай раз, делай два...
так там же вверху всё подробно расписано :o
[свернуть]
  •  

leonid

Вкл-выкл-клик я уже освоил. Но программирование еще нет. Он есть в деб пакете чтоб установить в один клик?
  •  

SeHELLioN

да, есть, но к сожалению, похоже так скачать нельзя
не разбирался в этом вопросе
а так добавили реп, поставили ключ, обновили список реп, #apt-get install yagf , отключили реп
  •  

leonid

Цитата: SeHELLioN от 11 марта 2012, 23:47:45да, есть, но к сожалению, похоже так скачать нельзя
не разбирался в этом вопросе
а так добавили реп, поставили ключ, обновили список реп, #apt-get install yagf , отключили реп
А для чайника?
  •  

vladimir_ar

#10
В синаптике.
Заходим в источники приложений и добавляем нужный реп - для сквизи это
deb http://notesalexp.org/debian/squeeze/ squeeze main

Закрыть синаптик.
В терминале (от sudo)
wget -O - http://notesalexp.org/debian/alexp_key.asc | apt-key add -

Открыть синаптик.
Нажимаем обновить (вверху слева первая иконка в виде зеленой свернутой стрелочки.
В строке поиска пишем интересующий нас пакет и отмечаем для установки. Появляется вверху активная зеленая галочка.
Нажимаем.
Заходим в источники приложений и снимаем галочку с добавленного репозитория.
Нажимаем обновить.
Все.
Debian Testing, kernel 3.16-2-amd64, OpenBox
AMD A8-3750 / 16Gb RAM / ATI HD6550D (onboard) / Sound ASUS Xonar - DS
_______________________________
Debian Testing, kernel 3.14-2-amd64, OpenBox
HP-655 AMD E1 / 8Gb RAM / ATI HD7310M
  •  

leonid

На первом шаге что то не идет.
  •  

vladimir_ar

Собственно - не страшно. Предупреждения. При установке может спросить, точно ли желаете установить из непроверенного источника.
Debian Testing, kernel 3.16-2-amd64, OpenBox
AMD A8-3750 / 16Gb RAM / ATI HD6550D (onboard) / Sound ASUS Xonar - DS
_______________________________
Debian Testing, kernel 3.14-2-amd64, OpenBox
HP-655 AMD E1 / 8Gb RAM / ATI HD7310M
  •  

leonid

Спасибо!
Очень доступно, для чайника!
  •  

Malaheenee

Открыть содержимое (спойлер)
Один клик - это только опенСУСЕ. В Дебиане и его производных нужно уметь шевелить мозгами и пальцами.
[свернуть]
Все мы где-то, когда-то и в чем-то были новичками.
  •