OCR z gImageReader 2.93
Ponieważ wspomniany parę dni temu program OCRFeeder nie każdemu przypadł do gustu, warto przychylnym okiem spojrzeć na zaktualizowany niedawno gImageReader 2.93. Program takiego samego przeznaczenia, czyli szeroko pojętego usprawnienia procesu wyodrębniania tekstu z obrazów. Nieco inna zasada działania, nieco częstsze aktualizacje, czytelny interfejs czynią z gImageReadera też ciekawą ofertę na potrzeby OCR.
A jak wygląda rozpoznawanie tekstu? gImageReader korzysta z tego samego silnika co OCRFeeder, czyli Tesseract. Dodatkowo sprawdza również pisownię, choć niestety wynik potrafi zapisać tylko w formacie .txt.
Zatem, wszystko jest kwestią wyboru i preferencji. Niemniej, zawsze lepiej mieć taki wybór, niż nie mieć go wcale.
Program w wersji dla Ubuntu 14.04 i Minta 17 pobierzemy wprost z PPA autorskiego, po uprzednim dodaniu go do systemu:
sudo add-apt-repository ppa:sandromani/gimagereader
sudo apt-get update
sudo apt-get install gimagereader tesseract-ocr tesseract-ocr-pol
Niestety, w przypadku Manjaro i Archa w repozytorium AUR znajduje się jakaś antyczna wersja – trzeba wobec tego poinformować osobę odpowiedzialną za paczkę.
“Ponieważ wspomniany parę dni temu program OCRFeeder nie każdemu przypadł do gustu,”
E tam, od razu do gustu nie przypadł. Nie używam najlepszej dystrybucji Linuksa (Ubuntu) więc sam się prosiłem o kłopoty. 😀
To małe g w nazwie gImageReader 2.93 sugeruje jakieś powiązanie z GNOME? :/