OCRFeeder 0.7.11 i zamiana obrazu w tekst
Dziedzina [[OCR]] przez lata była zaniedbana na Linuksie, by nie powiedzieć, że leżała odłogiem. Podczas gdy na wiodących platformach istniały niemal kombajny do wyodrębniania z obrazów słowa pisanego, użytkownicy Linuksa nie mieli większego wyboru, niż uruchamianie tychże kombajnów za pomocą WINE i to z różnym skutkiem. Jednak od tych mrocznych wieków minęło nieco czasu, powstało kilka projektów i tak oto możemy się cieszyć w miarę komfortowym rozpoznawaniem tekstu, choćby za pomocą programu OCRFeeder oraz silnika Tesseract.
Wspomniany Tesseract to nie jedyny silnik rozpoznający tekst obsługiwany przez OCFeeder – program może korzystać również z innych – CuneiForm, GOCR, Ocrad. Niestety, nie każdy radzi sobie poprawnie z naszym rodzimym narzeczem.
OCRFeeder w wersji dla Ubuntu/Minta zainstalujemy wprost z repozytoriów, pamiętając o doinstalowaniu obsługi naszego języka przez Tesseract.
sudo apt-get install ocrfeeder tesseract-ocr-pol
W Manjaro/Arch wykorzystamy podstawowe repozytoria:
sudo pacman -Sy ocrfeeder tesseract-data-pol