Linux Intelligent OCR Solution 2.2

Nieco przydługa nazwa tytułowego programu w sieci funkcjonuje pod skrótem Lios. Ale Lios nikomu nic nie powie, a coś z OCR w tytule – a i owszem. Program jest bowiem kolejną wariacją na temat ułatwienia naszej pracy podczas konwertowania znaków z formatu graficznego do edytowalnego tekstu. Dlaczego jest on wart uwagi? Przede wszystkim ładnie integruje się ze skanerami i pozwala skanowany materiał wczytywać bezpośrednio do programu, obsługuje dwa silniki rozpoznawania znaków – [[CuneiForm]] oraz osławiony Tesseract. W komplecie otrzymujemy też opcję eksportu wyników do pliku pdf (co nie zawsze w innych programach jest tak oczywiste).

Lios w akcji
Lios w akcji
Choć temat OCR był na Linuksie poruszany już przez wiele projektów, każde z tych rozwiązań miało jakieś niedomówienia. A to brakowało sensownego eksportu, a to brak współpracy ze skanerem, a to znowu coś innego. Na dodatek, silniki rozpoznawania tekstu na Linuksie osiągnęły przyzwoity poziom dopiero parę lat temu (jak to się stało, [[Abbyy]] wydało tekstowe i zamknięte rozwiązanie na ich silniku). Lios to popełnione w Pythonie zgrabne GUI próbujące wzbogacić dotychczasowe osiągnięcia deweloperów wolnego oprogramowania. Wspomniane na początku cechy to zaledwie początek jego możliwości:

  • importowanie obrazu ze skanerów, plików PDF, zdjęć (plików graficznych) lub kamerki internetowej,
  • tworzenie i rozpoznawanie tekstu ze zrzutów ekranu,
  • rozpoznawanie w obrębie zaznaczonych przez nas obszarów,
  • dwa silniki OCR (Cuneiform,Tesseract),
  • wsparcie dla 24 języków (w tym dla języka polskiego – wymagana paczka tesseract-ocr-pol),
  • autoobrót obrazów dla jakiekolwiek języka,
  • jednoczesny widok źródła i wyniku,
  • zaawansowana optymalizacja skali jasności skanera,
  • konfiguracja okna z wynikami (fonty, kolory),
  • czytanie tekstu (espeak),
  • sprawdzanie pisowni (aspell),
  • eksport do formatu pdf (tekst, obrazy),
  • opcja zapisu i odczytu ustawień,
  • Inne – Find, Find-and-Replace, Go-To-Page, Go-To-Line, Append file, Punch File,
    Selection of starting page number, page numbering mode and number of pages to scan,
    Selection of Scan area, brightness, resolution and time between repeated scanning,
    Output Insert position, image rotation and zoom options, etc

Całość jest zgrabnie poukładana i w programie da się pracować bez większego zastanawiania się „co deweloper miał na myśli”. Wczytujemy obraz (skanujemy), zaznaczamy obszary (lub nie), rozpoznajemy tekst i na koniec poprawiamy formatowanie, ortografię i niedoskonałości w odczycie. Lios ma bardzo miło opcję autokorekty – wyświetla problematyczne ciągi znaków i proponuje, jaki wyraz mógłby to być. Co więcej – program posiada opcję nauki Tesseract znaków, automatycznego obracania i dopasowywania skanów, a także możliwość wyrecytowania rozpoznanego tekstu. Oczywiście dla większości z tych narzędzi potrzebne są dodatkowe paczki (na szczęście z domyślnych repozytoriów). Lios jest nadal aktywnie rozwijany i w przyszłości może nas jeszcze niejednym zaskoczyć.

Program znajdziemy w większości repozytoriów najpopularniejszych dystrybucji. Aby przetestować go pod Ubuntu 16.04, Mintem 18.xx i pochodnymi, należy

sudo apt-get install lios

Aby było możliwe rozpoznawanie polskich znaków, potrzebujemy jeszcze odpowiedniej paczki Tesseract:

sudo apt-get install tesseract-ocr-pol

W Manjaro i Arch Linuksie potrzebujemy wykonać polecenie:

yaourt -S lios-git

5 komentarzy

  1. Mint to nie Arch. Wydaje się, że PKGBUILD jest albo wadliwie zrobiony, albo ja mam inną wersję pythona w systemie (nie mam czasu teraz dociekać tego). W każdym bądź razie wysypuje się właśnie na pythonie.

  2. Tak samo jak się w Manjaro wysypuje na pythonie ladi-system-tray,ladi-player,oraz kiedyś system-config-samba.Za nowe te paczki niektóre (python):)

  3. To jest problem z PKGBUILDami przygotowywanymi przez osoby, które nie bardzo – chyba – mają doświadczenie. Tak w Archu, jak i w Manjaro masz dwie wersje pythona (2.x i 3). Niektóre programy wymagają jednego, inne drugiego. “Domyślnym” jest trójka, ale ta niekiedy wymaga jakichś zmian w kodzie. Jeśli coś zrobisz nie tak, jak powinno być zrobione, to aplikacja, która jest na 2 próbuje się uruchomić na 3 i odwrotnie. Itd. itp.
    A z Liosem powalczę 🙂

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Post comment

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.