Pogadanki z komputerem

Ile to już razy chcieliśmy powiedzieć komputerowi, co myślimy o jego sztucznej inteligencji, lub zapałowi z jakim zabiera się do niektórych czynności. Już niedługo będzie to możliwe dzięki rozwiązaniu które stworzył James McClain, a które zostanie upublicznione w niedługim czasie. Efektem pracy developera jest bowiem systemie rozpoznawania mowy i sterownia systemem operacyjnym za pomocą komend głosowych. Temat nie jest może odkrywczy, bo o sterowaniu głosem głośno jest już od dłuższego czasu i rozwiązania takie już istnieją. Tyle, że nie znajdziemy zbyt wiele takich w pełni działających dla Linuksa.

To jeden z niewiele przypadków, kiedy deweloper projektu opensource prezentuje już w pełni działające rozwiązanie, a nie rozpoczyna pracę nad wydaniem 0.01, by porzucić projekt przy wersji 0.02. Całość pomysłu opiera się o tradycyjny schemat – zamiana mowy na tekst, tekstu w konkretne komendy. McClain użył do tego celu systemu rozpoznawania mowy Google i jak na razie to jedyny minus tego projektu – bo wymagane jest połączenie z internetem, by wszystko zadziałało. Jednak wymiana systemu rozpoznawania mowy nie stanowi problemu i jeżeli pojawią się lepsze rozwiązania, to nic nie stoi na przeszkodzie, by zastąpić nimi silnik Google. Uruchomienie procesu rozpoznawania naszej mowy odbywa się po naciśnięciu klawisza aktywującego i wypowiedzeniu kwestii. Słowem mówione zostanie rozpoznane (Google) i zamienione na tekst i w zależności od niego zostaną podjęte przez system operacyjny odpowiednie akcje.

Na dzień dzisiejszy możliwe jest otwieranie i zamykanie aplikacji, otwierania stron, wyszukiwanie plików, wysyłanie do siebie notatek, odpowiadanie na proste pytania.

James McClain efekt swojej pracy zamierza najpierw udostępnić innym deweloperom, by powstało pełne i składne rozwiązanie. A poniżej – jak to wygląda w praktyce.

httpv://www.youtube.com/watch?v=HfrQrjH3AGw

Tags:aplikacje google komendy linux mint rozpoznawanie mowy silnik sterowanie głosem ubuntu