Один из разработчиков дистрибутива Ubuntu, Джеймс МакКлейн, продемонстрировал работу новой технологии распознавания голоса в дистрибутиве Ubuntu Linux.

voice-recognition-ubuntu

Ниже приведен список действий, которые может совершать пользователь при помощи голосовых команд:

  • запускать/закрывать приложения;
  • выполнять действия в файловом менеджере;
  • открывать web-страницы;
  • отправлять заметки и напоминания на электронную почту (E-mail);
  • надиктовывать тексты.

Д. МакКлейн представил демонстрацию технологии в пятиминутном видеоролике:

Как же работает технология распознавания речи?

Принцип работы новоиспеченной технологии сводится к следующему:

«Пользователь, при нажатой горячей клавише, говорит некую фразу. В это время запускается технология распознавания речи от Google, затем результат распознавания голоса сравнивается со словарем и при совпадении запроса выполняется соответствующая команда».

Технология распознавания речи использует голосовой поиск Google. Как руководство Google отреагирует на подобное использование своей запатентованной технологии пока не известно!

В данной технологии используется техника под названием «fuzzy searching» (техника нечеткого поиска), позволяющая пользователю открывать web-сайты или вызывать приложения, используя различные фразы.

Вот простой пример работы техники нечеткого поиска. Предположим Вам необходимо запустить браузер Firefox. Для этого необходимо произнести одну из следующих фраз – start firefox (запустить Firefox), open firefox (открыть Firefox) или run firefox (выполнить Firefox). Все эти запросы равнозначны и выполняют одну и ту же функцию, то есть запуск браузера Firefox. Это позволит сделать технологию распознавания голоса интуитивно-понятнее и проще.

Кроме того, по словам Джеймса, разработчики без труда смогут добавлять собственные функции и команды в приложение. В ближайшее время ожидается анонсирование закрытой beta-версии продукта.

Советую также почитать: