Управление голосом и жестами на компьютере

bestarticle

Какой гик не мечтает управлять компьютером с дивана одними только жестами и голосовыми командами? Как ни странно, но это уже возможно. А в самом ближайшем будущем каждый второй будет махать руками перед монитором. В статье рассматривается несколько способов и ближайших перспектив.

Управление голосом на Windows

Начнем с бесплатного софта, который позволяет управлять компьютером с помощью русской речи. Можно будет уговорить его открывать программы, выполнять какие-то действия и так далее. И ваши руки будут свободны для более важных дел.

Typle

интерфейс-Typle

Данная программа лидер среди программ, позволяющих командовать компьютером на родном русском языке. После установки нужно будет завести пользователя и придумать ему ключевое слово вроде «Ok, Windows», хотя нам советуют слово «Открой». Именно с него мы и начинаем говорить, знакомая реализация в Google Glasses существует.

Потом для пользователя выбираем команды. Можно добавить только запуск каких-либо программ, а при нажатии дополнительно самостоятельно выбрать программу и дописать какой-либо аргумент. Возможно, если что-то дописать к запуску программы, то будет и действия. Но в целом, обычному пользователю поуправлять компьютером полноценно не получится, никаких тебе пауз или следующий трек, только запускать и запускать.

Мой голос с французским акцентом распознается очень хорошо. Хотя даже не все люди его распознают. Теперь буду вместо людей с компьютером только общаться.

Скачать программу можно с официального сайта бесплатно. Либо купить платную версию за 13$, если вам надо записать более 450 команд, хотя это вряд ли.

Существует, как минимум, 5 подобных программ с голосовым управлением на компьютере, но все они сильно уступают Typle. О некоторых вы могли слышать, к примеру, русская разработка Горыныч,которая на деле очень слабо или вообще не распознает. Мне даже удалось найти какой-то аналог Siri для компьютера, который создал один человек и назвал Russian Voice Control.

Speaker

интерфейс Speaker

Есть и менее популярные, но чем-то более хорошие. Одна из таких Speaker. Она не только позволяет запускать приложения и файлы, но и выполнять несколько команд, таких как смена раскладки клавиатуры, сделать скриншот и даже выключить компьютер. Последнее не советую использовать, чтобы случайно не было чего. Команд все равно мало и свои не добавишь, и снова же, управление плеером нет.

Отмечу здесь как все работает. Надо использовать среднюю кнопку мыши или ctrl на клавиатуре, чтобы началась обработка голоса. Довольно популярные клавиши, которые используют и другими программами, так что будет время от времени вылезать окошка «не удалось распознать голос :(»

Нажал на кнопку, сказал слово «контакт», запись отправляется на сервер, а потом возвращается обратно полученный текст и выполняется действие — заходить на страницу ВКонтакте. На все это 5-10 секунд уходит, не совсем скорость, но для бедных программистов тоже результат неплох. Как вы поняли, нужно постоянное интернет-соединение, но сейчас это уже не проблема.

Команды задаются текстом, а не записью в отличии от Typle. А потом распознанный текст уже сравнивается с командами. Распознавание отличное с точностью до буквы, а вот сам запуск не такой уж и удобный.

На практике, я не использую голосовое управление, потому что микрофон всегда должен быть рядом. У меня хоть и есть купленный микрофон, но на расстоянии 1 метра он меня не слышит. Да и когда говорю тоже не с первого раза может сработать. С управлением жестами все гораздо интереснее.

Скачать можно отсюда.

Управление жестами на компьютере

Еще с момента появления PlayStation®Eye Camera и kinect люди захотели такие же функции и на компьютере. Позже Kinect даже стали продавать разработчикам, но для общего пользователя такого продукта не анонсировали. И даже есть новость, что Kinect 2.0 с Xbox One не будет работать на компьютере, но выйдет специальная версия Kinect и для PC. Правда без соответствующего софта пользы от него мало. Так что перейдем к самому софту.

Flutter

flutter

Самым популярным и доступным способом управления жестами является программа Flutter и соответствующее Chrome-расширение. Для этой программы подойдет почти любая веб-камера.

Довольно мало функций, но зато они очень хорошо работают. Мы можем ставить на паузу и продолжать показывая ладонь. Переключать треки или видео налево или направо, в зависимости, куда укажем пальцем. Работает программа в PowerPoint, VLC, Winamp, iTunes, YouTube и нескольких других сервисов, которые мало кто у нас использует.

Для правильной работы желательно быть на расстоянии от вебкамеры, но не как попало. Лежа получается гораздо хуже контролировать, чем ровно сидя. Лично я пользуюсь только на YouTube, когда руки грязные довольно удобно или когда лежишь. Случайных движений еще не было. Но все же бывают погрешности, когда просто сидишь и махаешь руками перед монитором как полный идиот.

Скачать советую на официальном сайте.  И обязательно установите Flutter для Google Chrome, он позволит управлять YouTube и другими интернет-сервиса вроде Pandora и Netflix.

Наверняка Flutter скоро получит полную поддержку Chrome, ведь стартап в октябре 2013 года купила Google.

Leap Motion

От софта перейдем к устройствам. Leap Motion внушает доверие своим маленьким видом и количеством потенциальных возможностей. Эта штука определяет руки пользователя, точнее даже каждый палец. Собственный магазин с кучей приложений и игр не дает заскучать. И самое главное, он уже продается и стоит какие-то 5000 рублей. Не так много за такую магию.

Но, на самом деле, здесь много минусов. На хабре было обсуждений и даже мнение одного из пользователей. Руки всегда надо держать запястьем вверх над устройством, думаете легко? Подержите 5 минут.

Насчет приложений тоже большой минус в том, что все бесплатные глючат, вылетают. А игры сборище непонятных лсд-трипов. Да и управлять неудобно, точность играет в обратную сторону и каждое неверное движение рукой приводит к непредвиденным последствием.

Да и сам дравйвер для Leap Motion будет сжирать почти все ваши ресурсы на компьютере. Но если и это вас не останавливает, то купить, как всегда, на оф. сайте. Он даже на русском языке.

DUO 3D

Похожая технология от русских разработчиков тоже существует. Они просто взяли две Eye Camera, написали софт и сделали компанию на кикстартере. К сожалению, провальную. Собрали 62 000$ из 110 000$ планированных. Обидно, тем более, что они не получат даже этих денег, так как надо собрать все, чтобы они поступили.

Сейчас устройств даже в свободной продаже, но мы будем надеяться, что такие разработки наших людей не пропадут просто так.

Myo

Да ладно, кто не слышал о Myo. Браслет, определяющий жесты не с помощью камеры, как конкуренты, а распознаванием движения мышц. Красивый видеоролик и потрясающие возможности подкупили всех и даже меня. Как только браслет будет в свободной продаже, будут известны приложения и все интеграции, появятся обзоры, тогда и я куплю эту чудную вещь.

Сейчас браслет можно предзаказать за 150$, но боюсь попасть на сырую версию.

Управление компьютером с веб камеры на ноутбуках

Сейчас создатели ноутбуков любят экспериментировать с управлением жестами. Компания PointGrab продвинулась в этой тематике, концепт арт у них довольно оптимистичный.

Продуктами этой компании пользуется Acer. А Lenovo на основе этих наработок сделает свой собственный Motion Control 2.0.

А в сентябре 2013 Intel анонсировала новые ноутбуки с голосовым управлением, управлением жестами, прикосновением, а до этого летом компания приобрела израильский стартап Omek.


Посмотрим, что из этого всего выйдет. У меня в последнее время вечное ощущение того, что будущее вот-вот рядом и так уже пару лет. Мой материал можете дополнить своими знаниями, может есть еще какие-то устройства или способы, которые тоже стоило упомянуть?