Персональный проект Александра Чижова, Иркутск 1998-2006Компьютерный журнал Cooler | скачать новые компьютерные игры | гаджеты | астрономия | обзоры программиста System's temperature
recent issueaboutarchiveLive TAMrubricatorlinksBooks digestComments
Компьютерный журнал "Cooler" Александра Чижова (Иркутск)

Выпуск от 17.07.2009в начало коммент   в конец коммент



Microsoft недавно анонсировала свой проект под названием Natal - это управление компьютером вообще без всяких контроллеров - только в/камера, которая распознает движения человека и, в зависимости от текущих настроек, совершает необходимые действия, например, в виртуальной реальности анимирует фигурку человека.

В принципе, современные мощности и наработки программного обеспечения вполне позволяют производить распознавание движений в реальном времени посредством в/камеры. Думаю, что камеры или должно быть две, или это должна быть какая-то специфическая камера, потому как движения трехмерны.
Кое-что можно посмотреть на сайте cnet (2 ролика).
Пока больше всего это найдет применение в играх. Но тут необходим SDK и какая-никакая основа для программинга. Еще, может быть, немного гестурности придет и домашнему компу (в медиа-центрах).

 
34  rubec :
как только где-то в 90-х у меня появилась веб-камера. Тут же пришла идея использовать камеру для управления компьютером, например вместо мыши. Сделал поиск (hotbot-ом наверное) и нашёл описание похожего проекта на сайте Микрософта. Этому проекту уже 10 лет в обед. И такой монстр не смог за 10 лет выкатить ничего полезного. Видимо не хватает ни частоты кадров, ни скорости
обработки кадров для приличного результата. Особенно тогда. Сегодня с НD камеерами и быстрыми USB видимо легчает.
    -   | rank:151 | post-id:38741|03.08.2009/09:01
 
33  Alkaline :
[to Slider] Лем описывал подобное будущее лет 40 назад. Читайте "Осмотр на месте", "Звездные дневники..." и, конечно же, "Сумму технологии". Как пример - среда из обычных и управляемых наночастиц становится безопасной для человека: при попытке выколоть себе глаз нож гнется (а до того он резал), а прыжок (или падение) с крыши или предотвращается,
или смягчается.
    -   | rank:443 | post-id:38736|01.08.2009/14:56
 
32  djreel :
[to Gloom]
г. Barmalini написал же, с софтом это к гуглу, а на неких чипах филипс и 10 лет назад все работало. 95% без тренировки! Я вот и хочу узнать, что это за система такая, может есть в Питере. )
    -   | rank:200 | post-id:38724|30.07.2009/14:58
 
31  Gloom :
[to barmalini] а можно конкретно указать какая программа под диктовку печатает со страшной скоростью? я, честно скажу, давно не интересовался этим вопросом, но уж если б какой прорыв в этой области случился, уж наверняка бы услышал. а так с распознованием было уныло и пять и десять и пятнадцать лет назад.
[to demetrius] бггг! вот это прекрасно просто =)
    -   | rank:203 | post-id:38723|30.07.2009/14:48
 
30  djreel :
[to barmalini]
Напомните, пожалуйста, название установки с голосовым управлением на которую вы ссылаетесь.
    -   | rank:200 | post-id:38716|28.07.2009/11:29
 
29  barmalini :
[to djreel] не морочьте мне голову, морочьте голову гуглу. Я десять лет тому назад делал голосовой интерфейс для рентгеновской установки на филипсе. Для хирургов, чтоб во время операции шунтирования сердечной артерии доктор меньше отвлекался от монитора. Такого рода операции проводятся без вскрытия, через надрез сонной артерии в районе ключицы, и наблюдать за ходом можно только
на мониторе. Так вот, смею вас заверить, точность распознания речи уже тогда была достаточна для практического применения. Заметьте, хирург говорил не в гарнитуру, гарнитуру нельзя использовать в операционной из соображений стерильности, а в очень хитрый микрофон установленный за 3 метра от него. Представьте себе какой шум стоит во время операции - вентиляция, свет, компютеры,
куча персонала шляется вокруг, постоянно кто-то роняет инструменты и все между собой переговариваются. Условия для распознавания речи, мягко говоря, не идеальные. Но тем не менее 95% точности вытягивали без тренировки системы под конкретного человека.

Так вот, представьте себе, что с тех пор прогресс не стоял на месте. Точность распознания, скорее всего, не увеличилась, но она у человека находится на уровне 93-96%, а выше головы не прыгнешь.

Я никогда не интересовался системами для офисного применения, но помню что в те времена у майкрософта был хороший движок, купленный у фирмы Lernout & Hauspie.
Думаю, искать нужно как раз по этим словам, иногда их называют просто LH. Это бельгийская компания, но думаю что поддержка русского языка у них была на хорошем уровне, поскольку все другие поддерживаемые языки были реализованы идеально.

Филипс использовал собственный движок, не софтверный а зашитый в специальный чип, в следствие чего он работал просто молниеносно. Нашел применение и в медицинской и в бытовой аппаратуре. Для программистов была выпущена специальная библиотека-эмулятор, но его в свободном доступе вы не найдете, ищите производные от Lernout & Hauspie.
    -    ICQ:20919946  | rank:1928 | post-id:38690|25.07.2009/02:20
 
28  fe5543 :
Новые интерфейсы нужны, время пришло.
Как не странно звучит кроме майкрософт не кто не сможет сдвинуть эту стенку.
Есть надежда на гугл, но ей разбег нужен, сделает ос для ноутов, может потом будет немножко рулить.
   buy_chi@mail.ru  | rank:219 | post-id:38682|24.07.2009/19:04
 
27  Slider :
Я пробовал системы голосового управления (типа Voice Commander, например), со стороны конечно выглядит круто, говоришь "Ворд", опа, Ворд открылся, говоришь "закрыть" – закрылся. Единственно конечно не 100% распознавание огорчает, иногда приходиться повторять, да и необходимость иметь всё время перед собой включённый микрофон как-то раздражает, а к гарнитуре
я не привык… Так что побаловался и снёс.
    -    ICQ:6027220  | rank:200 | post-id:38677|24.07.2009/17:31
 
26  demetrius :
[to Gloom] З.Ы. Следующий шаг - игровая приставка для мужчин и женщин одновременно и играть в Камасутру и др. Как в анекдоте: не до того, а вместо того. ;)
Китайское правительство скупит все сразу.
    -   | rank:133 | post-id:38676|24.07.2009/17:25
 
25  demetrius :
[to Gloom] Идеи в этом направлении уже есть:
http://www.youtube.com/watch?v=_SXNAtwYMBw
    -   | rank:133 | post-id:38675|24.07.2009/17:21
 
24  djreel :
[to barmalini]
Я не встречал систем голосового управления, которые не допускали бы ошибок. Они ошибаются достаточно часто, чтобы это стало раздражать. Если я ошибаюсь киньте в меня ссылкой какой или на худой конец словом для поиска.
Несколько месяцев назад меня озаботил вопрос - что делать IT'шнику потерявшему зрение. Так вот, когда я смогу зажмурившись высказать компу штук сто команд, причем на любом языке, а потом открыв глаза получить желаемый результат, тогда эта система будет хорошей. )
    -   | rank:200 | post-id:38670|24.07.2009/14:50
 
23  sergusy :
To Slider
А может быть так уже когда-то давным-давно произошло? Ведь есть бабки-ворожки которые могут какими-то заклинаниями, как вылечить человека, так и в могилу свести... Чем не голосовое управление программами-вирусами, которые в одном случае выключаются, а в другом активизируются? Ну и так далее, я думаю что каждый может придумать массу примеров.
А вообще-то если бы сценарий братьев Вачовски содержал-бы элементы голосового управления матрицей, а не банальную батарейку, то фильм получился бы гораздо интерестнее!
   sergusy@mail.ru  | rank:18 | post-id:38662|23.07.2009/23:04
 
22  barmalini :
[to djreel] вы не поверите, но голосовое управление работает довольно не плохо, только никто им не пользуется, - медленно и по-идиотски выглядит.
В офисе его не применишь, только дома, да и то с натяжкой. Представьте себе выражение лица ваших близких которые услышат "компютер... калькулятор... два.. плюс.. два.. равно... закрыть калькулятор..." Я даже не упоминаю более экзотичные варианты как "компютер.. браузер.. не тот.. другой, бля... да, оперу.. гугл... "чем кормить киску летом"... киску...
удалить киску... кошечку... кормить.. летом.. чем... зимой..."
Так вот, компютеру пофиг, он все сделает как надо, а вот ваши нервы закончатся через пару дней. А вот системы для диктовки текста работают достаточно уверенно, можно пользоваться, но часто ли вы пишете большие объемы?
    -    ICQ:20919946  | rank:1928 | post-id:38660|23.07.2009/20:53
 
21  Slider :
[to barmalini] Если я запощу еще все мысли по этому поводу которые за 5 лет появились боюсь ни сайт не выдержит, ни терпение читающих. ;)
[to djreel] Там вроде используются ИК камеры с ИК подсветкой.
    -    ICQ:6027220  | rank:200 | post-id:38657|23.07.2009/19:05
 
20  djreel :
Че-то они все анонсируют и анонсируют. Сколько лет уже анонсируют нормальное голосовое управление, так все доанонсировать до стабильного продукта и не могут.
Если по делу, то я не очень понимаю, как эта штука решает проблему освещения.
    -   | rank:200 | post-id:38653|23.07.2009/16:58
 
19  barmalini :
[to Slider] Круто, конечно и все такое. Только позвольте один личный вопрос задать. Неужели у вас за пять лет ни одной новой мысли не появилось, что вы нам это старье запостили?
    -    ICQ:20919946  | rank:1928 | post-id:38647|23.07.2009/14:05
 
18  Slider :
Было написано лет 5 назад, между прочим ;)
    -    ICQ:6027220  | rank:200 | post-id:38633|22.07.2009/22:58
 
17  Slider :
Вот, когда-то писал: Магия как последняя ступень развития технологии (или фентезийный мир с точки зрения технократа)
Здесь я изложу цепочку размышлений, приведшую меня к обозначенному в заголовке выводу, а именно что магия есть последняя стадия развития технологии.
Итак, проследим основные тенденции развития технологии, а в частности сначала возьмем тенденции развития интерфейсов управления. По мере возрастания сложности технических устройств интерфейс управления ими все время упрощается. Многие из людей уже не очень представляют, как работают различные устройства и машины, будь то телевизор, стиральная машина, автомобиль или компьютер,
но прекрасно осведомлены, как ими управлять. Люди знают, как воздействовать на вещь, чтобы получить нужный результат, и управление превращается в некоторый ритуал, который достаточно заучить. А тенденции развития интерфейсов приводят к тому, что в ближайшем времени кнопочно-нажимательное (в основном) управление уйдет в прошлое, станет звуковым и возможно жестовым. Итак, чтобы в
ближайшем будущем получить результат от какой либо машины, нужно будет произнести какую либо звуковую формулу и возможно сделать какие либо движения. И что мы получили в результате? Правильно, заклинание в его стандартном фентезийном описании.
А каковы тенденции развития самих машин? Это универсализация и миниатюризация. Если представить конечный этап их развития, то мы получим множество универсальных машин-элементов (их еще иногда называют нано-роботами, нано-машинами), способных объединятся в устройства и механизмы, выполняющие желания пользователя посредством звуко-жестового интерфейса. Можно предположить также,
что интерфейс управления нано-машинами сводится не только к звукам и жестом, т.к. он очень ограничен, в будущем у человека наверняка будут образованы специальные органы, способные напрямую общаться с механизмами и ставить им задачи непосредственно умственным усилием. Степень развития этих органов и является уровнем мага в традиционном фентезийном понимании. Продвинутые маги
могут создавать новые заклинания, представляя их реализацию и результат, сопоставляя с соответствующим командным интерфейсом - вербальным и соматическим компонентом заклинания. Сильные маги в принципе не нуждаются в командном интерфейсе, он был создан для упрощения и ускорения получения результатов взаимодействия с нано-машинами. Маги высокого уровня могут непосредственно
взаимодействовать с нано-машинами, представляя нужный результат, но для этого нужно высокая степень умственной концентрации и возможно какие либо ритуалы для привлечения (создания) наибольшего количества нано-машин, т.к. степень их воздействия на мир зависит от их количества. Нано-машины приблизительно одинаковым слоем распределены по всему миру, но в некоторых местах
наблюдается их концентрация и там магией воспользоваться легче, в некоторых местах концентрация понижена, и там магией воспользоваться трудновато. Нано-машины могут быть сконцентрированы в виде некоторых предметов с закрепленной функциональностью - так называемые магические вещи, либо в виде предметов с незакрепленной функциональностью - источники магии (обычно кристаллы).
Какие еще тенденции развития можно подметить в современном мире? Это создание искусственных интеллектов (ИИ), отвечающих за управление механизмами, т.к. самому человеку контролировать все возрастающие их полчища машин становиться трудновато. Человек все более перекладывает управленческие функции на эти ИИ, сам оставаясь в стороне. Т.к. возможности ИИ по управлению
нано-машинами практически безграничны (в силу того, что они имеют единую цифровую основу), в результате эти ИИ становятся некоторыми богами, ответственные за различные сферы деятельности (специализация ИИ). Люди-операторы, взаимодействующие с этими ИИ, в фентезийном мире называются жрецами или священниками.
Итак, привожу сценарий возникновения фентезийного мира (миров). Люди все более возлагают вопросы как производства, так и управления на плечи все более совершенствующихся машин и ИИ. Сами люди уходят в созданную виртуальную реальность, т.к. жизнь в реале пресна и скучна. Люди постепенно теряют знания об машинах и ИИ - так как они становятся полностью самодостаточны и не
нуждаются в людях, однако по привычке обеспечивая людей всем необходимым. Поскольку виртуальными мирами управляют те же ИИ, то они не видят особого различия между реальным и виртуальным миром и решают их объединить. В результате пришествия эпохи нано-машин с практически безграничными возможностями виртуальная реальность переносится в реал со всей придуманной там обстановкой,
т.к. ИИ решают, что так содержать человека проще, чем содержать отдельно тело и сознание...
    -    ICQ:6027220  | rank:200 | post-id:38632|22.07.2009/22:56
 
16  lexus :
Для Xbox 360 уже реализовано http://seattletimes.nwsource.com/html/technologybrierdudleys
    -   | rank:1 | post-id:38624|22.07.2009/17:57
 
15  Gloom :
[to sergocarde] хаха =) удивлен что wii еще ничего ТАКОГО не сделали ) а то можно и джойстики специальные начать выпускать )
    -   | rank:203 | post-id:38619|22.07.2009/16:17
 
14  sergocarde :
Порноиндустрия, как всегда, вся в слюнях :-)
    -   | rank:5 | post-id:38608|22.07.2009/13:23
 
13  denroot1 :
почемуто целых 3 сообщения, удалите плз 2 лишних. видать сильное колдунство было :)
    -    ICQ:53844001  | rank:4 | post-id:38597|22.07.2009/09:45
 
12  denroot1 :
вот оно, колдунство-шаманство, помахал руками, сделел секретный знак, поризнёс заклинание, комп это обработал и сделал по твоему велению,моему хотению.
а когда доживем до нано-ботов и нано-компьютеров, то будет практически как в сказках, колдуны-сисадмины будут колдовать и простые смертные забудут про компьютеры. Возможно так оно и было в стародавние времена?
    -    ICQ:53844001  | rank:4 | post-id:38596|22.07.2009/09:43
 
11  denroot1 :
вот оно, колдунство-шаманство, помахал руками, сделел секретный знак, поризнёс заклинание, комп это обработал и сделал по твоему велению,моему хотению.
а когда доживем до нано-ботов и нано-компьютеров, то будет практически как в сказках, колдуны-сисадмины будут колдовать и простые смертные забудут про компьютеры. Возможно так оно и было в стародавние времена?
    -    ICQ:53844001  | rank:4 | post-id:38595|22.07.2009/09:43
 
10  denroot1 :
вот оно, колдунство-шаманство, помахал руками, сделел секретный знак, поризнёс заклинание, комп это обработал и сделал по твоему велению,моему хотению.
а когда доживем до нано-ботов и нано-компьютеров, то будет практически как в сказках, колдуны-сисадмины будут колдовать и простые смертные забудут про компьютеры. Возможно так оно и было в стародавние времена?
    -    ICQ:53844001  | rank:4 | post-id:38594|22.07.2009/09:43
 
9  kampfusbeke :
для некоторых игрушек должно быть весьма забавно (но для большинства классических игрушек, имхо, нужны все-таки контроллеры, как в видео управлять машиной невидимым рулем, например, должно быть довольно неудобно), для управления уи жестами тоже может быть очень интересно, было бы нормальное распознавание.
ждем wiindows? ;)
    -   | rank:281 | post-id:38569|21.07.2009/21:23
 
8  Slider :
Вот нашел, второй ролик по ссылке: http://habrahabr.ru/blogs/the_future_is_here/61106/
    -    ICQ:6027220  | rank:200 | post-id:38547|21.07.2009/16:33
 
7  Slider :
К сожалению по ссылкам этого ролика нету где идёт общение с виртуальным персонажем...
    -    ICQ:6027220  | rank:200 | post-id:38546|21.07.2009/16:29
 
6  Slider :
Ну если внимательно посмотреть ролик с E3, с Майло девушка общается именно голосом, и если эта сцена, как утверждают, не на 100% постановочная, то распознование голоса там есть...
А преставляю аватара в игре, у которого не зашитый набо жестов, а снимает жесты с камеры, какие открываются преспективы ;)
    -    ICQ:6027220  | rank:200 | post-id:38545|21.07.2009/16:27
 
5  stormos :
попахивает революцией в деле видеоконференций
жалко они еще картинку на экране не пересчитывают в зависимости от точки зрения пользователя
    -   | rank:43 | post-id:38543|21.07.2009/16:06
 
4  xoid :
напоминает анекдот "Телефона-телефона, чукча кушать хочет!"
Жесты? Ну допустим. Только голосовое распознавание слили.
    -   | rank:20 | post-id:38536|21.07.2009/14:11
 
3  NuclearCat :
Там стоит Zcam - камера на времяпролётном сенсоре.
    -   | rank:17 | post-id:38500|21.07.2009/00:50
 
2  xdenser :
там как раз две камеры
одна в видимом диапазоне
вторая в ИК - видит на 3-4 метра в глубину кажется
    -   | rank:59 | post-id:38491|20.07.2009/22:11
 
1  Onix :
Ещё хороший ролик по этому поводу:
http://newsefir.ru/itnews/1587-devajs-dlya-upravleniya-igram
    -   | rank:1 | post-id:38463|20.07.2009/15:48

это мой е-майл Боря делал дизайн