Робот Google учится ходить в реальном мире


Сфера робототехники сделала один шаг вперед, за которым последовал другой, затем еще несколько, когда робот под названием Rainbow Dash недавно научился ходить. Четвероногой машине потребовалось всего несколько часов, чтобы научиться ходить взад и вперед, и при этом поворачивать направо и налево.

Если Вы начали ремонт в своем доме, или квартире, рекомендую посетить сайт soda.dp.ua, здесь можно получить качественную консультацию и заказать профессиональные натяжные потолки Днепр . Доверьте у становку потолка профессионалам.

Исследователи из Google, Калифорнийского университета в Беркли и Технологического института Джорджии опубликовали на сервере препринтов ArXiv статью, описывающую методику статистического ИИ, известную как глубокое обучение с подкреплением, которую они использовали для достижения этого достижения, что важно по нескольким причинам.

Большинство обучающих развертываний подкрепления происходит в компьютерных симуляциях. Rainbow Dash, однако, использовал эту технологию, чтобы научиться ходить в реальной физической среде.

Более того, он мог сделать это без специального обучающего механизма, такого как инструкторы-люди или промаркированные данные обучения. Наконец, Rainbow Dash удалось пройтись по нескольким поверхностям, включая матрас из мягкой пены и коврик с довольно заметными углублениями.

Используемые роботом методы глубокого подкрепления представляют собой тип машинного обучения, при котором агент взаимодействует со средой для обучения методом проб и ошибок. В большинстве случаев использования для подкрепления обучения используются компьютерные игры, в которых цифровые агенты учатся играть, чтобы выиграть.

Эта форма машинного обучения заметно отличается от традиционного обучения под наблюдением или без него, в котором модели машинного обучения требуют для обучения маркированных данных обучения. Глубокое обучение с подкреплением сочетает в себе подходы с подкрепляющим обучением с глубоким обучением , в котором масштабы традиционного машинного обучения значительно расширяются благодаря огромной вычислительной мощности.

Хотя исследовательская группа приписала Rainbow Dash научиться ходить самостоятельно, вмешательство человека все же сыграло существенную роль в достижении этой цели. Исследователи должны были создать границы, в пределах которых робот научился ходить, чтобы не дать ему покинуть область.

Им также пришлось разработать специальные алгоритмы, чтобы предотвратить падение робота, некоторые из которых были направлены на ограничение движения робота. Чтобы предотвратить несчастные случаи, такие как повреждение при падении, обучение усилению робототехники обычно происходит в цифровой среде, прежде чем алгоритмы передаются физическому роботу, чтобы сохранить его безопасность.

Триумф Rainbow Dash происходит примерно через год после того, как исследователи сначала выяснили, как заставить роботов учиться физическому, а не виртуальному окружению.

Челси Финн, доцент из Стэнфорда, связанный с Google, который не принимал участия в исследовании, говорит: «Исключить человека из процесса [обучения] очень сложно. Позволяя роботам учиться более автономно, они становятся ближе к способности учиться в реальном мире, в котором мы живем ".

Комментариев нет

Технологии Blogger.