Framework позволяет человеку корректировать действия робота, используя обратную связь, которую он дал бы другому человеку

Framework позволяет человеку корректировать действия робота, используя обратную связь, которую он дал бы другому человеку
15:00, Март 11, 2025 Представьте, что робот помогает вам мыть посуду. Вы просите его вытащить из раковины мыльную миску, но его захват немного промахивается. Используя новую структуру, разработанную исследователями MIT и NVIDIA, вы можете исправить поведение этого робота с помощью простых взаимодействий. Метод позволит вам указать на миску или проследить траекторию к ней на экране, или просто подтолкнуть руку робота в нужном направлении. Работа опубликована на сервере препринтов arXiv. В отличие от других методов исправления поведения робота, эта техника не требует от пользователей сбора новых данных и переобучения модели машинного обучения , которая питает мозг робота. Она позволяет роботу использовать интуитивную обратную связь от человека в реальном времени, чтобы выбрать возможную последовательность действий, которая максимально соответствует намерению пользователя. Когда исследователи протестировали свою структуру, ее успешность оказалась на 21% выше, чем у альтернативного метода, не предполагавшего вмешательства человека. В долгосрочной перспективе эта структура может позволить пользователю легче управлять роботом, обученным на заводе, для выполнения широкого спектра домашних задач, даже если робот никогда не видел их дома или находящихся в нем предметов. «Мы не можем ожидать, что неспециалисты будут выполнять сбор данных и тонкую настройку модели нейронной сети. Потребитель будет ожидать, что робот будет работать сразу после установки, а если этого не произойдет, он захочет иметь интуитивно понятный механизм для его настройки. Именно эту задачу мы и решили в этой работе», — говорит Феликс Яньвэй Ван, аспирант кафедры электротехники и информатики (EECS) и ведущий автор статьи arXiv . Его соавторы — Лируй Ван, доктор философии и Илун Ду, старший автор Джули Шах, профессор аэронавтики и астронавтики Массачусетского технологического института и директор Группы интерактивной робототехники в Лаборатории компьютерных наук и искусственного интеллекта (CSAIL); а также Балакумар Сундаралингам, Сюнин Ян, Ю-Вэй Чао, Клаудия Перес-Д’Арпино, доктор философии и Дитер Фокс из NVIDIA. Исследование будет представлено на Международной конференции по робототехнике и автоматизации. Уменьшение несоосности Недавно исследователи начали использовать предварительно обученные генеративные модели ИИ для изучения «политики» или набора правил, которым следует робот для выполнения действия. Генеративные модели могут решать множество сложных задач. Во время обучения модель видит только возможные движения робота, поэтому она учится генерировать допустимые траектории, по которым должен следовать робот. Хотя эти траектории верны, это не значит, что они всегда совпадают с намерениями пользователя в реальном мире. Робота могли обучить хватать коробки с полки, не опрокидывая их, но он может не дотянуться до коробки на чьей-то книжной полке, если полка ориентирована не так, как он видел при обучении. Чтобы преодолеть эти сбои, инженеры обычно собирают данные, демонстрирующие новую задачу, и заново обучают генеративную модель. Это дорогостоящий и трудоемкий процесс, требующий опыта в области машинного обучения. Вместо этого исследователи Массачусетского технологического института хотели позволить пользователям управлять поведением робота во время развертывания, если он совершает ошибку. Но если человек взаимодействует с роботом, чтобы исправить его поведение, это может непреднамеренно привести к тому, что генеративная модель выберет недопустимое действие. Она может добраться до нужной пользователю коробки, но при этом сбросить книги с полки. «Мы хотим позволить пользователю взаимодействовать с роботом, не допуская подобных ошибок, поэтому мы получаем поведение, которое гораздо больше соответствует намерениям пользователя во время развертывания, но которое также является допустимым и осуществимым», — говорит Ван. Их фреймворк достигает этого, предоставляя пользователю три интуитивно понятных способа корректировки поведения робота, каждый из которых имеет определенные преимущества. Во-первых, пользователь может указать на объект, которым он хочет, чтобы робот манипулировал, в интерфейсе, который показывает вид с его камеры. Во-вторых, он может проследить траекторию в этом интерфейсе, что позволяет ему указать, как он хочет, чтобы робот достиг объекта. В-третьих, он может физически переместить руку робота в направлении, в котором он хочет, чтобы он следовал. «Когда вы сопоставляете двухмерное изображение окружающей среды с действиями в трехмерном пространстве, часть информации теряется. Физическое подталкивание робота — это самый прямой способ указать намерение пользователя без потери какой-либо информации», — говорит Ван. Выборка для успеха Чтобы гарантировать, что эти взаимодействия не заставят робота выбрать недопустимое действие, например, столкновение с другими объектами, исследователи используют специальную процедуру выборки. Эта техника позволяет модели выбирать действие из набора допустимых действий, которое наиболее точно соответствует цели пользователя. «Вместо того чтобы просто навязывать волю пользователя, мы даем роботу представление о намерениях пользователя, но позволяем процедуре выборки колебаться вокруг его собственного набора усвоенных моделей поведения», — объясняет Ван. Этот метод выборки позволил исследовательской платформе превзойти другие методы, с которыми они ее сравнивали во время моделирования и экспериментов с настоящей роботизированной рукой на игрушечной кухне. Хотя их метод не всегда позволяет сразу выполнить задачу, он дает пользователям преимущество в том, что они могут немедленно исправить робота, если видят, что он делает что-то неправильно, вместо того, чтобы ждать, пока он закончит, а затем давать ему новые инструкции. Более того, после того, как пользователь несколько раз подтолкнет робота, пока он не возьмет правильную миску, он может зарегистрировать это корректирующее действие и включить его в свое поведение посредством будущего обучения. Затем, на следующий день, робот сможет взять правильную миску без необходимости подталкивания. «Но ключом к этому постоянному совершенствованию является предоставление пользователю возможности взаимодействовать с роботом, что мы здесь и продемонстрировали», — говорит Ван. В будущем исследователи хотят повысить скорость процедуры отбора проб, сохранив или улучшив ее производительность. Они также хотят поэкспериментировать с генерацией политики робота в новых условиях....
Читать полный текст на android-robot.com  

Поделиться новостью в Facebook Поделиться новостью в Twittere Поделиться новостью в VK Поделиться новостью в Pinterest Поделиться новостью в Reddit

Как перейти к другому оператору с сохранением номера: пошаговая инструкция

Как перейти к другому оператору с сохранением номера: пошаговая инструкция Если вас не устраивает качество услуг связи "Мегафон", "БиЛайн", "МТС" или другого мобильного оператора, можно попробовать уйти к его конкуренту. Рассказываем как это сделать, но сначала - несколько вопросов, которые всегда волнуют тех, кто собирается сделать этот шаг.СодержаниеСколько вре …

Наука и Технологии 14:00, Апрель 30, 2025 | ichip.ru
Луговой раскрыл связь ситуации в Котельниках с мировыми структурами нелегальной миграции

Луговой раскрыл связь ситуации в Котельниках с мировыми структурами нелегальной миграции Сложная миграционная ситуация в подмосковных Котельниках вызвала реакцию британских СМИ, отметил первый зампредседателя комитета Госдумы по безопасности и противодействию коррупции Андрей Луговой. По его мнению, это объясняется тем, что Британия крышует потоки миграции с целью использовать …

Новости 23:22, Апрель 8, 2025 | vz.ru
Новая технология позволяет плавить железо без доменных печей

Новая технология позволяет плавить железо без доменных печей В научной среде активно разрабатываются новые, более экологичные методы производства железа. Ученые разработали электрохимический способ извлечения железа из руды, который имеет потенциал стать конкурентоспособным по стоимости с традиционными доменными печами, при этом значительно снижая з …

Наука и Технологии 01:00, Апрель 14, 2025 | api.follow.it
Любовь к женщине позволяет мужчине быть сильным. Вышел фильм с Машковым

«Любовь к женщине позволяет мужчине быть сильным». Вышел фильм с Машковым В четверг, 1 мая, в российский прокат вышел фильм «В списках не значился», снятый Сергеем Коротаевым по пронзительной повести Бориса Васильева. А накануне президент России Владимир Путин назвал картину произведением искусства.Одним из генпродюсеров и исполнителем роли старшины Степана Матв …

Новости 18:00, Май 1, 2025 | aif.ru
Госуслуги будут блокировать доступ к некоторым разделам при подозрении на действия мошенников

«Госуслуги» будут блокировать доступ к некоторым разделам при подозрении на действия мошенников Портал «Госуслуги» ограничит доступ к финансовой информации в случае появления подозрений на действия мошенников. Об этом сообщило Минцифры.«Мы заботимся о безопасности учетных записей "Госуслуг" и постоянно совершенствуем их защиту. Для борьбы с мошенниками принято еще одно нововведение. …

Деньги, Forex 22:12, Апрель 4, 2025 | banki.ru
Галактическая бомба замедленного действия: учёные обнаружили сверхмассивный дуэт белых карликов на пороге коллапса

Галактическая бомба замедленного действия: учёные обнаружили сверхмассивный дуэт белых карликов на пороге коллапса Астрономы обнаружили в Млечном Пути уникальную «тикающую бомбу» — двойную систему WDJ181058.67+311940.94, где два белых карлика общей массой в 1,56 солнечных стремительно сближаются, нарушив критический порог стабильности. Эти сверхплотные «звёздные останки», …

Наука и Технологии 22:20, Апрель 5, 2025 | ixbt.com
Объёмные объекты теперь можно трогать: испанская технология FlexiVol позволяет редактировать виртуальный мир пальцами

Объёмные объекты теперь можно трогать: испанская технология FlexiVol позволяет редактировать виртуальный мир пальцами В Испании создали объёмный дисплей, с которым можно взаимодействовать руками — как со смартфоном. Устройство под названием FlexiVol, разработанное учёными из Университета Наварры, проецирует трёхмерные объекты в воздухе, позволяя буквально касаться их пальцами без контроллеров или сп …

Наука и Технологии 21:00, Апрель 13, 2025 | ixbt.com
Хитрость, которую должен знать каждый пользователь Snapchat

Хитрость, которую должен знать каждый пользователь Snapchat Если вы пользователь Snapchat, который когда-либо имел несчастье использовать приложение на телефоне Android, то вы наверняка уже в курсе, как хорошо это приложение умеет иногда выводить из себя. Я даже не говорю о навигации по не совсем удобному интерфейсу Snapchat, который запутан незави …

Наука и Технологии 22:00, Март 29, 2025 | androidis.ru
Юная смолянка, которую обвиняют в живодерстве, вновь замечена в Заднепровье

Юная смолянка, которую обвиняют в живодерстве, вновь замечена в Заднепровье Судя по всему, семейство вернулось в старую квартиру. Жители смоленского микрорайона Королевка бьют тревогу: во дворе одной из высоток заметили 13-летнюю девочку, которую неоднократно обвиняли в издевательствах над животными. Примечательно, что она вновь гуляла в окружении стаи собак, об э …

Происшествия 14:10, Октябрь 26, 2022 | smolnarod.ru
Миллионерша, блогер, оппозиционерка: кто такая Александра Митрошина, которую арестовали в России

Миллионерша, блогер, оппозиционерка: кто такая Александра Митрошина, которую арестовали в России Блогера-миллионника Александру Митрошину задержали в России по делу об уклонении от уплаты налогов на десятки миллионов рублей. Spletnik собрал профайл на 30-летнюю Митрошину, которая называет себя "матерь бложья": кто она такая, что известно о её жизни и уголовном деле.Бывшая журналистка …

Звёзды 10:00, Март 9, 2025 | spletnik.ru
Наоми Кэмбелл, которую обвинили в краже средств на благотворительность, рассказала, кто её подставил

Наоми Кэмбелл, которую обвинили в краже средств на благотворительность, рассказала, кто её подставил Наоми Кэмбелл, репутация которой оказалась под угрозой из-за обвинений в краже средств из её же благотворительного фонда, рассказала Financial Times, кто её подставил. По словам 54-летней топ-модели, мошеннические операции за её спиной в Fashion for Relief совершала её помощница Бьянка Хел …

Звёзды 01:00, Апрель 14, 2025 | spletnik.ru
Добыча биткоинов, которую раскритиковал Илон Маск, станет более экологичной

Добыча биткоинов, которую раскритиковал Илон Маск, станет более экологичной Илон Маск объявил на этой неделе, что Tesla приостановит прием биткоинов для покупки электромобилей, сославшись на потребление энергии криптовалютой. Как стало известно gazetadaily.ru, он также особо раскритиковал одну электростанцию, работающую на ископаемом топливе в Нью-Йорке, которая б …

Промышленность 14:10, Октябрь 26, 2022 | gazetadaily.ru
Гурцкая о Глушенкове: Как будто в Зените чувствует себя звездой. После неудачного действия вел себя так: Да и ### с ним. Карпин или Черчесов поменяли

Гурцкая о Глушенкове: «Как будто в «Зените» чувствует себя звездой. После неудачного действия вел себя так: «Да и ### с ним». Карпин или Черчесов поменяли бы его на 25-й минуте» Полузащитник «Зенита» не сделал ни одного результативного действия в трех матчах после возобновления чемпионата Мир РПЛ. В матче против «Спартака» (1:2) хавбек был заменен на 68-й минуте. – У меня такое впечатление, что Глушенков вошел в стадию такой же неуправляемости, какая у него была в …

Спорт 07:00, Март 18, 2025 | sports.ru
Дочь Гвинет Пэлтроу, которую критикуют за высокомерие, рассказала о жизни со статусом nepo baby и своём отношении к хейтерам

Дочь Гвинет Пэлтроу, которую критикуют за высокомерие, рассказала о жизни со статусом nepo baby и своём отношении к хейтерам 20-летняя дочь Гвинет Пэлтроу Эппл Мартин дала интервью журналу Interview, в котором рассказала о взрослении и жизни в статусе "звёздного ребёнка", реакции на критику и любви к гардеробу своей матери.Эппл Мартин для InterviewТак, Эппл призналась, что с детства осознавала, насколько пристал …

Мода, женское, сплетни 21:03, Апрель 3, 2025 | spletnik.ru