Глубокое обучение для машинной эмпатии: взаимодействие роботов и людей – часть I

В случае неизбежного развития следующей цифровой революции человечество столкнется с беспрецедентной волной автоматизации. С нами будут сосуществовать все больше и больше умных устройств. В принципе, эта революция уже происходит: вспомните про мобильные телефоны, автономные транспортные средства и даже холодильники. Это правда, роботы уже среди нас, и они останутся с нами.

Вопрос не в том, согласны ли мы с этим фактом, а в том, как мы будем взаимодействовать с этими новыми «соседями». Помимо классических принципов дизайна (полезность и стиль), актуальным будет другой критерий – машинная эмпатия. Эта тенденция будет усиливаться по мере того, как все больше компаний будут осознавать, что взаимодействие человека и машины (HMI) – это ключ к безопасному внедрению технологий.

Но что мы можем сделать, чтобы улучшить взаимодействие человека и машины? Можем ли мы хотя бы облегчить наше сосуществование?

Ключом к социальной интеграции является способность понимать, что чувствуют и думают другие люди, и соответствующим образом реагировать на это. До сих пор эта способность была характерна только для (некоторых) людей. Эта добродетель, называемая эмпатией, способствует социализации, так как люди общительны по своей природе.

Поэтому нужно дать машинам возможность понять, как мы чувствуем, что нам нужно и каковы наши цели. Так они будут максимально ориентированы на наш комфорт. Следует придать им и правильный вид. Будет ли это новое поколение роботов человекоподобным? Будут ли они как безобидный робот-пылесос Roomba? Или, возможно, страшными, как машины-собаки из Black Mirror и их дальние родственники из Boston Dynamics? Это только часть вопросов, которые следует решить при обсуждении HMI.

Над этой областью работали многие исследователи; в частности, ученые Массачусетского технологического университета работали над человекоподобными роботами. Они разработали социального робота Kismet, который любезно реагирует на эмоции своих зрителей, вовлекая их в естественное и выразительное общение лицом к лицу. Предварительные результаты показали значительное улучшение взаимодействия между людьми и этими машинами.

Kismet, MIT’s social robot.

Очевидно, что успех этой новой волны автоматизации будет во многом зависеть от сопереживания и индивидуальности роботов. Представьте себе автомобиль, который замечает, что вам грустно, и автоматически воспроизводит песню, которую вы любите, чтобы вы чувствовали себя лучше, или робота – помощника врача, который распознает ваши потребности и реагирует, чтобы обеспечить вам максимальное внимание и комфорт. Если роботу добавить мощное автоматическое распознавание речи и обработку естественного языка (широко разработанные Amazon Alexa и другими), то его возможности будут безграничными.

Такая система может питаться внешними источниками информации, что позволит ей развиваться на основе накопленного опыта. Ваше устройство будет постоянно учиться у вас. Эта гиперперсонализация будет иметь прямое следствие – уникальность. Уникальность порождает привязанность, которая, по своей сути, является человеческим качеством.

Real Steel robot Atom (2011)

В научно-фантастическом фильме «Живая сталь» (2011) Атом, робот-боксер, несколько раз получает серьезные повреждения во время боя. Внезапно зрители начинают проявлять эмоции, и это явный признак того, что мы не хотим терять Атома, что он уникален. Мы знаем, что сделало Атома таким особенным по сравнению с другими роботами: он проявлял свои чувства и был чутким.

Но не волнуйтесь, совсем скоро облачные хранилища и телекоммуникационные технологии будут развиты настолько, что вы не потеряете личность вашего робота.

Остается неясным, как это может изменить технологическую отрасль и повлиять на потребительские привычки. Вы будете менять свой автомобиль так же часто, как раньше? Будет ли у вас ощущение, что ваше устройство уникально? Вы сможете сблизиться с ним?

Реальность такова, что у нас до сих пор нет ответов на эти вопросы. Эта революция только начинается, и ее возможные последствия еще не до конца понятны. Эта тема станет частью открытой дискуссии в ближайшие годы.

Глубокое обучение и распознавание эмоций

Распознавание эмоций – это первый шаг на пути к созданию настоящих «сопереживающих» машин. Такая система была успешно построена с помощью архитектур глубокого обучения, в частности, сверточной нейронной сети (CNN).

Секрет успеха заключается в способности CNN автоматически идентифицировать соответствующие низко- и высокоуровневые характеристики входных изображений. Сеть дает более ясное представление изображения, сочетая свойства низкого и высокого уровней, чтобы в итоге получить цельное содержание, а не отдельные факты о пикселях. Это итоговое представление используется для классификации эмоций в нескольких категориях, таких как: грусть, радость, гнев, страх, удивление и нейтральность. Более подробно об этом можно прочитать в статье Нейронный алгоритм для переноса стиля.

На этом видео показаны результаты однонедельного эксперимента распознавания эмоций в реальном времени с использованием глубокой сверточной нейронной сети. Чтобы проверить данный способ, мы выбрали известное интервью «Грустный Бен Аффлек». Здесь представлены предварительные результаты (предстоит дальнейшая работа):

AI находит Аффлека грустным

В следующем посте мы перейдем непосредственно к реализации этого базового (и функционального) модуля эмпатии для роботов, основанных на глубоком обучении. Мы рассмотрим методы машинного зрения, начиная с классических алгоритмов быстрого распознавания лиц и заканчивая глубокой нейронной сетью для распознавания эмоций и обучения перевода.

Оригинал статьи: Deep Learning for Machine Empathy: Robots and Humans Interaction — Part I