Этот гаджет расскажет вам, как другие люди чувствуют себя, лишь по тону их голоса: искусственный интеллект, разработанный MIT CSAIL, проходит обучение, чтобы определить эмоциональное намерение разговора.
Исследователи из Массачусетского технологического института разработали новый прибор, который поможет избежать конфликты и недопонимание.
Используя искусственный интеллект для обнаружения «тона» разговора на основе шаблонов речи, исследователи смогли сделать портативный гаджет, чтобы «классифицировать общий эмоциональный характер исторического повествования субъекта». Проще говоря, гаджет может обнаружить признаки печали, гнева, скуки и так далее по голосу человека.
Проект, по словам Tuka AlHanai и Мохаммад Махди Гасеми на CSAIL, является одним из многих, направленных на «социальный коучинг». Он разработан, чтобы помочь людям с хроническими социальными расстройствами чувствовать себя комфортно при общении с другими людьми.
День за днем жизнь опирается на социальные взаимодействия, которые играют ключевую роль в нашем психическом здоровье и развитии. В то время как лингвистический элемент общения изучается через повторение слов и фраз, тональность и интонация часто усложняют этот процесс, что затрудняет выяснить смысл в разговоре.
Тон разговора может существенно повлиять на его эмоциональное намерение — передать печаль, агрессию или счастье через окрашивание разговора эмоцией и интонацией. В то время как многие из нас могут определять их естественным образом на протяжении всей жизни, их особенно трудно идентифицировать людей с определенными социальными расстройствами, а уж тем более для машины.
Люди с тревожными расстройствами, синдромом Аспергера или другими хроническими социальных расстройствами может испытывать затруднение с тем, чтобы определить эмоциональное намерение разговора, особенно если он имеет «несколько уровней» эмоции — такие, как счастливая история с элементами разочарования. Искусственный интеллект, с возможностью перемещаться по нюансами социальных сигналов, может привести к немалому облегчению жизни для этих групп.
В ходе испытаний, участники проекта получили гаджеты Samsung Simband, которое собирает так называемые физиологические изменения «высокого разрешения». Simband имеет модульную конструкцию и может работать на нескольких датчиков. Это означает, что он может отслеживать большое количество данных, что легло в основу для записи эмоций в разговорах между добровольцами.
Для построения нейронной сети, исследователи записали физиологические изменения у участников, выражения лиц и изменения в речи, чтобы обнаружить, каким образом различные эмоции были физически выражены. Используя эти данные, ИИ и исследователи классифицировали результаты в положительные, отрицательные и нейтральные. Эти группы были затем расширены, чтобы содержать и другие вариации. Например, «негативный» тип эмоции может содержать смесь печали, отвращения, страха или скуки.
Уникальный характер проекта исходит от использования так называемых «природных данных». Вместо того, чтобы просить участников разыгрывать различные эмоции, им вместо этого было позволено рассказать историю по своему собственному выбору, а затем выражения лица и голосовые оттенки могут быть собраны и систематизированы. Хотя проект все еще далёк от завершения, результаты AlHanai и Махди Гасеми уже показывают , что в режиме реального времени можно с высокой точностью классифицировать эмоциональные оттенки естественной беседы.