Большинство профайлеров анализируют человеческие эмоции, опираясь на свои субъективные впечатления, либо доверяют это нейросетям. Но это не всегда приводит к удовлетворительным результатам. Недавно команда психологов из МГУ имени М.В.Ломоносова разработала новое приложение «Цифровой профайлер», которое способно считывать так называемые микродвижения на лице человека.
В принципе мы можем научиться владеть собой и не показывать своих истинных эмоций. Но мы не в силах полностью контролировать свою мимику. Когда мы испытываем, например, радость, страх, тревогу, презрение, удивление, даже если всячески пытаемся их скрыть, в каких-то коротких, мгновенных движениях лицевых мышц наши настоящие эмоции все равно проскальзывают.
Алгоритм, идентифицирующий микродвижения, разработал сотрудник кафедры общей психологии психфака МГУ Александр Кремлев вместе с двумя коллегами. Программа анализирует распределение света на поверхности лица.
Для анализа лицо делится на 14 зон, размещенных на обеих его половинах, которые в свою очередь поделены на более чем 300 микрозон. Приложение исследует каждую такую зону, отслеживая перемещение кожных покровов. Затем оно сверяет данные с международной системой кодирования лицевых движений (Facial Action Coding System-FACS), автором которой является известный психолог, консультант популярного телесериала «Обмани меня» Пол Экман. На сегодняшний день это единственная признанная во всем мире система описания движений лица.
«Наша программа анализирует поверхность лица, – комментирует профессор кафедры психологии личности факультета психологии МГУ имени М.В.Ломоносова доктор психологических наук Алексей Гусев. – Так как для точного анализа лица подходящих алгоритмов в мире пока не создано, мы были вынуждены разработать свои оригинальные алгоритмы компьютерного зрения. Они анализируют изменения падающего света на поверхности лица. А дальше эти изменения можно превратить в значимую информацию. И делается это с помощью созданных нашей научной группой многослойных логических правил. У нас шесть уровней таких правил».
«Мы не ищем эмоции, – говорит психотерапевт, эксперт по лицевой мимике, один из разработчиков приложения для профайлинга Михаил Баев. – Мы ищем сдвиг бровей, сморщивание носа, растяжение рта по вертикали, горизонтали. Мы научились измерять 22 базовые двигательные единицы, из которых можно составить любое выражение лица, в том числе и выражение эмоций».
Дело в том, что эмоции, как правило, сопровождаются определенными непроизвольными мимическими движениями. Это могут быть поднятие внутренней части бровей, поднятие внешней части бровей, появление носогубной складки, напряжение нижнего века, растяжение рта и т. д. Но вот отследить их не так-то просто.
«Важно еще и то, что движения лица могут быть очень быстрыми – от 200 до 500 миллисекунд. Не каждый человек это может заметить, – рассказывает профессор Гусев. – А нейросети, от использования которых мы отказались, тоже заметить это не могут, потому что их обучают на выборках, которые разметили эксперты. А эксперты, в свою очередь, работают только по фотографиям, на которых вообще нет микродвижений».
Анализ живых эмоций по видео – крайне сложная задача. Для определения, скажем, одной-единственной эмоции, выражающей злость, требуется около 500000 размеченных сэмплов, говорят специалисты. Да и скорость работы людей-экспертов, анализирующих мимику, крайне низка. Нейросети же здесь тоже не слишком эффективны.
«Появление выражений истинных эмоций на лице человека – редкое событие, не более 1-2 раз в час, – поясняет Баев. – Все остальное время мы видим фрагментарное выражение лица. Мимика гораздо сложнее, она не состоит только из одних эмоций. Нейросети же после анализа выдают результат в процентах, например 10% злости, 20% презрения и 5% радости. Но какой вывод можно сделать из такого анализа? Он противоречит любой концепции выражения эмоций».
Теоретически программа по анализу микродвижений способна заменить собой детектор лжи. Тем более если человек знает, что его будут тестировать на полиграфе, он может натренироваться и обмануть устройство. Но если он не будет знать, что алгоритм во время беседы считывает его мимику, результат получится куда более точным.
Правда, мгновенный результат получить, скорее всего, не удастся. По словам авторов, на выходе приходится анализировать огромное количество данных, так как всех респондентов оценивают по сотням параметров. Систематизировать вручную их невозможно, поэтому они будут подвергнуты компьютерной обработке.
А если в распоряжении профайлеров нет самого человека или его изображений? Тогда анализу могут быть подвергнуты аудиозаписи. Израильская компания Nemesysco разработала технологию Layered Voice Analysis, осуществляющую многоуровневый анализ голоса по изменению более чем 80 физических параметров.
Программа «Цифровой профайлер» уже применяется в проектах нескольких частных компаний. В дальнейшем она наверняка найдет применение в самых разных областях. Например, ее можно использовать в работе следователей, при судебно-психиатрической экспертизе, при подборе персонала, в медицине для диагностики психических заболеваний, для расчета наиболее удачных вариантов коррекции лица в пластической хирургии и косметологии.
Приложение может вылавливать дипфейки в видео, применяться для создания естественной мимики у анимационных персонажей и роботов.
«Интересно, что при всем развитии технологий проблема анализа лица до сих пор не решена, – констатирует Баев. – Мимика человека остается сложной для понимания как для машин, так и для самих людей. Но тренд на отказ от нейросетей в анализе эмоций очевиден в тех странах, которые занимаются развитием профайлинга».
Стало известно, что сейчас над похожими технологиями работают специалисты из Великобритании и Японии. Но все равно получается, что отечественные психологи пока первые!
Ида ШАХОВСКАЯ
Комментарии