На помощь придут алгоритмы?
Почему мы узнаем в лицо своих знакомых и совсем иначе реагируем на незнакомцев? Каким образом нам удается интерпретировать чужую мимику? За этим стоят сложные мозговые процессы, которые до недавнего времени оставались мало изученными. Исследования на эту тему провела международная группа ученых, в которую вошли специалисты из Сколтеха (Россия), Института Солка (США) и Центра исследований мозга Riken (Япония).
Известно, что в большинстве случаев мы легко узнаем близких, друзей и знакомых, даже если те меняют внешность, ориентируясь на черты их лиц. Так же мы обычно считываем выражение лица другого человека. Но мы не всегда способны правильно идентифицировать чужие эмоции по лицу. Так, часто мы не в состоянии отличить, когда человек выражает нам свою доброжелательность, а когда подшучивает над нами. Для этого нужно быть достаточно проницательным.
К тому же люди улыбаются по самым разным поводам. Им весело, они чувствуют себя смущенными, виноватыми, иногда они рады чужим проблемам… И наконец, мы автоматически усмехаемся, когда у нас что-то не получается. Но со стороны нашу мимику можно истолковать совершенно иначе.
Несколько лет назад специалисты из Массачусетского технологического института разработали компьютерную программу для распознавания эмоций. Группе добровольцев, которые понятия не имели о цели исследования, сначала демонстрировали смешные видеоролики. После этого им предлагалось заполнить довольно подробные электронные анкеты. Но когда они заканчивали их заполнять, компьютер выдавал сообщения об ошибке, и вся информация бесследно пропадала. При этом компьютер фиксировал реакцию испытуемых. Оказалось, что во время просмотра видео практически все улыбались и смеялись, а обнаружив, что их труд по заполнению анкеты пропал даром, 90% людей усмехались.
Проанализировав записи посредством комбинации различных методов (например, метод опорных векторов, метод скрытых марковских моделей и так далее), ученые обнаружили, что радостная улыбка и раздражительная ухмылка имеют довольно существенные различия. Например, в динамике: улыбка появляется медленнее, но держится на лице дольше, а усмешка раздражения «живет» более краткий срок.
Это позволило создать алгоритм, который помогал отличать одну эмоциональную реакцию от другой на видеозаписи. Точность распознавания достигала 92%, тогда как сами люди давали правильный ответ лишь в половине случаев, что не превышает порога вероятности. Авторы программы считают, что ее можно использовать не только тем, кто плохо разбирается в чужих эмоциях и мимике, но и в процессе обучения пациентов, страдающих аутизмом. Дело в том, что у аутистов проблемы со «считыванием» эмоциональных реакций.
Целью же недавних исследований ученых из Сколтеха и их зарубежных коллег было выяснить, как наш мозг обрабатывает и сохраняет информацию, связанную с распознаванием лиц и интерпретацией различных выражений лица у других людей. Понятно, что за это отвечают нейроны зрительной коры, но как они это делают?
Ученые решили призвать на помощь искусственный интеллект и использовать для получения результата машинное обучение и специально разработанный тензорный алгоритм. В ходе обучения лицо человека представили в виде совокупности отдельных элементов – тензорных изображений: глаза, брови, нос, рот и так далее. На основе данного алгоритма эксперты выстроили математическую модель, описывающую работу нейронов, участвующих в процессе распознавания лиц. В итоге удалось сформировать принцип тензорных разложений, представляющий человеческое лицо как комбинацию компонентов разного уровня сложности. Именно так предположительно работают нейронные связи, когда требуется распознавать лица или эмоции.
Между тем технологии, позволяющие распознавать человеческие лица, в последнее время внедряются во многих сферах.
Практически во всех крупных городах общественный транспорт оборудован системой распознавания лиц с помощью камер. Они способны не только показывать картинку, но и анализировать изображение человека, сверяясь с базой данных. Таким образом, можно вычислять преступников и предотвращать правонарушения.
Как это работает? Ну, предположим, фото правонарушителя есть в базе данных, и он находится в розыске. Если разыскиваемая персона окажется в общественном месте, где стоят камеры видеонаблюдения, и те его распознают, информация об этом тут же поступит куда следует, и человек будет задержан.
Технология, разработанная компанией NEC, с точностью около 90% способна провести идентификацию личности даже по неполным изображениям. Достаточно будет лишь одному фрагменту человека попасть в поле зрения видеокамеры, как его личность будет опознана. Авторы разработки утверждают, что для этого даже не требуются снимки лица, достаточно фотографий, сделанных, предположим, со спины или под углом. Программа будет анализировать одежду, форму тела и другие характерные признаки, по которым можно идентифицировать личность. Технология создана в рамках программы «Безопасный город». Уже в прошлом году систему сканирования лиц начали внедрять повсеместно. Например, скоро школьникам, учителям и родителям не нужны будут пропуска для прохода в учебное заведение: «умные» турникеты просто сверят их лица с базой и пропустят в здание лишь тех, кто имеет право здесь находиться.
В общем, с одной стороны, технологии облегчают нам жизнь, упрощая поиск и идентификацию людей, а с другой – нам очень сложно будет в определенных ситуациях сохранять конфиденциальность и анонимность.
Почему мы узнаем в лицо своих знакомых и совсем иначе реагируем на незнакомцев? Каким образом нам удается интерпретировать чужую мимику? За этим стоят сложные мозговые процессы, которые до недавнего времени оставались мало изученными. Исследования на эту тему провела международная группа ученых, в которую вошли специалисты из Сколтеха (Россия), Института Солка (США) и Центра исследований мозга Riken (Япония).
Известно, что в большинстве случаев мы легко узнаем близких, друзей и знакомых, даже если те меняют внешность, ориентируясь на черты их лиц. Так же мы обычно считываем выражение лица другого человека. Но мы не всегда способны правильно идентифицировать чужие эмоции по лицу. Так, часто мы не в состоянии отличить, когда человек выражает нам свою доброжелательность, а когда подшучивает над нами. Для этого нужно быть достаточно проницательным.
К тому же люди улыбаются по самым разным поводам. Им весело, они чувствуют себя смущенными, виноватыми, иногда они рады чужим проблемам… И наконец, мы автоматически усмехаемся, когда у нас что-то не получается. Но со стороны нашу мимику можно истолковать совершенно иначе.
Несколько лет назад специалисты из Массачусетского технологического института разработали компьютерную программу для распознавания эмоций. Группе добровольцев, которые понятия не имели о цели исследования, сначала демонстрировали смешные видеоролики. После этого им предлагалось заполнить довольно подробные электронные анкеты. Но когда они заканчивали их заполнять, компьютер выдавал сообщения об ошибке, и вся информация бесследно пропадала. При этом компьютер фиксировал реакцию испытуемых. Оказалось, что во время просмотра видео практически все улыбались и смеялись, а обнаружив, что их труд по заполнению анкеты пропал даром, 90% людей усмехались.
Проанализировав записи посредством комбинации различных методов (например, метод опорных векторов, метод скрытых марковских моделей и так далее), ученые обнаружили, что радостная улыбка и раздражительная ухмылка имеют довольно существенные различия. Например, в динамике: улыбка появляется медленнее, но держится на лице дольше, а усмешка раздражения «живет» более краткий срок. Это позволило создать алгоритм, который помогал отличать одну эмоциональную реакцию от другой на видеозаписи. Точность распознавания достигала 92%, тогда как сами люди давали правильный ответ лишь в половине случаев, что не превышает порога вероятности. Авторы программы считают, что ее можно использовать не только тем, кто плохо разбирается в чужих эмоциях и мимике, но и в процессе обучения пациентов, страдающих аутизмом. Дело в том, что у аутистов проблемы со «считыванием» эмоциональных реакций.
Целью же недавних исследований ученых из Сколтеха и их зарубежных коллег было выяснить, как наш мозг обрабатывает и сохраняет информацию, связанную с распознаванием лиц и интерпретацией различных выражений лица у других людей. Понятно, что за это отвечают нейроны зрительной коры, но как они это делают?
Ученые решили призвать на помощь искусственный интеллект и использовать для получения результата машинное обучение и специально разработанный тензорный алгоритм. В ходе обучения лицо человека представили в виде совокупности отдельных элементов – тензорных изображений: глаза, брови, нос, рот и так далее. На основе данного алгоритма эксперты выстроили математическую модель, описывающую работу нейронов, участвующих в процессе распознавания лиц. В итоге удалось сформировать принцип тензорных разложений, представляющий человеческое лицо как комбинацию компонентов разного уровня сложности. Именно так предположительно работают нейронные связи, когда требуется распознавать лица или эмоции.
Между тем технологии, позволяющие распознавать человеческие лица, в последнее время внедряются во многих сферах.
Практически во всех крупных городах общественный транспорт оборудован системой распознавания лиц с помощью камер. Они способны не только показывать картинку, но и анализировать изображение человека, сверяясь с базой данных. Таким образом, можно вычислять преступников и предотвращать правонарушения.
Как это работает? Ну, предположим, фото правонарушителя есть в базе данных, и он находится в розыске. Если разыскиваемая персона окажется в общественном месте, где стоят камеры видеонаблюдения, и те его распознают, информация об этом тут же поступит куда следует, и человек будет задержан.
Технология, разработанная компанией NEC, с точностью около 90% способна провести идентификацию личности даже по неполным изображениям. Достаточно будет лишь одному фрагменту человека попасть в поле зрения видеокамеры, как его личность будет опознана. Авторы разработки утверждают, что для этого даже не требуются снимки лица, достаточно фотографий, сделанных, предположим, со спины или под углом. Программа будет анализировать одежду, форму тела и другие характерные признаки, по которым можно идентифицировать личность. Технология создана в рамках программы «Безопасный город». Уже в прошлом году систему сканирования лиц начали внедрять повсеместно. Например, скоро школьникам, учителям и родителям не нужны будут пропуска для прохода в учебное заведение: «умные» турникеты просто сверят их лица с базой и пропустят в здание лишь тех, кто имеет право здесь находиться.
В общем, с одной стороны, технологии облегчают нам жизнь, упрощая поиск и идентификацию людей, а с другой – нам очень сложно будет в определенных ситуациях сохранять конфиденциальность и анонимность.
Лада КОВАЛЕНКО
Комментарии