search
main
Топ 10
Милосердие и гуманизм: 5 декабря на «Разговорах о важном» школьникам расскажут о Дне волонтера Этот день настал: 7 декабря одиннадцатиклассники пишут итоговое сочинение С января 2023 года школы обязаны будут использовать систему «Моя школа» Педагогические династии были представлены на межрегиональном конкурсе Школы переводят на дистант и закрывают из-за гриппа и ОРВИ в Астраханской области В Ульяновске одну из улиц назовут в честь народного учителя Латышева В Калмыкии – карантин: итоговое сочинение перенесли на февраль 2023 года «Дети стоят на улице в минус 18»: в Кургане разгорелся скандал из-за прохода в школу Учителя Ульяновской области станут зарабатывать больше Перенос итогового сочинения, школа без контрольных работ, финалы ВСоШ - главные новости образования Залог успешного общения: Сферум запускает бесплатный курс повышения квалификации по коммуникациям для учителей Омские школьники придумали, как помочь страдающим болезнью Альцгеймера и их родным Десять медицинских классов открылись в Новгородской области Школам Комсомольска-на-Амуре пригрозили отключить отопление и электричество В первом чтении принят закон, позволяющий переводить школы с муниципального уровня на региональный Лучший старт в учительской профессии в Подмосковье взяли мужчины Глава РАО озвучила причины высокой учебной нагрузки в школах В подмосковных школах стартовала неделя функциональной грамотности Совет учителей-блогеров предложил свои идеи к Году педагога и наставника Сельская ДШИ в Оренбуржье признана лучшей в России в год своего 65-летия
0

В ИКИТ Сибирского федерального университета создали алгоритм распознавания речи по видео

Магистрант Института космических и информационных технологий (ИКИТ) Сибирского федерального университета Антон Дзюба разработал алгоритм распознавания речи по видео. Об этом сообщили в пресс-службе вуза.

Фото: пресс-служба Сибирского федерального университета

Нейронные сети распознают речь по артикуляции губ в два этапа. Сначала идет поиск лица и выделение области губ в отдельном кадре. Далее последовательность кадров поступает на вход сверточной и рекуррентной нейронных сетей глубокого обучения для распознавания виземы речи.

В пресс-службе отметили, что в ходе экспериментальных исследований использовался набор данных, содержащий 768 различных высказываний, произнесенных различными русскоговорящими спикерами. Тестовыми словами были: «бегу», «пила», «милый», «усы», «вулкан», «банан», «тонуть». Лучшая точность распознавания речи по артикуляции составила 93,7 % для слова «банан», а средняя точность — 68%.

«Визуальное распознавание речи является важнейшей задачей при общении людей с нарушениями слуха», – пояснил Антон Дзюба. Распознавание речи по артикуляции также можно применять и в других областях, не связанных с медициной, в частности, в правоохранительной деятельности, добавил разработчик. «Виземы и фонемы не имеют однозначного соответствия. В русском языке насчитывается 42 фонемы. Из них 6 гласных и 36 согласных. Часто несколько фонем соответствуют одной виземе и выглядят одинаково на лице говорящего человека», – добавил Дзюба. По его словам, в дальнейшем он планирует усовершенствовать алгоритм, повысить точность его работы и расширить количество распознаваемых слов.

Оценить:
Читайте также
Комментарии

Новости от партнёров
Реклама на сайте