Разработчики из российской компании создали нейросеть, которая способна анализировать комментарии в социальных сетях.
Нейросеть «Ольга Станиславовна» – ее назвали в честь школьной учительницы директора компании разработчиков – способна распознавать русский сленг и сарказм. По уверениям программистов, она обладает самым актуальным словарем современного русского сленга и способна отвечать на комментарии в социальных сетях, сообщает «Хайтек».
Во время обучения разработчики акцентировали внимание не на литературном русском языке, а в большей степени на разговорных и матерных выражениях. То есть, главная задача состояла в том, чтобы обучить «Ольгу Станиславовну» языку социальных сетей. При этом необходимо, чтобы она владела именно актуальным словарным запасом, основанным на сленге 2020-2022 годов.
Во время первых испытаний выяснилось, что нейросеть не способна распознавать сарказм и считала выражение «это чертовски беспонтовый пост» – позитивным. Чтобы обучить алгоритм, разработчики создали функцию корректировки «Ольги Станиславовны». Исправления и комментарии уходят в систему, где алгоритм совершенствуется.
Как рассказывают сами программисты, самой сложной задачей было обучить «Ольгу Станиславовну» распознавать сарказм и иронию. Для этого разработчикам пришлось дополнительно загрузить в нейросеть в качестве учебников словари жаргонизмов и мата.
Сейчас программисты говорят, что только во время работы «Ольги Станиславовны» во «ВКонтакте» ей удалось поработать с 20 млн комментариев и обучиться на них. Сейчас она обладает самым актуальным словарным запасом современного русского языка, который используется для общения в социальных сетях.
Дальше «Ольге Станиславовне» предстоит работать вместе с филологами. На основе ее знаний ученые будут исследовать новые языковые нормы.
Комментарии