search
main
0

Лингвистика и искусственный интеллект: рисуют все

День филолога, который мы отмечаем сегодня, касается всех, чья работа связана с изучением языка и литературы и передачей знаний о них. В том числе, конечно, и лингвистов.

А современная лингвистика в последнее время все больше отвечает на различные запросы общества. Вот, например, команда «Сбера» создала модель, в которой компьютерная лингвистика помогает искусственному интеллекту генерировать изображения по описанию. Эту модель вы можете протестировать в любой момент в своем смартфоне.

Результат совместной работы лингвистов и специалистов по искусственному интеллекту от «Сбера» вы видите на рисунках. Это именно рисунки, а не фотографии. Их создатель – модель ruDALL-E Malevich (XL). Они сгенерированы искусственной нейросетью по запросу «Чайка летит над морем».

Искусственный интеллект «обучается» на огромном массиве данных, подготовленных людьми, прежде чем сможет самостоятельно выдать подобный результат.

Компьютерная лингвистика сейчас очень тесно сближается с разными областями искусственного интеллекта, например, с компьютерным зрением, с генерацией изображения такого рода. Это достаточно большое достижение – то, что можно задать какой-то текст, и по нему модель изобразит или построит объект, который этому тексту соответствует.

Глядя на все три рисунка, не приходится сомневаться, что это – чайка над морем, хотя у этих изображений пока есть и некоторые странности.

Получить их было очень просто – достаточно в Telegram подписаться на чат-бота ruDALL-E XL. Или можно зайти на сайт rudalle.ru. Каждый раз нейросеть генерирует новые уникальные рисунки. Запрос на изображение можно вводить на разных языках, в модель встроена система машинного перевода.

Эта нейросеть уже сейчас неплохо работает. И чем больше будет массив данных для обучения искусственной нейронной сети, тем точнее будут результаты ее работы. Но здесь есть и сложность: если создавать, например, большую компьютерную модель, предназначенную для генерации длинных текстов на естественном языке под заданные требования, то нужны огромные компьютерные мощности.

Кроме того, уже сейчас возникает этический вопрос: как избежать генерации текстов или изображений оскорбительного содержания? Не хотелось бы, чтобы искусственный интеллект воспроизводил не лучшие человеческие черты.

Что касается лингвистики как науки, то основная тенденция последних лет – это смещение ее интересов в сторону автоматизированной компьютерной обработки больших данных.

В частности, компьютерная лингвистика взаимодействует со сравнительно-историческим языкознанием посредством автоматического анализа развития тех или иных языковых групп и семей.

Например, в прошлом году в журнале Nature была опубликована статья о родстве алтайских или трансевразийских языков. В эту языковую семью входят тюркские языки, монгольские и тунгусо-манчжурские. Входят ли туда же корейский и японский языки?

Родство алтайских языков с корейским и японским долгое время было под вопросом. И вот получено надежное подтверждение этого родства. Комбинируя генетические, археологические и лингвистические данные, ученые пришли к выводу, что для этих языков можно нарисовать на карте единую прародину.

Ранее сетевое издание «Учительская газета» рассказывало, что впервые в мире нейросеть в соавторстве с человеком написала сборник рассказов. По словам создателей этой нейросети, эксперимент очень важен для развития технологии. Благодаря ему удалось узнать, может ли искусственный интеллект заниматься не только рутинными делами, но и творчеством.

Фото: рисунки, сгенерированные ruDALL-E XL

Оценить:
Читайте также
Комментарии

Новости от партнёров
Реклама на сайте