search
main
Топ 10
В Москве объявили десять лауреатов конкурса «Директор года России – 2023» От всей души: Учителя года разных лет встретились с финалистами конкурса «Учитель года России - 2023» День учителя: о труде педагогов расскажут школьникам на «Разговорах о важном» В МПГУ повысили квалификацию почти 2 тысячи советников директоров по воспитанию В Роспотребнадзоре сказали об условии ухода школ на карантин ЗПР – это не приговор: о работе учителя-дефектолога Юрист предупредил учителей, что забирать смартфоны у школьников незаконно Минпросвещения: решения о закрытии коррекционных школ в регионах должны напрямую согласовываться с министерством В Хабаровске выбрали место для строительства межвузовского кампуса Стали известны призеры конкурса «Директор года России – 2023» В Чувашском педуниверситете имени Яковлева открылся технопарк «Кванториум» В России впервые проводят аккредитационный мониторинг системы образования В Москве состоялось открытие финала Всероссийского конкурса «Первый учитель» Духовно-нравственные ценности и научный подход: новый облик российской системы образования Соцфонд на 2024 год заложил в проект бюджета индексацию пенсий, единого пособия и маткапитала Иван Зарубин из Тюменской области стал победителем конкурса «Мастер года-2023» ОГЭ-2024: какие изменения ждут девятиклассников во время аттестации Конкурс «Директор года России – 2023» вышел на финишную прямую В Москве состоялось открытие заключительного этапа конкурса «Директор года России – 2023» Минпросвещения: ключевое событие Года педагога и наставника Большая учительская неделя стартует 2 октября
0

Математики СПбГУ апробировали новый способ определения авторства текстов на книгах Толкина и Азимова

Исследователи Санкт-Петербургского университета и Института интеллектуальной обработки информации при Колледже ОРТ имени Брауде (Израиль) предложили новое решение для компьютерного исследования авторства и стиля текстов, основанное на моделировании динамического процесса их написания.

Уникальный подход позволил ученым проанализировать произведения Джона Толкина, Айзека Азимова, Артура Кларка и многих других известных писателей, увидев, каким образом менялся их авторский стиль. Результаты одной из последних работ научной группы опубликованы в журнале Pattern Recognition издательского дома Elsevier.Для исследования математики выбрали известные литературные произведения: цикл из семи научно-фантастических романов Айзека Азимова «Основание», серию произведений Джона Голсуорси «Сага о Форсайтах», роман в трех томах Джона Толкина «Властелин колец» и другие книги. В предыдущих работах они также анализировали произведения Джоан Роулинг (цикл книг про Гарри Поттера). Интерес для исследователей представляет именно большой массив материалов, который автор создавал на протяжении долгого времени: математические методы позволяют увидеть, как менялись особенности стиля писателя.\”Работать с большими данными можно традиционно: классифицировать их, искать схожие элементы, подобия или группы. Мы же представили новый взгляд на большие данные и предложили изучить то, каким образом они были созданы. Например, любой текст кто-то написал, наговорил или зафиксировал иным способом. Этот процесс тоже имеет свои значимые характеристики, которые проявляются, например, в авторском стиле писателя. Сегодня мы не просто изучаем то, как выглядят данные, а вскрываем характеристики процесса их создания. До нас подобным образом тексты еще никто не анализировал\” — цитирует пресс-служба вуза профессора СПбГУ доктора физико-математических наук Олега Граничина. В статье исследователи сравнили три книги из цикла \”Властелин колец\” Джона Толкина с двумя другими его произведениями — \”Хоббитом\” и \”Сильмариллионом\”. Метод достаточно точно определил, что первая повесть была написана тем же автором, который создал трилогию, а вот \”Сильмариллион\” заметно отличается по стилю. Это объясняется тем, что книга была издана уже после смерти автора: сборник мифов и легенд Средиземья дорабатывал сын Джона Толкина — Кристофер Толкин, который несколько лет изучал черновики отца.Создатели алгоритма планируют опробовать методику и на произведениях русской литературы, ведь его можно применять для анализа текстов, написанных на других языках, использующих латинский алфавит, кириллицу и арабскую графику.Разработка, как отмечают исследователи, может помочь в анализе не только литературных произведений, но и неструктурированных текстов. Например, метод пригодится при обработке массивов данных, поступающих на диспетчерские пульты или в различные кол-центры по работе с клиентами. Израильские коллеги применяют разработку для определения искусственно сгенерированных текстов, написанных не человеком, а машиной. Например, существуют программы, фабрикующие тесты, похожие на настоящие научные статьи, которые нередко принимают для опубликования в известных журналах. Метод позволяет с большей точностью отличать такие статьи от текстов, написанных человеком.

Уникальный подход позволил ученым проанализировать произведения Джона Толкина, Айзека Азимова, Артура Кларка и многих других известных писателей, увидев, каким образом менялся их авторский стиль. Результаты одной из последних работ научной группы опубликованы в журнале Pattern Recognition издательского дома Elsevier.

Для исследования математики выбрали известные литературные произведения: цикл из семи научно-фантастических романов Айзека Азимова «Основание», серию произведений Джона Голсуорси «Сага о Форсайтах», роман в трех томах Джона Толкина «Властелин колец» и другие книги. В предыдущих работах они также анализировали произведения Джоан Роулинг (цикл книг про Гарри Поттера). Интерес для исследователей представляет именно большой массив материалов, который автор создавал на протяжении долгого времени: математические методы позволяют увидеть, как менялись особенности стиля писателя.

\”Работать с большими данными можно традиционно: классифицировать их, искать схожие элементы, подобия или группы. Мы же представили новый взгляд на большие данные и предложили изучить то, каким образом они были созданы. Например, любой текст кто-то написал, наговорил или зафиксировал иным способом. Этот процесс тоже имеет свои значимые характеристики, которые проявляются, например, в авторском стиле писателя. Сегодня мы не просто изучаем то, как выглядят данные, а вскрываем характеристики процесса их создания. До нас подобным образом тексты еще никто не анализировал\” — цитирует пресс-служба вуза профессора СПбГУ доктора физико-математических наук Олега Граничина.

В статье исследователи сравнили три книги из цикла \”Властелин колец\” Джона Толкина с двумя другими его произведениями — \”Хоббитом\” и \”Сильмариллионом\”. Метод достаточно точно определил, что первая повесть была написана тем же автором, который создал трилогию, а вот \”Сильмариллион\” заметно отличается по стилю. Это объясняется тем, что книга была издана уже после смерти автора: сборник мифов и легенд Средиземья дорабатывал сын Джона Толкина — Кристофер Толкин, который несколько лет изучал черновики отца.

Создатели алгоритма планируют опробовать методику и на произведениях русской литературы, ведь его можно применять для анализа текстов, написанных на других языках, использующих латинский алфавит, кириллицу и арабскую графику.

Разработка, как отмечают исследователи, может помочь в анализе не только литературных произведений, но и неструктурированных текстов. Например, метод пригодится при обработке массивов данных, поступающих на диспетчерские пульты или в различные кол-центры по работе с клиентами. Израильские коллеги применяют разработку для определения искусственно сгенерированных текстов, написанных не человеком, а машиной. Например, существуют программы, фабрикующие тесты, похожие на настоящие научные статьи, которые нередко принимают для опубликования в известных журналах. Метод позволяет с большей точностью отличать такие статьи от текстов, написанных человеком.

По информации пресс-службы СПбГУ

Фото источника

Оценить:
Читайте также
Комментарии

Новости от партнёров
Реклама на сайте