search
main
0

Еще раз о Национальном корпусе русского языка

Сегодня мы продолжим разговор о Национальном корпусе русского языка (www.ruscorpora.ru) и постараемся ответить на вопрос: кому и зачем может быть нужен Корпус? Отчасти на этот вопрос ответ был дан в предыдущей статье. Прежде всего Корпус нужен – даже не просто нужен, а необходим – профессиональным лингвистам, тем, кто так или иначе имеет дело с фактами языка, а значит, должен эти факты собирать и систематизировать. Для лингвистов Корпус – как минимум неоценимый инструмент, сокращающий затраты времени на техническую работу. Конечно, Корпус – нечто большее, чем просто техническое подспорье, – это фактически справочно-информационная система по современному русскому языку, позволяющая получать ответы на самые неожиданные вопросы, более того, позволяющая ставить новые проблемы, которых лингвистика прошлого почти не касалась.

Но, может быть, Корпус – это изобретение ценное, однако интересное только узким профессионалам? Может ли Корпус быть интересен кому-то еще, кроме лингвистов?

Безусловно, может, так же, как далеко не только лингвисты пользуются словарями и грамматиками. И я бы считал основную цель этих заметок достигнутой, если бы слово «корпус» в гуманитарной (и не только) среде стало таким же привычным, как слово «словарь», и если бы мои читатели-нелингвисты попробовали бы и для себя отыскать различные возможные полезные применения Корпуса.

Но сначала скажу о тех, кому давно уже не приходится специально рассказывать о преимуществах Корпуса. Это программисты, работающие в области автоматической обработки текстов (в том числе и различного рода поисковых систем). Поскольку программы такого рода имеют дело с естественным языком, они должны в той или иной степени «понимать» структуру текстов, написанных на этом языке. Причем – внимание! – понимать структуру именно тех текстов, которые встречаются в реальной жизни, а не идеализированную структуру языка в том виде, как она описана в академических и тем более школьных грамматиках. Из сказанного ясно, что программисты, может быть, как никакие другие профессионалы (не считая лингвистов, конечно) заинтересованы в том, чтобы корпуса, отражающие подлинное и максимально разнообразное языковое употребление, так сказать, не приглаженную языковую стихию, создавались и развивались. Не случайно проект создания Национального корпуса русского языка уже на самых ранних этапах был поддержан компанией «Яндекс» (крупнейший российский портал, разработавший одну из самых быстрых и эффективных поисковых программ по русскому сегменту Интернета), и в целом вне лингвистики наибольшее внимание к Корпусу проявляли и проявляют специалисты по информатике и программированию. Сотрудничество с программистами компании «Яндекс» оказалось очень плодотворным: при их непосредственной технической поддержке и был создан сайт, на котором размещен Национальный корпус русского языка в его нынешнем виде.

Разумеется, и программисты далеко не исчерпывают «целевую аудиторию» Корпуса. Следующая по важности группа пользователей – это, наверное, те, кто так или иначе имеет дело с преподаванием современного русского языка, причем как в качестве родного, так и в качестве иностранного.

Например, именно в Корпусе можно быстро и легко найти пример на редкое слово или грамматическую конструкцию, проверить написание или употребление интересующих единиц и т. п. Кроме того, Национальный корпус русского языка значительно облегчает учителю процесс составления упражнений разного рода. Возможность поиска по грамматическим критериям позволяет автоматически получить примеры, из которых уже вручную можно выбрать подходящие варианты для тех или иных заданий. Следует, правда, при этом помнить, что Корпус не нормативное пособие, язык там отражается не таким, каким он должен быть, с точки зрения авторов описаний, а таким, каким он на самом деле является. С точки зрения школьной грамматики многое из того, что встречается в Корпусе, будет квалифицировано как «ошибки» или в лучшем случае «отступления» от нормы. Впрочем, ничто не мешает учителю и его ученикам составить собственный подкорпус из образцовых с точки зрения языка произведений и пользоваться именно им.

Очень полезен Корпус и для преподавателей русского языка в иностранной аудитории. Действительно, мы, носители русского языка, ежесекундно погружены в его стихию. «Примеры употребления» русского языка не просто существуют у нас в сознании – они окружают нас буквально повсюду. Конечно, специально отобранные и обработанные в составе Корпуса эти примеры могут принести гораздо бoльшую пользу, но если носителя русского языка лишить Корпуса, это не скажется фатальным образом на возможности его контактов со стихией русского языка – просто потому, что эта стихия существует по крайней мере и в его сознании тоже.

Иное дело иностранец. Его языковое сознание не русское. И он в высшей степени нуждается в инструменте, открывающем ему максимально широкий (и максимально комфортный) доступ в мир русского языка. Ничего лучше Корпуса современная наука в этом случае предложить не может. Именно в Корпусе преподаватель и студент могут найти ответы на многие интересующие их вопросы – причем такие ответы, которые и носитель не сразу догадается предложить. Поэтому не случайна высокая популярность корпусов в иноязычной среде. И именно от зарубежных русистов (в особенности преподавателей русского языка) мы получали самые заинтересованные и самые эмоциональные отклики.

Еще одна группа людей, для которых Корпус может представлять бесспорный интерес, – люди пишущие и, шире, вообще как-то в своей повседневной деятельности связанные со словом. Например, редакторы газет и журналов. Редакторам в своей практической деятельности гораздо чаще, чем академическим исследователям, приходится решать вопросы узуса: допустимо ли такое слово или конструкция? Кто, где, когда употребил впервые такой оборот? Для каких типов текста он наиболее характерен? Трудно представить себе, где можно быстро найти ответы на такие вопросы, если не в Корпусе. Опять-таки Корпусом можно пользоваться и для проверки каких-то сведений, т. е. как справочником, но, еще раз повторю, в этом отношении необходимо соблюдать известную осторожность, помня, что не все действительное может быть разумно (по крайней мере если речь идет о тексте, предназначенном для школьного изложения или публикации в газете или журнале).

Владимир ПЛУНГЯН,

член-корреспондент РАН, заведующий Отделом корпусной лингвистики и лингвистической поэтики Института русского языка РАН

Оценить:
Читайте также
Комментарии

Реклама на сайте