Поисковых систем сегодня существует не один десяток. Наиболее популярные среди российских пользователей: «Яндекс» (http://www.yandex.ru), «Google» (http://www.google.com), «Рамблер» (http://www.rambler.ru), «Апорт» (http://www.aport.ru). Принцип использования таких поисковых систем прост: пользователь должен ввести ключевые слова, которые, по его мнению, описывают тематику искомых материалов, система осуществляет отбор документов и выдает пользователю список ссылок на отобранные материалы.
Важно понимать, что ни одна поисковая система не осуществляет поиск в «живой» сети, а проделывает эту операцию в специальной собственной базе данных, хранящей описание некоторого множества документов из интернета. Состав включенных в эту базу данных документов специфичен для каждой конкретной системы и всегда является неполным по отношению к истинному состоянию Сети. Именно поэтому никогда нельзя ответить на вопрос: «Какая поисковая система лучше?»
Важным показателем эффективности поиска является его полнота. Очевиден тот факт, что любой проведенный поиск является заведомо неполным, как по объективным (всегда существуют документы, не представленные в базе данных используемых поисковых систем), так и по субъективным причинам (наборы ключевых слов, указанных пользователями, не всегда совершенны). Но если борьба с объективными причинами находится за гранью возможностей пользователя, то работа над качеством запросов является одним из важнейших инструментов повышения эффективности поиска.
Прежде всего надо понимать, что процедура поиска должна быть циклической: пользователь вводит ключевые слова – система отбирает документы – пользователь анализирует результаты и уточняет состав запроса, после чего поиск производится повторно. Чем сложнее задача, тем больше может потребоваться итераций поиска.
При уточнении запросов помимо добавления новых ключевых слов, выбранных из найденных документов, есть и другие приемы расширения поиска на основе имеющихся ключевых терминов:
конкретизация (например, для термина «Москва» могут использоваться конкретизирующие термины «город», «город-герой»),
подбор синонимов, синонимичных выражений,
использование устаревших, измененных терминов, отмененных и замененных понятий («электронно-вычислительная машина» вместо «компьютер», «Ленинград» вместо «Санкт-Петербурга» и т.п.),
использование имен людей, связанных с разработкой данных понятий, с исследуемыми событиями и т.п.,
сведения о странах, местностях, населенных пунктах и т.п., связанных с понятиями, которые вы исследуете.
Кроме приемов изменения запросов на каждом очередном «витке» поиска для повышения полноты его результатов следует также расширять круг поисковых систем. Экспериментально легко убедиться, что для одного и того же запроса результаты, выдаваемые разными системами, будут различны практически всегда.
В заключение еще один важный вопрос, связанный с использованием ресурсов интернета, – авторское право. Ресурсы интернета – это самые слабо защищенные с точки зрения произвольного и выборочного копирования материалы: довольно просто выделить фрагмент текста или иллюстрацию, скопировать и вставить этот фрагмент в любой другой электронный документ. Однако следует помнить, что информационная культура предполагает оформление источников при цитировании, а вопросы авторских и имущественных прав – письменное разрешение правообладателя на самостоятельное размещение информации на публичных ресурсах, даже если это размещение осуществляется в некоммерческих целях.
Павел БЕЛКИН, директор некоммерческого партнерства «Современные технологии в образовании и культуре»
Комментарии