Relarn
Relarn-2000   Relarn-99   Relarn-98
   [ Н о в о с т и ]   [ У ч а с т н и к и ]   [ Т е з и с ы ]   [ П р о с м о т р ]

Локализация поисковых систем Интернет

Степанов Вадим Константинович

Институт перепод.работников искусства, культуры и туризма, Москва

Тел.: 928-30-27, e-mail: stepanov@shpl.ru
 

Полнота учета ресурсов Интернет поисковыми системами имеет ключевое значение, поскольку от объема баз данных поисковых машин напрямую зависит уровень осведомленности пользователей о наличии источников. Зарубежные исследования показывают, что при оценке общего объема информации в Сети в 1,5 миллиарда документов, всемирно известные поисковые средства по отдельности учитывают не более 15-20% этого объема. В результате огромное количество информации остается попросту неизвестной и, соответственно, недоступной пользователям.

Один из вариантов решения этой проблемы заключается в создании поисковых средств, изначально ограничивающих свои масштабы, границами отдельных территорий, точнее - серверами, физически находящимися в пределах отдельного государства или даже части страны. Подобная специализация поисковых средств позволяет значительно увеличить полноту учета информационного массива, а также устраняет трудность обработки материалов на национальных языках. Тенденция локализации поисковых средств присуща всем без исключения развитым странам, каждая из которых обладает минимум двумя-тремя собственными машинами поиска. Степень полноты индексации источников достигает в них уже 60-70%.

Сложилась ситуация, когда в Интернет существуют поисковые системы трех территориальных уровней: глобального, национального и местного (локального). Глобальные, среди которых такие известные как Alta Vista, Northern Light, Fast Search, Excite, Google наиболее эффективны при разыскании источников, находящихся в Северной Америке или принципиально не связанных с определенным регионом. Для выявления материалов в пределах отдельной страны, исключая США и Канаду, более пригодны национальные системы. Таковы Yandex в России, UK Searcher в Великобритании, Goo в Японии, THEA в Греции и многие другие. В последние годы создаются и местные поисковые машины, обеспечивающие порой близкое к исчерпывающему индексирование сайтов отдельных областей, провинций и графств. К этой группе в России, в частности, относятся тверской SEARCH.TVER.RU, удмуртский UdmSearch, пермский Perm Search и другие. Пока еще отечественные местные поисковые службы по объему проиндексированного материала и качеству поискового механизма в большинстве своем уступают системам национального уровня, находясь на уровне экспериментальных разработок.

Следует различать подлинную и псевдо локализацию поискового сервиса. В первом случае системы обладают собственным поисковым роботом и индексным файлом, отражающим содержание региональных серверов. Псевдолокализация проявляется в создании региональных зеркал поисковых машин более высокого территориального уровня, которые не имеют собственного робота, и, соответственно, не обеспечивают сколько-нибудь более детальный учет содержания местных сайтов. Их можно использовать лишь для конкретизации запроса.

Локализация, как одна из форм специализации, будет развиваться все шире, становясь привычным атрибутом поискового сервиса в Интернет. Подобное территориальное дробление закономерно приведет к тому, что поисковыми средствами будет учитываться все более весомая доля ресурсов, однако, для получения исчерпывающего результата по всем имеющимся в Сети источникам, пользователям предстоит последовательно обращаться ко все большему количеству систем. Этот недостаток, в свою очередь, может быть устранен за счет совершенствования метапоисковых средств, обеспечивающих одновременный доступ к ресурсам сразу нескольких поисковых машин.



Н а з а д ]


© Ассоциация Relarn, 2000

Designed at WebZavod