Mail.ru научила Google русскому языку
- 20 апреля 2004 года 07:02
- Категория: Новости
- Комментарии: 0
Новый поисковый сервис на портале @Mail.ru был запущен летом 2003-го года. В качестве поискового механизма была выбрана зарекомендовавшая себя во всем мире технология Google WebSearch, которая осуществляет индексацию ресурсов всего мирового интернета. Таким образом, Поиск@Mail.ru сразу приобрел большое конкурентное преимущество перед всеми отечественными поисковыми системами, осуществлящими поиск только по русской части сети, на долю которой приходится всего около 8% страниц.
Однако, механизм компании Google не был до конца адаптирован к особенностям грамматики русского языка, в частности, при обработке поисковых запросов система не учитывала словоформы, получающиеся в результате склонения и спряжения слов. Таким образом, часть документов с нужными результатами, могла выпасть из поля зрения поискового механизма, если слово в них встречалось в другом падеже, нежели в запросе (например "китайские пытки" и "китайских пыток").
Чтобы решить эту проблему, команда разработчиков компании @Mail.ru создала дополнительный программный модуль, усовершенствующий работу механизма Google. Теперь Поиск@Mail.ru умеет учитывать все возможные формы слова в одном запросе. Эта уникальная возможность доступна только пользователям портала @Mail.ru, на сайте поисковой машины Google.com она не реализована.
Причем, пользователь может по своему желанию включать и отключать эту возможность, в зависимости от конкретной задачи. Особенно помогает поиск "с учетом морфологии" при поиске информации, которая в сети представлена плохо.
Например, при запросе "румынские поэты биография" поисковая машина выдает 7 документов в режиме "без учета морфологии" и 126 документов "с учетом морфологии". Напротив, если результатов поиска слишком много и они не очень релевантны, морфологию можно отключить, сузив таким образом область поиска.