Библиотека Интернет Индустрии I2R.ru |
|||
|
Елена Колмановская о "быстром" "Яндексе"17.08.2005 15:51 Главный редактор "Яндекса" Елена Колмановская комментирует статью, посвященную запуску "быстрого" робота "Яндекса", индексирующего определенную часть Рунета. Как удалось увеличить скорость индексирования? База быстрого робота — это менее 1% всей базы, поэтому процесс обхода документов и выкладывания может происходить заметно чаще без существенного увеличения нагрузки. Выборка из быстрой базы делается одновременно с выборкой из медленной? Да. В момент запроса метапоиск обращается как к основным поисковым машинам, так и к машинам с базой быстрого робота. Основную базу некорректно называть "медленной", ее обновление происходит каждые 2–3 дня. Пришлось ли ради этого увеличивать серверный парк? Мы добавили десяток серверов к примерно пяти сотням, на которых работал поиск и робот. Насколько возросла нагрузка на сервера? "Быстрая база" расположена на отдельных серверах. Планируется ли в дальнейшем увеличивать скорость? Возможно, но скорость выкладывания не является самоцелью. Работа над быстрым роботом подразумевает: обнаружение актуальных документов; оперативную индексацию и выкладывание; правильное ранжирование. Все три составляющие важны для пользователей. Сейчас в вашей базе находится почти 800 млн документов. Если учесть все факторы, можно сказать примерно, когда ее размер достигнет миллиарда? Когда на главной странице "Яндекса" будет написано "Поиск по 1 000 000 000 документов Рунета". :) И еще — мне кажется, что в этой статье допущена ошибка. А именно — прочтя ее, остаешься под впечатлением, что "Яндекс" априори назначил какие-то сервера актуальными и включил их в быструю базу. На самом деле так не происходит, включение в базу идет постранично и динамично, поэтому состав страниц (и сайтов, с которых они взяты) постоянно обновляется. Материалы по теме: последние новости 17.08.2005 18:28 | Белорусский КГБ охотится за флэш-аниматорами...» 17.08.2005 17:20 | Интернетчики требуют большей персонализации...» 17.08.2005 16:37 | 10 лучших ресурсов по CSS...» 17.08.2005 15:51 | Елена Колмановская о "быстром" "Яндексе"...» 12.08.2005 20:05 | Результаты Google в таблице Excel...» 12.08.2005 19:38 | "Яндекс" индексирует быстрее, но не всех...» 12.08.2005 19:23 | MSN начнет тестировать контекстную рекламу в октябре...» 12.08.2005 17:27 | URLex поможет сделать комментарии...» 11.08.2005 19:41 | Как Рунет кликает по СМИ...» 11.08.2005 18:47 | Opera находит ответы...» 10.08.2005 21:22 | Web-дизайн: типичные ляпы и как их избежать...» 10.08.2005 20:41 | Плохой веб-сайт — и маркетинг в пролете...» 09.08.2005 19:21 | Macromedia анонсирует Studio 8...» 09.08.2005 18:08 | Вышел первый номер журнала FlashTimes...» 09.08.2005 17:36 | Yahoo изменяет методику подсчета рекламных показов...» 09.08.2005 17:29 | Минтранс Украины подарит свободу интернету...» 09.08.2005 17:11 | Лекции по фото-истории на фестивале DeArt в сентябре...» 09.08.2005 17:01 | Список сайтов с максимальным PageRank...» 09.08.2005 16:46 | Веб-дизайн по половому признаку...» 09.08.2005 16:31 | К 2010 году поисковая реклама займет место баннерной...» |
|
2000-2008 г. Все авторские права соблюдены. |
|