На главную

Библиотека Интернет Индустрии I2R.ru

Rambler's Top100

Малобюджетные сайты...

Продвижение веб-сайта...

Контент и авторское право...

Забобрить эту страницу! Забобрить! Блог Библиотека Сайтостроительства на toodoo
  Поиск:   
Рассылки для занятых...»
I2R » Секреты поиска » Поисковые системы и каталоги

О полной неопределённости и поиске в Интернете

До сих пор мы пытались составить запрос так, чтобы сразу получить нужную нам информацию. Но так, «с налету», обнаружить нужную ссылку удается не всегда.

Семь раз отрежь

В некоторых случаях поисковая машина возвращает множество ссылок, и нужные теряются в их обилии. А какие дополнительные ключевые слова использовать, чтобы сузить область поиска, сразу непонятно. В этом случае придумать нужные ключевые слова помогают уже найденные ссылки.

Например, нам требуется найти биографию писательницы Жорж Санд. Попробуем использовать Rambler (www.rambler.ru) и отправим запрос «Жорж Санд биография». Ссылок находится несколько десятков, но дельных среди них, похоже, нет. Зато мы узнаем, что Жорж Санд – псевдоним, а настоящее имя писательницы – Аврора, фамилия по мужу – Дюдеван. Это позволяет составить новый запрос: «Жорж Санд Аврора Дюдеван». Уже теплее: биографии в результатах поиска опять не видно, зато мы находим год рождения. Теперь можно уточнить третий запрос: «Жорж Санд Аврора Дюдеван 1804» – и получить ссылки на три подходящих документа.

Однако, незадача: две ссылки – куцые статейки из пары абзацев, а самая многообещающая (www.booksite.ru/fulltext/bro/kga/brokefr/4/4184.htm – статья в энциклопедии Брокгауза и Ефрона!) возвращает ошибку 404: «Документ с указанным Вами адресом на сервере отсутствует».

И все-таки шанс отыскать этот документ есть. Попробуем использовать метод усечения URL справа: будем отсекать по куску от адреса страницы, начиная справа, пока не попадем в точку, откуда сможем найти интересующий нас документ, либо пока не придем к корневой странице сервера и дальше усекать адрес уже будет невозможно.

Практически это выглядит так. Сначала попробуем заглянуть на страницу www.booksite.ru/fulltext/bro/kga/brokefr/4 – возможно, на ней окажутся ссылки на статьи из энциклопедии, а файл с нужной нам статьей просто переименовали... Не помогает, однако. Теперь пробуем адрес www.booksite.ru/fulltext/bro/kga/brokefr ...и получаем знакомую ошибку 404. На очереди www. booksite.ru/fulltext/bro/kga – может быть, директория с энциклопедией теперь называется иначе (например, «brok_efr») и здесь мы найдем ссылку на нее... Не выходит.

И так далее, убираем из адреса директорию за директорией и, к сожалению, все время натыкаемся на ошибку 404. Но вот, наконец, когда пишем просто адрес сервера: www.booksite.ru, мы попадаем на главную страницу Вологодской областной библиотеки. Дальше дело техники.

Следуем в раздел «Полнотекстовая библиотека», а затем в «Алфавитный список», где и обнаруживаем ссылку на главную страницу энциклопедии. Кстати, путь к этой странице очень напоминает путь, который нам выдала поисковая машина. Только адрес сервера другой. Похоже, энциклопедия (да и вся текстовая библиотека) просто переместилась на другой сервер, а дерево директорий осталось прежним. Значит, нам нет необходимости дальше прыгать по www-ссылкам, а можно просто написать новый адрес, изменив только имя сервера: 193.223.132.202/fulltext/bro/kga/brokefr/4/4184.htm, и получить вожделенную статью.

Метод усечения URL справа не всегда позволяет найти искомую страницу (может статься, что ее и вправду больше нет на этом сервере, и даже ссылок на нее не осталось), но нередко бывает очень полезен.

В условиях полной неопределенности

Иногда об объекте поиска почти ничего не известно. Допустим, вам нужно найти возраст главы компании, произведшей игру Ultima Online. Но вы больше ничего не знаете об этой компании, тем более – о ее главе. Не беда, будем двигаться шаг за шагом.

Для начала используем русскую машину (например, Rambler) и введем: «разработчик Ultima Online». Мы выясняем, что это компания Origin. Вводим «президент Origin», узнаем, что его имя Джек Хейстен и что в свое время он «объявил о разработке... проектов на основе мира Privateer...». Ни проекты, ни название мира нам ни о чем не говорят, однако мы получаем характерное слово, которое поможет при дальнейшем поиске. Больше из Rambler ничего выжать не удается, но, раз компания зарубежная, имеет смысл поискать информацию по-английски, для чего обратимся к американскому поисковику Google (www.google.com).

По русской транскрипции «Хейстен» английское написание имени определить трудно. К счастью, с именем «Джек» проще, кроме того, мы знаем название компании и кое-что об анонсе, который делал глава Origin. Вводим «Origin Jack Privateer» и узнаем, что фамилия главы Origin – Heistand, а более точное название компании – Origin Systems. Документ, полученный Rambler, датирован весной прошлого года, так что хотелось бы знать, на посту ли еще Jack Heistand? Набираем «Jack Heistand «Origin Systems»» и уже в одном из первых полученных документов находим подтверждение: да, на посту. Кроме этого, обнаруживаем адрес веб-сайта компании. Однако поиски не окончены, поскольку на сайте нужной информации не находится. Ничего, снова используем Google. Поищем биографию сего замечательного исполнительного директора Origin Systems. Поскольку биография его может быть в списке биографий других не менее замечательных людей, составим запрос так: «Jack Heistand (biogrpaphy OR biographies)» – и получаем нужную ссылку на первой странице.

Итак, подытожим:

  • Если первый запрос не достигает цели, используйте полученные документы, чтобы подобрать ключевые слова для более точного запроса.
  • Если сервер возвращает ошибку 404, попробуйте метод усечения URL справа.
  • Если не нашли русскоязычной поисковой машиной, попробуйте поискать англоязычной.

    При написании статьи с разрешения автора курса были использованы материалы курса «Эффективный поиск в Internet» (kursy.ru/int_srch) Центра дистанционного обучения KURSY.RU.

  • Сергей Белецкий, s7.da.ru
    www.iworld.ru

    Рассылки Subscribe.ru:

    Библиотека сайтостроительства - новости, статьи, обзоры
    Дискуссионный лист для web-разработчиков
    Подписка на MailList.Ru
    Автор: NunDesign
    Другие разделы
    Yandex
    Поисковые системы и каталоги
    Новое в разделе
    Yahoo
    Google
    I2R-Журналы
    I2R Business
    I2R Web Creation
    I2R Computer
    рассылки библиотеки +
    И2Р Программы
    Всё о Windows
    Программирование
    Софт
    Мир Linux
    Галерея Попова
    Каталог I2R
    Партнеры
    Amicus Studio
    NunDesign
    Горящие путевки, идеи путешествийMegaTIS.Ru

    2000-2008 г.   
    Все авторские права соблюдены.
    Rambler's Top100