Поиск по URL в Яндексе

Вопрос: есть ли возможность поиска по URL в Яндексе? Есть ли аналог операторам inurl: или allinurl: (сволочи, разворовали!) в Google? Ответ: да, есть! Способов несколько, но все слегка кривые:

  1. Оператор url="" позволяет найти любые подстроки URL с начала адреса документа.
    Плюсы: ищет любую подстроку, можно использовать wildcard.
    Минусы: ищет только с начала URL.
  2. Оператор domain="" позволяет найти все документы, в названии доменов которых между точками есть запрашиваемые подстроки (раньше его было видно в переколдовке поиска по сайту; теперь — только в хелпе).
    Плюсы: ищет подстроки, можно использовать wildcard; ищет с любом куске имени (под)домена.
    Минусы: ищет только с начала (под)доменных имен, не «ест» точку.
    Замечательно то, что несколько имен можно сочетать и указывать их точный порядок.
    Есть еще прекрасный мета-домен root, каковой всегда занимает последнюю «позицию» в доменном имени. Впрочем, нормальное доменное имя root не запрещено.

  3. Операторы host="" и rhost="" работают аналогично URL, но ограничиваются доменным именем. Оператор rhost еще и переставляет порядок следования имен (под)доменов, что очень удобно, например, для поиска по фрихостам.
    Плюсы: ищут подстроки, можно использовать wildcard; можно менять порядок доменных имен.
    Минусы: ищет только с начала/конца домена.

Но это все «баяны». А вот не слишком баян. То есть оно прокатилось уже по блогам (у Сони, у Анара):

  1. Транслит или перевод — кривой способ, но все же (см. сообщение Сергея Людкевича (wolf)).

Итак, примеры транслита см. по ссылкам выше, а вот пример перевода. За пример спасибо Алексею Полякову (оффтоп: у меня есть приглашения на ЯБету!).
Покрутим да повертим эту штуку (ссылки вставлять сил уже нет):

  1. (–) линк << url="ivanov.in/seo/seomachines-linkmaster-1"
    (–) мастер << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) линкмастер << url="ivanov.in/seo/seomachines-linkmaster-1"
    (–) машины << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) сеомачинес << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) хипп << url="ivanov.in/mm/hipp2.html"
    (–) хип << url="ivanov.in/mm/hipp2.html"
    (–) хипп2 << url="ivanov.in/mm/hipp2.html"

    Вывод: слова в URL должны быть разделены чем-нибудь; всякое «левое» может не работать.
  2. (–) "сеомачинес" << url="ivanov.in/seo/seomachines-linkmaster-1"
    (–) !сеомачинес << url="ivanov.in/seo/seomachines-linkmaster-1"

    Вывод: кавычки и восклицательный знак не работают.
  3. (+) сеомачинес линкмастер << url="ivanov.in/seo/seomachines-linkmaster-1"
    (–) сеомачинес ~линкмастер << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) сеомачинес ~seomachines << url="ivanov.in/seo/seomachines-linkmaster-1"
    (–) сеомачинес ~~seomachines << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) сеомачинес &/(1 1) линкмастер << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) сеомачинес && линкмастер << url="ivanov.in/seo/seomachines-linkmaster-1"

    Вывод: расстояния, границы предложений и отрицания прекрасно работают.
  4. (+) сеомачинес && анализатор << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) сеомачинес &&/(1 1) анализатор << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) сеомачинес &&/(14 14) буквально << url="ivanov.in/seo/seomachines-linkmaster-1"
    (+) сеомачинес &&/(15 15) буквально << url="ivanov.in/seo/seomachines-linkmaster-1"

    Вывод: расстояние до title — одно предложение, расстояние до контента определено (другие расстояния проверьте сами). Разное расстояние дает разные «сохраненки». Почему это так — фиг знает. При случае попробую разведать. 8/

Морфология работает. Правила транслитерации еще можно поковырять, однако не вижу в этом большого смысла.

Практические выводы:

  1. Эта фишка может дать какую-нибудь мелкую копеечку к релевантности. Но очень маленькую копеечку. Например, единственный осмысленный запрос (сейчас #38), который я смог найти на моем сайте.
  2. В экспериментах надо быть осторожным с названиями экспериментальных URLов. Подозреваю, что в некоторых проведенных мной ранее экспериментах «урловая» релевантность могла хорошенько нашуметь. Кто понял, о чем я — тсс. Перепроверим. 8)
  3. Можно, наконец, действительно искать по URLу для разных, порой, весьма «серых» целей: ру & линкс ~~ $title(линкс) в рубрике: Строительство. Ага?

PS/оффтоп: Антон Рожков Костю «Hollywood» Горшкова пиарит. А Костя — меня. Спасибо, коллеги. 8)

Комментарии: 21 шт. Добавить »

[+] sonika :

Большой тенкс за 3-й практический вывод! Одним кликом нашла около 800 каталогов ссылок из нужной мне тематики :)

И что, нормальные каталоги? Как-то я в последнее время очень скептически настроен насчет каталогов. 8/

[+] sonika :

ковыряю 3-ю страницу, одна ерунда, рано обрадовалась-то :)

[+] yury :

мне этот способ с транслитом очень помог, спасибо! осталось только собрать выдачу яндекса и отфильтровать нужное

Рад за вас. А собрать-то — это совсем легко. Я.XML вам в помощь — это если по-честному; да и натуральный SERP можно захавать. 8)

[+] yury :

то что можно, я не сомневаюсь :) проблема в том, что я не знаю как. на форумах не нашел пока что. нужно SERP яндекса по моему запросу вытащить в файлик текстовый. вот. буду рад наводкам на реализацию.

Вот, что было под рукой (неприличный метод, так как парсим натуральный SERP):
http://ivanov.in/upbar/derg.php.txt
В нижнее текстовое поле input втыкаете уже сформированый URL выдачи (рекомендую с &numdoc=50) и жмете [Submit]. В верхнюю textarea собираются URLы.
Но есть риск схлопотать капчу.

[+] yury :

что-то выбрасывает:
Method Not Allowed
The requested method POST is not allowed for the URL /upbar/derg.php.txt

Надо переименовать файл, чтобы расширение стало .php. То есть .txt отрезать. Я думал, это и так понятно. 8)

[+] yury :

да уж…что-то я туплю. запустил с локала, не пошло. зато работает с хоста. собралось 50 записей с &numdoc=50. а чтобы все собрать (порядка 6000), нужно каждый раз новый урл вставлять? как бы это собрать побольше из выдачи, чтобы на санкции не попасть?

Нет, надо собрать первые 50, подождать несколько секунд, страничка перегрузится сама (по крайней мере, под FF и Оперой работает, под IE не пробовал) и соберет еще 50. Потом еще несколько секунд, и соберутся еще 50. И так пока SERP не кончится.

[+] yury :

странно, но ни в одном браузере страница не обновляется. может быть проблема в хосте или еще где-нить с моей стороны? в конце запроса стоит &numdoc=50 как вы и советовали.

После сбора URLов документов из SERPа в поле ввода адерса должен находиться URL следующей страницы SERPа.
Если нет — надо разбираться, почему у вас не выковыривается URL следующей страницы. Может быть, с кодировкой что-то не то.
Если есть — то жмите на [Submit] руками, будет собираться дальше.

[+] DrJeans :

Прикольно, что на этой странице ажно ЧЕТЫРЕ объявления Директа по грузоперевозкам! Биды-то не кислые, на эти самые международные грузоперевозки, кАпать должно не плохо, если конечно контентом поддержать… :)

Да нифига. То есть после твоего коммента могут и появиться, но сейчас это, похоже, «спонтанный» поведенческий таргетинг сработал. Такое впечатление, что так часто происходит при первом заходе на сайт. 8/

[+] DrJeans :

О! Теперь домены и хостинг пошли! :)

Вот эти у меня постоянно. Раньше было еще и аццкое ООО, но я его пришиб.

[…] не увидел, так что сошлюсь на пост Дениса Иванова “Поиск по URL в Яндексе“, а вот картинку из Гугла […]

[…] Поиск по URL в Яндексе. Кто ищет, тот всегда найдет […]

[+] Бастер :

Ух ты! Вуду целое.

[×]
Показать/Скрыть xHTML-теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>


Рейтинг блогов
8)