яндекс вебмастер, robots.txt
С яндексом проблема который день. То хостер роботу ошибку вернул, пришлось ждать пока робот опять прийдет.
Теперь новая фишка. В яндекс вебмастере напротив сайта написано "Ваш сайт не был проиндексирован из-за запрета в файле robots.txt". Когда в вебмастере заходишь внутрь сайта, то пишет:
--------------------------------------------
"23.02.2012 наш робот получил полный запрет на индексирование сайта в Вашем файле robots.txt, поэтому сайт в поиске не участвует. Пожалуйста, воспользуйтесь формой проверки. Если сейчас запрет отсутствует, то сайт начнет индексироваться в течение 2 недель, после чего сообщение обновится. Если запрет все еще присутствует, то по вопросу устранения этой проблемы Вам нужно обратиться к администратору Вашего сайта или хостеру.
Внимание! Главная страница сайта исключена из индекса: Документ запрещен в файле robots.txt ."
---------------------------------------------
Сделал проверку robots.txt в яндекс вебмастере. Пишет "Найдено несколько правил вида "User-agent: *""
При этом в аддурилку страницы успешно добавляются.
Файл robots.txt:
User-Agent: Googlebot
Allow: /
User-agent: Yandex
Allow: /
User-Agent: *
Allow: /
User-agent: *
Disallow: /admin/
Disallow: /backups/
Disallow: /backup/
Disallow: /components/
Disallow: /wysiwyg/
Disallow: /includes/
Disallow: /modules/
Disallow: /filters/
Disallow: /languages/
Disallow: /users/
Disallow: /core/
Sitemap: site.ru/sitemap.xml
Host: site.ru
Домен кириллический. В robots.txt указан в punycode, согласно рекомендаций яндекс вебмастера.
Файл robots.txt делал по сообщениям в темах форума. Что может быть не так?
User-agent: *
Disallow: /users
Disallow: /video/channel
Disallow: /go
Disallow: /registration
Disallow: /rss/
Disallow: /comments
Disallow: /index.php
Disallow: /login
Disallow: /admin
Disallow: /search
Host: www.site.ru
Пользователей можете не закрывать, это скажем на любителя ))) Видео-каналы — если используете компонент видео также лучше закрыть (если не используете, удаляете)
Это яндекс, не требуйте от него мгновенной реакции. Да и последний апдейт поисковой базы был 11 числа, то есть последние два дня в поиск еще не попали. Подождите неделю, тогда может будет результат.Робот последний раз был 11 числа. Сегодня 13.
карта сайта тут не ускорит процесса sitemap.xml не пустой?
Если проблем нет — то Яша проиндексирует сайт за неделю-две. За день-два такие вещи не происходят(касается Яндекса)
Disallow: /rss/
это закрыл, чтобы не воровали или для чего ?
и какая разница между
Disallow: /rss/
и
Disallow: /rss
User-agent: *
Disallow: /users
Disallow: /video/channel
Disallow: /go
Disallow: /registration
Disallow: /rss/
Disallow: /comments
Disallow: /index.php
Disallow: /login
Disallow: /admin
Disallow: /search
Host: www.site.ru
Во первых не стоит забывать о правилах файла, по этому стоит серьезно отнестись к этому. Один из важнейших файлов, можно такого наколбасить… Это не упрек, всего знать нельзя.
Disallow: /search # так не будет работать
Disallow: /*search # так будет
Disallow: /index.php # закроет все что с него начинается и не исполнит задачу убрать дубль
Disallow: /index.php$ # так сработает как и задумано.
Далее по списку:
Disallow: /*comments
Disallow: /*login
Disallow: /*admin
Disallow: /*registration
lezginka.ru
Disallow: /rss/# по факту окажется в выдаче выше основных страниц, по этому закрывается, кому надо найдет и тд и тп.
Ну и до кучи
Disallow: /backups/
Disallow: /backup/
Disallow: /board/
Disallow: /components/
Disallow: /wysiwyg/
Disallow: /includes/
Disallow: /modules/
Disallow: /filters/
Disallow: /languages/
Disallow: /users/
Disallow: /core/
Disallow: /login/
Disallow: /admin/
Disallow: /registration/
Disallow: /tag/
Disallow: /search/
Не помню что еще, давно не смотрел.
Получилось
User-agent: *
Disallow: /backups/
Disallow: /backup/
Disallow: /board/
Disallow: /components/
Disallow: /wysiwyg/
Disallow: /includes/
Disallow: /modules/
Disallow: /filters/
Disallow: /languages/
Disallow: /users/
Disallow: /core/
Disallow: /login/
Disallow: /admin/
Disallow: /registration/
Disallow: /tag/
Disallow: /search/
Disallow: /rss/
Disallow: /*search
Disallow: /*comments
Disallow: /*login
Disallow: /*admin
Disallow: /*registration
Disallow: /index.php$
Sitemap: домен/sitemaps.xml
Host: главное зеркало
В принципе можно написать куда изощренние правила с кучей параметров. Использовав все доступные правила.
скорее всего опечатка у меня только Disallow: /backups/Disallow: /backups/
Disallow: /backup/
Боятся что хакеры узнают что у вас есть директория с архивами и чем то еще бессмысленно. Структуру сайтов и тд знают все. А вот ботам там нечего делать. Для "осторожных" можно запаролить директории. Ну и конечно не показывать файлы в папке при прямом доступе.
Disallow: /backup/
Disallow: /components/
Disallow: /wysiwyg/
Disallow: /includes/
Disallow: /modules/
Disallow: /filters/
Disallow: /languages/
Disallow: /core/
Disallow: /admin
все ровно ето никто не видит!!! Хм… Или я туплю или Вы…
Disallow: /backup/
Disallow: /components/
Disallow: /wysiwyg/
Disallow: /includes/
Disallow: /modules/
Disallow: /filters/
Disallow: /languages/
Disallow: /core/
Disallow: /admin
все ровно ето никто не видит!!! Хм… Или я туплю или Вы…