В личку отправлю вам свой. Хотя не уверен, что он идеальный. Но пока вижу, что индексируется именно то, что мне надо. Проблем с дублями страниц не заметил.
Robots, конечно же, нужно писать именно под СВОЙ сайт.
User-agent: *
Disallow: /admin
Disallow: /auth
Disallow: /cache
Disallow: /comments
Disallow: /system
Disallow: /templates
Disallow: /upload
Disallow: /wysiwyg
Host: ваш_сайт.ru
Sitemap: ваш_сайт.ru/sitemap.xml
Не подскажете как запретить к индексации ссылки редиректы? а то гугл их индексирует( Проблема в том, что в каждой новости я ставлю ссылку на источник. Мой сайт che174.ru. В гугле есть проиндексированые страницы, выводится заголовок новости но когда перехожу с гугла, нажимаю на какую нибудь новость то попадаю не на свой сайт а на те, что указаны как источник((
И еще не подскажете как исправить вот это?((
как запретить к индексации ссылки редиректы? а то гугл их индексирует( Проблема в том, что в каждой новости я ставлю ссылку на источник. Мой сайт che174.ru. В гугле есть проиндексированые страницы, выводится заголовок новости но когда перехожу с гугла, нажимаю на какую нибудь новость то попадаю не на свой сайт а на те, что указаны как источник((
Я не помню, как выглядит редирект в "двойке"…
Думаю click не будет против. Вот предложенный вариант.
User-agent: *
Disallow: /admin
Disallow: /auth
Disallow: /cache
Disallow: /comments
Disallow: /system
Disallow: /templates
Disallow: /upload
Disallow: /wysiwyg
Host: ваш_сайт.ru
Sitemap: ваш_сайт.ru/sitemap.xml
Не подскажете как запретить к индексации ссылки редиректы? а то гугл их индексирует( Проблема в том, что в каждой новости я ставлю ссылку на источник. Мой сайт che174.ru. В гугле есть проиндексированые страницы, выводится заголовок новости но когда перехожу с гугла, нажимаю на какую нибудь новость то попадаю не на свой сайт а на те, что указаны как источник((
По аналогу с первой веткой:
Disallow: /go/
По предложенному роботсу: такой набор не запрещает к индексации дубли, но отлично подсказывает всем вокруг, где у вас лежат все системные файлы. Резюме: чем скорее вы удалите ТАКОЙ роботс с сервера, тем будет лучше.
Я не помню, как выглядит редирект в "двойке"…
По аналогу с первой веткой:
Disallow: /go/
возможно так:
Disallow: */redirect?url=http:/
та нееее, я вообще мало что понимаю в вебмастеринге, это обычная логика, в роботсе можно что то запретить индексировать, что конкретно лично вам нужно защитить от индексации? Это и ставьте в Disallow. Если ничего — тогда и не надо ничего там вообще писать, и роботс этот вообще не нужен. ПС сканируют все до чего доберутся, до системных папок они никак не доберутся, потому что на них нет ссылок во первых, во вторых они закрыты.Вот, уже видно сразу человек разбирается) Не поможете нам robots составить?)
Не знаю, а вообще где-то читал что ПС плевать хотели на редиректы, гугль по крайней мере. И кстати, в двойке разве где то редирект можно включить? Или вы хак используете?И еще не подскажете как исправить вот это?((
Вы вообще о чем тут разговариваете? )Я не помню, как выглядит редирект в "двойке"…
По аналогу с первой веткой:
Disallow: /go/
А что, не совсем понятно?)
Вы вообще о чем тут разговариваете? )Я не помню, как выглядит редирект в "двойке"…
По аналогу с первой веткой:
Disallow: /go/
не совсем понятно где вы нашли редирект в двойкеА что, не совсем понятно?)
При создании новости я в панели админа создал поле источник в виде ссылки, там есть галочка прямая ссылка или через редирект)не совсем понятно где вы нашли редирект в двойке