1. actions/page-(*)
2. threadN-(*).html
3. video/razdel/page-(*)
4. users/ users/latest(*).html
5. music/page-(*)
6. board/N/-(*)
7. blogs/latest(*).html
список буду постоянно пополнять
#1
20 июля 2012 в 13:49
#2
20 июля 2012 в 14:40
Поясните, это что такое, для непосвященных?
Тут части URL, которые дублируют контент сайта, где звездочка — туда цифра 1 подставляется, вот пример:Поясните, это что такое, для непосвященных?
http://cnsk.ru/users
http://cnsk.ru/users/latest.html
http://cnsk.ru/users/latest1.html
Сегодня в 15:42
#4
20 июля 2012 в 16:49
а чем мешают дубли?
#5
20 июля 2012 в 19:24
Дублированный контен вредит индексации основной продвигаемой страницы, поисковики могут релевантность понижать из-за дублей
Весь поиск по тегам-это дубли!
Но! Наблюдая за динамикой на последних 2х проэктах.Период рождения 2-6 мес.Сперва было до 25-30% страниц попавщих в индексацию вместо основных.Но каждую неделю они таяли.И на сегодня при полной индексации всех страниц, теговые и поисковые составляют 1%.И напрашиваеться вывод: поведенческий фактор для яши является приорететным.Страницы запросов по поиску ( запрошенные пользователем на сайте) появляются в индексе в первую очередь.Через время они замещаются ОСНОВНЫМИ страницами.Так что сдесь надо взвешивать все за и против.
Но! Наблюдая за динамикой на последних 2х проэктах.Период рождения 2-6 мес.Сперва было до 25-30% страниц попавщих в индексацию вместо основных.Но каждую неделю они таяли.И на сегодня при полной индексации всех страниц, теговые и поисковые составляют 1%.И напрашиваеться вывод: поведенческий фактор для яши является приорететным.Страницы запросов по поиску ( запрошенные пользователем на сайте) появляются в индексе в первую очередь.Через время они замещаются ОСНОВНЫМИ страницами.Так что сдесь надо взвешивать все за и против.
#7
20 июля 2012 в 21:29
вот что выдает я.поиск для сайта?
/kursy-ispanskogo-jazyka-v-dagestane.html?utm_medium=twitter&utm_source=twitterfeed
это точно лишнее
тут /kursy-ispanskogo-jazyka-v-dagestane.html
/kursy-ispanskogo-jazyka-v-dagestane.html?utm_medium=twitter&utm_source=twitterfeed
это точно лишнее
т.к. документ расположен?utm_medium=twitter&utm_source=twitterfeed
тут /kursy-ispanskogo-jazyka-v-dagestane.html
#8
25 июля 2012 в 13:47
так это в робот тхт нужно засунуть??
очень важная тема, хотел создать такую...
Кинь плиз все содержимое робота… чтоб мы не начудили…
очень важная тема, хотел создать такую...
Кинь плиз все содержимое робота… чтоб мы не начудили…
пример роботса (можно взят как за основу и допилить)
User-Agent: Googlebot
Allow: /
Sitemap: dagstudent.ru/google_sitemap.xml
User-agent: Yandex
Allow: /
Sitemap: dagstudent.ru/yandex_sitemap.xml
User-Agent: *
Allow: /
Disallow: /search/tag/
Disallow: /go/
автор — instantcms.ru/catalog/item149.html
а вот пример роботса для вордпрес:
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
Disallow: /tag
Allow: /wp-content/uploads
User-agent: Yandex
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
Disallow: /tag
Allow: /wp-content/uploads
видим как закрывается то, что не должно индексироваться
User-Agent: Googlebot
Allow: /
Sitemap: dagstudent.ru/google_sitemap.xml
User-agent: Yandex
Allow: /
Sitemap: dagstudent.ru/yandex_sitemap.xml
User-Agent: *
Allow: /
Disallow: /search/tag/
Disallow: /go/
автор — instantcms.ru/catalog/item149.html
а вот пример роботса для вордпрес:
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
Disallow: /tag
Allow: /wp-content/uploads
User-agent: Yandex
Disallow: /cgi-bin
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /trackback
Disallow: */trackback
Disallow: */*/trackback
Disallow: */*/feed/*/
Disallow: */feed
Disallow: /*?*
Disallow: /tag
Allow: /wp-content/uploads
видим как закрывается то, что не должно индексироваться
#10
4 августа 2012 в 19:46
После Allow: / далее все Disallow: / считаются недействительными.Проверьте в яндексе свой роботс.
#11
7 августа 2012 в 21:57
После Allow: / далее все Disallow: / считаются недействительными.Проверьте в яндексе свой роботс.
Строчка User-agent: Yandex запускает новый отсчёт правил. Поэтому в данном случае это нельзя считать "Disallow после Allow".
#12
8 августа 2012 в 01:41
Проверьте в яндексе свой роботс.
#13
8 августа 2012 в 10:06
2. threadN-(*).html
Я не понял, почему это дубль?
То есть, например, первая и вторая страницы любой темы на форуме — это дубли?
С остальными из вашего списка такой же вопрос
#14
8 августа 2012 в 10:13
instantcms.ru/forum/thread11558-1.html
и
instantcms.ru/forum/thread11558.html
— дубли, и так везде(во всех компонентах)…
и
instantcms.ru/forum/thread11558.html
— дубли, и так везде(во всех компонентах)…
lokanaft,
habrahabr.ru/
и
habrahabr.ru/page1/
PS: стоило писать тогда наверно threadN-1.html, а не threadN-(*).html
habrahabr.ru/
и
habrahabr.ru/page1/
PS: стоило писать тогда наверно threadN-1.html, а не threadN-(*).html