Дубли страниц

#2 29 ноября 2011 в 21:25
закрыть в robots.txt

disallow /forum/thread*-1.html
#3 29 ноября 2011 в 23:13
а потом немного подумать, понять что это первая страница в этой теме(через тире идет номер текущей страницы темы). залезть в в robots.txt и убрать disallow /forum/thread*-1.html, затем сплюнуть через левое плечо три раза и пообещать себе не слушать всяких вредных советов :)
#4 30 ноября 2011 в 09:40
picaboo спасибо, но все таки как побороть дубли?
#5 30 ноября 2011 в 12:22


а потом немного подумать, понять что это первая страница в этой теме(через тире идет номер текущей страницы темы). залезть в в robots.txt и убрать disallow /forum/thread*-1.html, затем сплюнуть через левое плечо три раза и пообещать себе не слушать всяких вредных советов :)

picaboo
А теперь вопрос
instantcms.ru/forum/thread8881-1.html
instantcms.ru/forum/thread8881.html

В чем разница между 2мя 1ыми страницами кроме того что одна из них дубль? зачем поисковику 2 первых страницы. Надеюсь на адекватный ответ.
#6 30 ноября 2011 в 12:24


picaboo спасибо, но все таки как побороть дубли?

lemtren

я дал вам корректный ответ как закрыть дубль. Поисковик закачивает обе страницы. 1 из них ему не нужна. он уже закачал первую старницу расположенную по адресу threadXXXX.html, еще 1 первая страница ему не нужна задаром.
#7 30 ноября 2011 в 17:25
это баг о котором надо написать разработчику, так как его формирует модуль последних сообщений на форуме дописывая тире и номер страницы. либо самому в этом модуле исправить. просто в темах ссылка на топик формируется правильной, а там нет.

NickSolver, корректность не показатель ума, это даже не черта характера :). совет с 301 редиректом был бы правильным, а так снова мимо :)
#8 30 ноября 2011 в 17:31
можно и 301 редирект — но только если б человек знал как написать правила он бы сюда не писал. я не знаю как сделать такое правило… написал разумный вариант.Вы же вместо того чтоб написать более мудрое решение проблемы написали что это тупой совет
#9 30 ноября 2011 в 20:24
Подобная проблема есть во многих компонентах: блоги, клубы, доска объявлений, каталог, faq, фото…
#10 30 ноября 2011 в 21:11
Max, тоже лента неправильно ссылки дает?
#11 30 ноября 2011 в 21:15
ленту не смотрел…
вижу, что почти везде, где есть пагинация и страниц в нем больше 1
есть дубли с ссылками страница и страница-1
#12 30 ноября 2011 в 21:22
От форума я отказался в пользу IPB, на в серпе пока что моих дублей нет я за этим активно слежу. А вообще могу посоветовать примерно вот такой robots.txt

  1. User-Agent: *
  2. Allow: /catalog/1001/find/%CE%EA%F2%FF%E1%F0%FC
  3. Allow: /catalog/1001/find/%D1%E8%ED%E5%EC%E0+%D1%F2%E0%F0
  4. Allow: /catalog/1001/find/Albany
  5. Allow: /catalog/1007/find/%D2%DE%C7
  6. Allow: /catalog/1006/find/%D2%E0%E1%F3
  7. Allow: /catalog/1006/find/%D7%E8%EB%EB%E8-%C1%E0%F0
  8. Allow: /catalog/1005/find/%CF%F0%E5%EC%FC%E5%F0
  9. Disallow: */search.html
  10. Disallow: /index.php
  11. Disallow: *?*
  12. Disallow: /actions
  13. Disallow: /users/
  14. Disallow: /isearch
  15. Disallow: /ysearch
  16. Disallow: /admin
  17. Disallow: /backups
  18. Disallow: /core
  19. Disallow: /components
  20. Disallow: /wysiwyg
  21. Disallow: /search
  22. Disallow: /includes
  23. Disallow: */tag
  24. Disallow: */find
  25. Disallow: /maps/compare/*
  26. Disallow: /rss/*
  27. Disallow: /modules
  28. Disallow: /filters
  29. Disallow: /languages
  30. Disallow: /logout*
  31. Disallow: /passremind.html
  32. Disallow: /registration
  33. Disallow: /login
  34. Disallow: /catalog$
  35. Disallow: /photos/latest.html
  36. Disallow: /ie6.html
  37. Disallow: /photos/100$
  38. Disallow: /users$
  39. Disallow: */messages.html
  40. Disallow: */messages-sent.html
  41. Disallow: /video/channel/*
  42. Disallow: */messages-new.html
  43. Disallow: */newpost.html
  44. Disallow: */newcat.html
  45. Disallow: */editblog.html
  46. Disallow: */blogs/*/cat-*
  47. Disallow: */addphoto.html
  48. Disallow: */add.html
  49. Disallow: */bookmarks/*
  50. Disallow: */avatar.html
  51. Disallow: */editprofile.html
  52. Disallow: */karma.html
  53. Disallow: /users/city/*
  54. Disallow: /users/*/comments.html
  55. Disallow: /users/*/forumposts.html
  56. Disallow: /users/hobby/*
  57. Disallow: /users/*/board.html
  58. Disallow: /clubs/*/config.html
  59. Disallow: /clubs/*/join_member.html
  60. Disallow: */newthread.html
  61. Disallow: */pinthread*.html
  62. Disallow: */forum/reply*.html
  63. Disallow: */forum/thread*-quote*.html
  64. Disallow: */forum/subscribe*.html
  65. Disallow: */subscribe/
  66. Disallow: /go
  67. Disallow: /cgi-bin
  68. Disallow: /cache
  69. Disallow: /templates
  70. Disallow: /druzja
  71. Disallow: /my.html
  72. Host: citytula.ru
Размеется адаптируем его под свои страницы.
#13 30 ноября 2011 в 21:52
shockтаки да дубли. А кажется писали, что и robots не нужен. Так как же?
Хочется все-таки узнать.

А скажем
Disallow: /templates (и по остальым папкам)
а разве есть такие страницы?

Или Disallow: */karma.html
ее разве робот может видеть (это для зарегистрированных только кажется)?

Спасибо за ответы!
#14 30 ноября 2011 в 21:58


Disallow: */messages-new.html
Disallow: */newpost.html
Disallow: */newcat.html
Disallow: */editblog.html
Disallow: /admin
Disallow: /backups
Disallow: /core
Disallow: /components
Disallow: /wysiwyg

NickSolver
дальше читать не стал. Ваш профессионализм вызывает сомнения…
#15 30 ноября 2011 в 22:12
Lana, не надо роботу запрещать то, чего он и так никогда не узнает😊например то что отдается зарегистрированному пользователю и то что видит гость. бот же не может зарегаться на сайте и увидеть то чего не видят гости? то же самое с запретом системных папок, зачем запрещать то, чего бот никогда не увидит, кроме случаев когда он получит доступ к вашему фтп :)

NickSolver,

Disallow: /cashe


я Вас лублу :))
Вы не можете отвечать в этой теме.
Войдите или зарегистрируйтесь, чтобы писать на форуме.
Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.