robots.txt

и что нужно в нём прописать для корректной индексации

#1 8 декабря 2012 в 15:49
По умолчанию роботса в дистрибутиве почему-то нет, а множество страниц индексировать не нужно.
Помогите выбрать урлы для запрещения индексации? /users/, что ещё?

для начала, как-то так:

  1. #
  2. # robots.txt
  3. #
  4. # This file is to prevent the crawling and indexing of certain parts
  5. # of your site by web crawlers and spiders run by sites like Yahoo!
  6. # and Google. By telling these "robots" where not to go on your site,
  7. # you save bandwidth and server resources.
  8. #
  9. # This file will be ignored unless it is at the root of your host:
  10. # Used: http://example.com/robots.txt
  11. # Ignored: http://example.com/site/robots.txt
  12. #
  13. # For more information about the robots.txt standard, see:
  14. # http://www.robotstxt.org/wc/robots.html
  15. #
  16. # For syntax checking, see:
  17. # http://www.sxw.org.uk/computing/robots/check.html
  18.  
  19. User-agent: *
  20. Crawl-delay: 10
  21. # Directories
  22. # Disallow: /includes/
  23. # Files
  24. Disallow: license.rus.txt
  25. Disallow: license.txt
  26. Disallow: readme.txt
  27. Disallow: version_log.txt
  28. # Paths
  29. Disallow: /users/
  30. Disallow: /clubs/
#2 8 декабря 2012 в 16:45
Воспользуйтесь поиском по сайту, есть темы на форуме и блог с решениям
instantcms.ru/blogs/instantdev/optimalnyi-robots-txt.html
#3 8 декабря 2012 в 19:00
st.Puh, видел этот пост, полезно написано, но я немного не о том:
вопрос в том, какие именно пути убрать из индексации как бесполезные для поисковиков. вдруг забыл чего
Вы не можете отвечать в этой теме.
Войдите или зарегистрируйтесь, чтобы писать на форуме.

Похожие темы

Вопрос по robots.txt

SEO & PR Создана 4 года назад 7 сообщений

robots.txt

SEO & PR Создана 4 года назад 7 сообщений

[ЗАКРЫТО] Не создаётся sitemap.xml

Компоненты Создана 2 года назад 1 сообщение

Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.