Http-ответ 404 для страниц несуществующих тегов (хак)

+15
1.73K
Иллюстрация
В дефолтном варианте для страницы несуществующего тега Двойка отдаёт http-код 200 (Ок) и показывает обычную страницу сайта с надписью "Ничего не найдено". И не обратил бы я на это внимание, если бы ...

… если бы за месяц до этого на одном из моих проектов не поднялась посещалка на 20% за неделю-другую. И всё после того, как я запретил поисковикам индексацию страниц с кратким контентом (типа афоризмов и пословиц). До этого в панели вебмастера были сотни таких страниц со статусом "Недостаточно качественная", после запрета их не стало, а посетителей заметно прибавилось. Совпадение? Не думаю! Ведь ничего другого я в этот период на проекте не делал.

А ещё я увидел там же в панели вебмастера сотни страниц поиска по разным тегам, которых у меня уже нет. Все они видятся поисковиками как нормальные рабочие страницы сайта (ведь сервер отдаёт код 200), но все они "Недостаточно качественные", так как из контента в них только одна строка "Ничего не найдено". Скорее всего это, как один из многих параметров, влияет на суммарный рейтинг сайта в глазах поисковиков. И при большом количестве таких некачественных страниц сайт может ранжироваться в поиске ниже, чем мог бы без них.

И ещё один момент. По сути, это ещё и "дыра" в СЕО. Можно на левых сайтах или на сборниках ссылок (например, на сервисах закладок) наделать несколько тысяч ссылок на сайт конкурента на Двойке вида site.ru/tags/search?q=hernya000001, ...000002, ...000003 и так далее. Они будут подхвачены поисковиками и через время этот сайт будет понижен в выдаче поиска, как содержащий огромное количество бесполезных страниц.

Вот и подумал я, может лучше на страницах с отсутствующими на сайте тегами отдавать код 404 (страница не найдена), но при этом оставить ту же существующую страницу, отображаемую для пользователя, чтобы люди видели результат поиска и могли что-то делать на сайте дальше? Тогда получим, что и овцы целы — пользователи видят "человеческую страницу", и волки сыты — страницы с отсутствующими тегами автоматически исключатся поисковиками из индекса как удалённые и не будут уменьшать рейтинг сайта в выдаче.

Делается это одной правкой в файле /system/controllers/tags/actions/search.php. Строки 25-28
  1. return $this->cms_template->render('search', array(
  2. 'is_results' => false,
  3. 'tag' => $query
  4. ));
меняем на
  1. // >> WebMan: Возвращаем код 404 если тег не найден
  2. header("HTTP/1.0 404 Not Found");
  3. header("HTTP/1.1 404 Not Found");
  4. header("Status: 404 Not Found");
  5.  
  6. return $this->cms_template->render('search', array(
  7. 'is_results' => false,
  8. 'tag' => $query,
  9. 'seo_title' => '',
  10. 'seo_keys' => '',
  11. 'seo_desc' => '',
  12. 'seo_h1' => ''
  13. ));
  14. // << WebMan
Моё мнение по данному вопросу не является СЕО-истиной, так как я в этой теме профан. Но на мой взгляд, теги — это конкретные страницы сайта, имеющие множество точных ссылок со страниц публикаций сайта и содержащие тематические списки контента. Тут имеет смысл убрать несуществующие страницы из поисковиков.

А вы как думаете? Есть у кого подобный опыт или здравые мысли по этой теме?
0
Олег Васильевич я Олег Васильевич я 3 года назад #
Моё мнение по данному вопросу не является СЕО-истиной, так как я в этой теме профан
Главное правило медицины гласит: прежде всего - не навреди!
WebMan, при всём уважении, очень поспешная запись... очень.
0
Олег Васильевич я Олег Васильевич я 3 года назад #
Кстати, и Стельщиков к такой безупречной бочке можно было б и посимпатичнее найти))
0
WebMan WebMan 3 года назад #
Ну, кое-кто из них двоих мне и так симпатичен, и это не Позитив. smile
0
WebMan WebMan 3 года назад #
Чем именно можно навредить отдачей кода "404 - Не найдено на сайте" для несуществующих страниц и исключением их из индекса поисковиков? Поясните точнее Вашу мысль, Олег Васильевич я.
0
Олег Васильевич я Олег Васильевич я 3 года назад #
Боюсь, вы меня таки не поняли: я говорил лишь о поспешности записи (можно было б для начала потрусить СЕО-шников). Всего лишь...
+2
WebMan WebMan 3 года назад #
СЕО-шники, потруситесь, пожалуста! Нам интересно ваше мнение! laugh
+3
TOPg TOPg 3 года назад #
Наше мнение: уже поставил на все сайты, наконец то эта проблема решена! Молодец!
+1
WebMan WebMan 3 года назад #
Спасибо за отзыв! Если не трудно, напишите сюда через время, были ли какие-то изменения в позициях или посещалке.
+1
TOPg TOPg 3 года назад #
как раз сделаю срез, через неделю, через две и через месяц....
дополнение однозначно на пользу, потому, что раньше я кучу ссылок в ручную правил, а теперь будет по людски
0
TOPg TOPg 3 года назад #
еще бы убрать битые ссылке в ленте актиности которые, там после удаления материала, остается ссылка на него с прапрадедушкиных времен
+2
Zau4man Zau4man 3 года назад #
Уже давно все удаляется само пруф

Просто удалять надо корректно, а не очищая таблицу материалов в базе вручную.
0
TOPg TOPg 3 года назад #
естественно в базе я ничего не чищу, а удаляю через админку
0
SEOrigin SEOrigin 3 года назад #
SEO-шники целиком согласны. Но вообще я советую всегда страницы тегов с самого начала закрывать от индексации.
0
WebMan WebMan 3 года назад #
Почему? Многие темы на сайте невозможно вынести в разделы или их не получится описать только одной публикацией. А если качественно оформить тайтл и описание страницы тега по этой теме, можно получить на неё трафик.
+1
letsgo letsgo 3 года назад #
Все имеет две стороны. Бизнес сайт или целевой под конверсию посетителя - там теги могут размыть целевую страницу. Сайт информационный с разным нецелевым контентом - да пусть будут. Видео, блоги разные, тексты, то есть человек заходит почитать и ему без разницы во многом как он найдёт статью. Но даже тут тег не должен размывать ключи если под них сделаны категории например.

На днях буквально человек оскорбился продажами на уровне 4-5% от траффика в интернет магазине. У него конверсия 1%. Дело как раз таки в размытых запросах и множестве информационных триггеров при отсутствии продающих.

Простой пример: Вася ищет котёл "Горелка-2", попадает на тег и видит там кучу страниц. Он уже полчаса рыщет по интернету и ему читать не хочется - он хочет видеть страницу, которая решает его вопрос. Он уходит. А Василиса ищет "чистка кастрюли" она попадает на тег, там статьи, вполне вероятно что она не против покопаться и почитать про это статьи.

Поэтому теги закрыть или вообще не ставить для сайтов под конверсию, а в случае легкого читаемого контента - вероятно не помешают.
0
Zau4man Zau4man 3 года назад #
Жесть какая.
Когда ищешь - тыщу раз натыкаешься на подборки со страницы тегов.

Для молодого сайта - возможно, у него страницы по тегам могут содержать одну-две записи. Для большого сайта - это потерять часть поискового трафика.
0
skewes skewes 3 года назад #
Сео вообще оооооочень больная тема)))))
Я тоже за -
СЕО-шники, потруситесь, пожалуста!
smile
+1
WebMan WebMan 3 года назад #
Итак, делюсь результатами применения этого и других хаков, связанных с тегами.
Если кратко и касательно этого поста, то отдача кода 404 для удалённых тегов плюс убирание дублей страниц тегов (через "пробел" и через "плюс") уменьшило количество "недостаточно качественных" страниц и положительно повлияло на посещалку. ИМХО. smile

Еще от автора

Хуки-хухуки: Исключаем неактивных пользователей из списков
Как иногда начинают свой монолог неопытные стендаперы: «У всех в жизни было такое …
«Расширенная отладка» для InstantCMS 2.14.1 (v.14.1.2) – большое обновление для разработчиков
Новые возможности и удобства, облегчающие разработчикам отладку компонентов и шаблонов.
Использование расширенной отладки. Часть 11. Анализ ошибок 403/404 и редиректов
Одной из неудобных задач при отладке для меня является поиск причины ошибки 403/404.
Используя этот сайт, вы соглашаетесь с тем, что мы используем файлы cookie.