23
июня

Отрезаем лишнее

Отрезаем лишнее в DrupalDrupal – мощная и гибкая система управления контентом и разработки приложений. Огромное число плюсов у этой CMS, относительная простота в освоении и дружественное сообщество пользователей и разработчиков (например, наше) позволяют привлекать всё больше и больше единомышленников в наши ряды. А чем больше будет друпалеров, тем лучше будет всем им, ведь коллективный разум способен решать более сложные задачи, быстрее находить ошибки и исправлять их.

Но, как и всё в нашем мире, Drupal имеет свои недостатки. Один из них – это одинаковые страницы, которые не несут смысловой нагрузки. Например, страницы с формой отправки комментария или регистрации пользователей. О том, как избавиться от таких лишних страниц пойдёт речь в этой заметке.

Легендарный персонаж, от имени которого по слухам пишет целый отдел Яндекса, Платон Щукин, не раз вещал нам о пагубном влиянии дублированных страниц на поисковую выдачу (один из ответов на вопросы):

На Вашем сайте много дубликатов и полудубликатов. Таких страниц у Вас на сайте много. Поэтому есть только одна рекомендация: индексировать в поисковой машине оригинальные страницы, которые несут пользователям максимум информации.

О том, как скрыть от поисковиков такие страницы недавно рассказал Андрей в своей статье о продвижении сайта:

Проблема с дубликатами страниц возникает, если на вашем сайте на Drupal анонимным юзерам запрещено оставлять комментарии, а сама форма отправки комментариев показывается на отдельной странице. В этом случае под каждым анонсом статьи появляется такой текст:

» Войдите или зарегистрируйтесь, чтобы получить возможность отправлять комментарии.

Здесь слова "войдите" и "зарегистрируйтесь" являются гиперссылками, которые ведут на страницы-пустышки (дубликаты). Основное содержание этих страниц - форма для входа на сайт и форма для регистрации соответственно.

Для решения этой проблемы Андрей советует внести в файл robots.txt следующие директивы:

Disallow: /user/register?
Disallow: /user/login?

Не лишним будет скрыть и RSS-фиды категорий:

Disallow: /taxonomy/term*/feed

Добавить и проверить правильность файла robots.txt можно из панели вебмастера гугла и Яндекса.

Андрей уже давно и очень успешно применяет этот метод на своём астрофизическом портале, а я ещё только буду пытаться улучшить файл robots.txt на своих сайтах: студенты БГУ и форекс дневник.

На картинке: ножницы с лазерным прицелом - лучший инструмент для вебмастера

Комментарии

Аватар пользователя Sam

Disallow: /user/register?
Disallow: /user/login?

Уже есть в robots.txt Drupal5.

Аватар пользователя Андрей

Есть, но не в такой форме. А разница всего в один символ существенна. Смотрите здесь полную версию рассказа и сами убедитесь.