Русское сообщество fluxbb

Быстрый лёгкий надёжный форумный движок

Вы не вошли.

Объявление

Вы можете внести свой вклад в содержание сайта. Жертвователи попадут в почетную группу "Спонсоры". Поддержать сайт.

#1 2010-06-23 23:56:55

scalemaster
Участник
Зарегистрирован: 2009-08-10
Сообщений: 134

robots.txt

Скажите что-нибудь по теме, в архиве бред какой-то, один нелепей другого...

Offline

#2 2010-06-24 05:23:27

artoodetoo
Admin by chance
Зарегистрирован: 2008-09-09
Сообщений: 887
Сайт

Re: robots.txt

http://robotstxt.org.ru/robotsexclusion/guide

что именно интересует-то, какие файлы закрывать? это на усмотрение вебмастера smile


There are two hard things in computer science: cache invalidation, naming things, and off-by-one errors.

Offline

#3 2010-06-24 17:48:26

scalemaster
Участник
Зарегистрирован: 2009-08-10
Сообщений: 134

Re: robots.txt

Ну, собственно, принцип мне известен. Для движка уже должен быть выработан какой-то стандартный robots, не пускающий поисковики на страницы с левыми данными и не допускающий дублирование контента...

Offline

#4 2010-07-02 13:39:37

Visman
Administrator
Из Сибирь
Зарегистрирован: 2009-06-08
Сообщений: 2,236
Сайт

Re: robots.txt

scalemaster пишет:

Ну, собственно, принцип мне известен. Для движка уже должен быть выработан какой-то стандартный robots, не пускающий поисковики на страницы с левыми данными и не допускающий дублирование контента...

Ставь это

User-agent: *
Disallow: /a
Disallow: /d
Disallow: /c
Disallow: /e
Disallow: /j
Disallow: /l
Disallow: /m
Disallow: /p
Disallow: /r
Disallow: /s
Disallow: /u

Offline

#5 2010-07-04 16:27:19

scalemaster
Участник
Зарегистрирован: 2009-08-10
Сообщений: 134

Re: robots.txt

Visman,
Оно, конечно, спасибо за совет. Только почему-то сколько людей, столько и мнений. Единой системы нету. Как я уже писал в первом сообщении, поиском можно найти пару тем, вот там так же, сколько человек отписалось, столько и вариантов.

Offline

#6 2010-07-12 13:23:41

hcs
Administrator
Зарегистрирован: 2008-09-05
Сообщений: 85

Re: robots.txt

Потому что это на усмотрение веб-мастера.

Offline

#7 2010-11-28 08:26:00

Visman
Administrator
Из Сибирь
Зарегистрирован: 2009-06-08
Сообщений: 2,236
Сайт

Re: robots.txt

Так, всем рекомендую в обязательном порядке в robots.txt включить строку
Disallow: /*pid=
Нагрузка от поисковиков сразу же значительно падает, так как после этого одну страницу форума они будут пробегать по возможности один раз, а не 25.
Сейчас я использую такой robots.txt:

User-agent: *
Disallow: /a
Disallow: /d
Disallow: /c
Disallow: /e
Disallow: /j
Disallow: /l
Disallow: /m
Disallow: /p
Disallow: /r
Disallow: /s
Disallow: /u
Disallow: /*pid=

Offline

#8 2010-11-28 13:30:36

hcs
Administrator
Зарегистрирован: 2008-09-05
Сообщений: 85

Re: robots.txt

Что значит /a и тд (кроме /*pid=) ?

Offline

#9 2010-11-28 13:49:57

Visman
Administrator
Из Сибирь
Зарегистрирован: 2009-06-08
Сообщений: 2,236
Сайт

Re: robots.txt

hcs пишет:

Что значит /a и тд (кроме /*pid=) ?

Первые буквы файлов и папок запрещенных к индексированию.

Offline

#10 2010-11-28 19:09:04

artoodetoo
Admin by chance
Зарегистрирован: 2008-09-09
Сообщений: 887
Сайт

Re: robots.txt

роботу всё-равно, а вот самому было бы удобнее более полные имена видеть, imho


There are two hard things in computer science: cache invalidation, naming things, and off-by-one errors.

Offline

#11 2012-07-08 23:50:16

Terra
Участник
Зарегистрирован: 2012-07-07
Сообщений: 7

Re: robots.txt

Извините если вопрос глупый, но у меня проблема. На форуме стоит таблица от уважаемого @Visman, но поисковик индексирует только названия тем, при этом игнорирует содержание. Т.е. текст "внутри" темы не индексируется. И собственно вопрос: так и должно быть или просто я криворукий и что-то не так сделал?

Offline

#12 2012-07-09 06:28:10

Visman
Administrator
Из Сибирь
Зарегистрирован: 2009-06-08
Сообщений: 2,236
Сайт

Re: robots.txt

@Terra, нет, содержимое должно индексироваться.
Форум стоит на своем домене или в папке сайта?
Используется ли ЧПУ или стандартный урд вида ...viewtopic.php?id=3243?
Нет ли случайно на страницах тем метатэга <meta name="ROBOTS" content="NOINDEX, FOLLOW" />?

Offline

#13 2012-07-09 20:11:52

Terra
Участник
Зарегистрирован: 2012-07-07
Сообщений: 7

Re: robots.txt

@Visman, Форум стоит на своем домене. УРЛ стандартный. На страницах тем нет этого тега. Возможно я начал рано паниковать, форум индексируется пока только яндексом, и начал индексироваться дней пять назад. Может, нужно время, чтобы робот начал индексировать "нутро" форума. В любом случае, спасибо, что помогли развеять сомнения по поводу robots.txt.

Offline

#14 2012-07-14 22:19:07

Terra
Участник
Зарегистрирован: 2012-07-07
Сообщений: 7

Re: robots.txt

Выяснил в чем дело, мало-ли кому пригодится: переносил на свой новый форум свои темы с другого форума, и попал под яндексовский АГС. Т.е. фильтр увидел, что весь контент не оригинальный (хотя автор всех тем-я, но роботу конечно все равно) и отправил мой форум в бан. Вобщем сам виноват.

Редактировался Terra (2012-07-14 22:20:30)

Offline

Подвал доски

Под управлением FluxBB. Хостинг Hostens