Быстрый лёгкий надёжный форумный движок
Вы не вошли.
Страницы 1
Всем привет!
Как отключить полностью индексацию что бы не попасть во всякие там https://archive.org/ гугл/яндекс кеши и пр. каталоги ?
Можно же как-то полностью запретить поисковым машинам/ботам индексировать сайт ?
Offline
@wst, можно. Закрой доступ к сайту гостям, тогда только залогинившиеся пользователи увидят содержимое форума.
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Но разве нельзя что-то прописать в robots.txt что бы поисковики обходили его стороной ?
Offline
@wst, нельзя. robots.txt это всего лишь твое пожелание и все, а поисковики могут его как исполнить, так и нет.
Вот, глянь хотя бы сюда https://fluxbb.qb7.ru/forum/viewtopic.php?id=3769 И это не только к мэйл.ру роботу относится.
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Хорошо, а если например захоститься с доменом 3 уровня ? Их вроде как не индексируют. Или если загнать форум под фильтры ?
Offline
@wst, все что видно неавторизированному пользователю будет проиндексировано! А может скоро поисковики будут авторизироваться на форумах/сайтах под видом людей и индексировать их так. Может уже так делают
У меня вопрос: зачем хочешь запретить индексацию?
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Как это зачем ? Боюсь вот таких вот сообщений:
"Искомый ресурс содержит информацию, распространение которой в Российской Федерации запрещено на основании Федерального закона 15.1 от 27 июля 2006 года №149-ФЗ Перейти на сайт единого реестра".
Как то так...
Offline
@wst, в таком случае только закрытие всего форума от просмотра гостей как я и сказал в первом своем посте в этой теме.
З.Ы. Не только поисковиков боятся надо, но и доброходов
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Но разве нельзя что-то прописать в robots.txt что бы поисковики обходили его стороной
в robots.txt бесполезно, но можно запретить индексацию ненужным роботам через файл .htaccess.
Просто нужно задать соответ-щую директиву и ввести список неугодных тебе поисковых ботов.
Погугли, в сети найдешь решение.
Согласен с @Visman, больше следует опасаться "доброжелателей", чем ботов.
Offline
Тогда не только по UA блокировать через .htaccess, но и через ip диапозоны (в том числе и гос.структур ).
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Спасибо!
Подскажите ещё на счёт настройки .htaccess
Не силён в этом.
Мы пишем:
SetEnvIfNoCase User-Agent $ bad_bot
SetEnvIfNoCase User-Agent "bot" bad_bot
*далее перечисляем огромный список юзер агентов*
и в конце пишем ?
<Limit GET POST HEAD>
Order Allow,Deny
Allow from all
Deny from env=bad_bot
</Limit>
На этом всё ? Или что-то надо было прописывать в самом начале ?
Offline
На этом всё ? Или что-то надо было прописывать в самом начале ?
В самом начале укажи, что ты будешь показывать поисковым ботам вместо твоего контента. По правилам надо отдавать ошибку 403 Forbidden («запрещено»)
Редактировался wwput (2015-02-19 00:30:57)
Offline
@wwput, разве при блокировке через Deny from не 403 ошибка выдается?
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
@wwput, разве при блокировке через Deny from не 403 ошибка выдается?
ну да, просто я имел в виду вот так
<Files 403.shtml>
order allow,deny
allow from all
</Files>
# Далее список юзерагентов которым мы запрещаем доступ
SetEnvIfNoCase User-Agent Ahrefs bad_bot
SetEnvIfNoCase User-Agent WebAlta bad_bot
SetEnvIfNoCase User-Agent "Yahoo! Slurp" bad_bot
#...
Order Allow,Deny
Allow from all
Deny from env=bad_bot
Редактировался wwput (2015-02-19 16:50:51)
Offline
Так стоп! Какой из этих кодов правильный, как проверить работоспособность ?
Offline
@wst,
SetEnvIfNoCase User-Agent "bot" bad_bot
SetEnvIfNoCase User-Agent "spider" bad_bot
SetEnvIfNoCase User-Agent "crawler" bad_bot
SetEnvIfNoCase User-Agent "и т.д. и т.п." bad_bot
<Limit GET POST HEAD>
Order Allow,Deny
Allow from all
Deny from env=bad_bot
</Limit>
а чтоб проверить в настройках своего браузера в юзер агент добавь слово bot
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Сделал всё как и написано, свободно захожу на сайт:
Активны: [Bot] Googlebot
Используемый User-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Будут какие-то предложения, что не верно делаю ? Мб что-то с использованием файла .htaccess на самом хостинге ?
----------------------------------------------------------------------------------------------------------------------------------------
Всё, разобрался! Файл .htaccess должен лежать в корневом каталоге, у меня же он почему-то лежал по умолчанию в папке cache
Теперь всё работает, всем спасибо! Пока что добавил в блок 299 ботов, могу выложить список кому интересно, буду дополнять его со временем, и позже ещё блок по IP добавлю, ибо нефиг мониторить тут!
Редактировался wst (2015-02-20 20:48:07)
Offline
@wst, если ты удалил файл .htaccess из папки cache, то это очень большая ошибка! Он там не просто так лежал.
З.Ы. Почитай как правила прописанные в .htaccess распространяются по директориям сайта.
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Не удалил, а копировал, у меня теперь 2 файла .htaccess, один из них лежит в папке cache, другой в корне.
Offline
@wst, в папку cache скопируй файл .htaccess из оригинального движка форума.
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Получается в папке cache должен лежать чистый .htaccess без изменений ?
Offline
@wst, да. Тот который был в оригинальном движке.
Я же написал, что бы ты прочитал о том как .htaccess действует.
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Тему ап, заметил сегодня одну очень не хорошую весч
Активны:
[Bot] SkypeUriPreview Preview (2)
Как это убрать ? Я хочу запретить всяким там скайп превью сканить форум!
Offline
@wst, если сервер apache, то выше я давал пример блокировки по юзер агентам через .htaccess.
Моя сборка FluxBB 1.5, ForkBB · сообщество
Offline
Страницы 1