Your Company
Вкусный портал

robots.txt: как создать файл и пример для WordPress

  1. Что такое файл robots.txt и для чего он используется?
  2. Как создать файл robots.txt
  3. Основные команды
  4. Наиболее распространенные ограничения
  5. Разблокировать ресурсы CSS и JS
  6. Проверить файл
  7. Имеет ли desindexación robots.txt?
  8. Пример файла robots.txt для WordPress
  9. О блокировке / wp-admin /
  10. средство

Поисковые системы по своей природе жадные Поисковые системы по своей природе жадные.

Они хотят проиндексировать всю возможную информацию, поэтому, когда они попадают на ваш сайт, они сканируют все.

Проблема возникает, когда вы хотите предотвратить включение определенных страниц в ваши индексы, что вы тогда делаете?

У вас есть 2 варианта:

  1. Введите специальный ярлык на каждой странице (см. Мета Роботы )
  2. Используйте централизованный файл для контроля записи

Этот последний вариант - robots.txt .

Что такое файл robots.txt и для чего он используется?

Роботы или пауки - это программы, которые поисковые системы используют для отслеживания Интернета. Когда они прибудут на ваш сайт , первое, что они делают, это ищут файл robots.txt и, в зависимости от того, что в нем говорится, переходят на ваш сайт или переходят на другой.

Вы можете понимать файл robots.txt как список неподдерживаемых роботов , который позволяет выборочно ограничивать доступ к вашему сайту. Если есть страницы, которые вы предпочитаете хранить в недоступных для поисковых систем, вы можете настроить их здесь, и если есть поисковая система, к которой вы также хотите запретить доступ.

Более конкретно, вы можете использовать файл robots.txt для следующего:

Теперь есть несколько вещей, которые вы должны помнить о robots.txt:

  • Некоторые роботы могут игнорировать инструкции, содержащиеся в этом файле, особенно вредоносные роботы или вредоносные программы
  • Файл является общедоступным, что означает, что любой может его увидеть, просто набрав www.example.com/robots.txt

Поэтому, если вы планируете использовать robots.txt, чтобы скрыть личную информацию, вам нужно искать другую альтернативу.

Как создать файл robots.txt

Первое, что вам нужно знать о файле robots.txt, это то, что он не является обязательным. Вам нужно создать его только тогда, когда вы хотите, чтобы определенные страницы или каталоги вашего сайта не появлялись в результатах поиска.

Создать файл очень просто, просто создайте текстовый документ с именем «robots.txt» и загрузите его в корень своего домена ( http://www.example.com/robots.txt ), где и находится где искатели надеются найти его.

Самое простое - создать его вручную, используя ноутбук или редактор кода, такой как Блокнот ++ , хотя, если вы один из тех, кто предпочитает инструменты генерации, из SEOBook Он выполняет свое предназначение довольно хорошо. Другие альтернативы RobotsGenerator.com и McAnnering Robots.txt Генератор ,

Для загрузки файла используйте FTP-клиент как FileZilla или Cyberduck ,

Что касается содержимого, базовый файл robots.txt может быть:

Пользователь-агент: *
Disallow: / частный /

Эти инструкции запрещают доступ к «частному» каталогу всем поисковым системам. Для этого сначала укажите, что заказ адресован всем роботам ( User-agent: * ), и, наконец, укажите несанкционированный каталог ( Disallow: / private / ).

Основные команды

Команды, которые использует файл robots.txt, поступают из вызова Протокол исключения роботов универсальное соглашение, синтаксис которого вы должны соблюдать:

  • Вы можете использовать только разрешенные команды (хотя некоторые поисковые системы понимают дополнительные команды)
  • Вы должны уважать случай, пунктуацию и пробелы
  • Каждая группа User-agent / Disallow должна быть отделена пустой строкой
  • Вы можете включить комментарии, используя символ хеша (#)

Наиболее важные команды:

  • User-agent - указывает, какой тип робота должен соответствовать указанным ниже директивам.
  • Disallow - запрещает доступ к определенному каталогу или странице.
  • Разрешить - работает в отличие от директивы Disallow, предоставляя доступ к каталогам и страницам. Его можно использовать для частичной или полной перезаписи директивы Disallow.
  • Карта сайта - укажите путь к карте сайта в формате XML.
  • Crawl-delay - Указывает роботу количество секунд ожидания между каждой страницей. Это может быть полезно в тех случаях, когда вам нужно уменьшить нагрузку на сервер.

Кроме того, вы можете использовать шаблоны для увеличения или уменьшения соответствия:

  • Звездочка (*) - действительна для любой последовательности символов. Например, все каталоги, начинающиеся с «private», будут «/ private * /»
  • Доллар ($) - указывает на конец URL. Например, чтобы указать любой файл, который заканчивается расширением .php , следует использовать «/*.php$».

Наиболее распространенные ограничения

С помощью команд и подстановочных знаков вы можете создавать все виды ограничений. Тем не менее, это не очень хорошая идея, чтобы быть креативным с файлом робота, так как вы можете заблокировать то, что вам не нужно.

В этом смысле лучше придерживаться наиболее распространенных ограничений, таких как:

  • Включить всех роботов - User-agent: *
  • Укажите робота Google - Пользователь-агент: Googlebot
  • Укажите робота Bing - Пользователь-агент: Bingbot
  • Запретить весь сайт - Запретить: /
  • Запретить каталог - Запретить: / directory /
  • Запретить каталоги, которые начинаются с «что-то» - Disallow: / что-то * /
  • Запретить страницу - Запретить: /page-web.htm
  • Запретить каталоги и страницы, которые начинаются с "что-то" - Disallow: / что-то
  • Запретить расширение .gif - Disallow: /*.gif$
  • Разрешить подкаталог - Разрешить: / directory / subdirectory /
  • Укажите карту сайта - Карта сайта: http://www.example.com/sitemap.xml

Разблокировать ресурсы CSS и JS

поскольку Google обновит свои рекомендации для веб-мастеров указав, что отказ в доступе к файлам CSS и JavaScript с помощью robots.txt может повредить рейтингам, рекомендуется разблокировать любой каталог, в котором они могут содержаться. Таким образом, поисковая система может полностью обработать страницы и узнать, как их увидит пользователь.

Чтобы узнать, как Google видит ваши страницы, используйте инструмент Отслеживание> Исследуйте как Google вместе с кнопкой « получить и обработать» в консоли поиска. Если это не похоже на то, что вы видите в своем браузере, или если возникают ошибки или предупреждения, удалите строки в файле robots.txt, которые блокируют доступ к URL-адресам.

Другая, более безопасная альтернатива - открыть путь к ресурсам CSS и JavaScript в явном виде. Таким образом, не имеет значения, если каталог, в котором они находятся, заблокирован, Google может получить доступ к необходимым ресурсам:

Пользователь-агент: Googlebot
Разрешить: /*.css$
Разрешить: /*.js$

Проверить файл

Когда вы создаете или изменяете свой файл robots.txt, всегда проверяйте, что он делает то, что вы ожидаете от него. Имейте в виду, что простая ошибка может заблокировать доступ к поисковым системам и повредить вашей видимости.

Проверка легко сделать с помощью инструмента Отслеживание> robots.txt тестер в консоли поиска Google. Также рекомендуется использовать функцию получения и обработки Отслеживание> Исследуйте как Google чтобы убедиться, что нет заблокированных ресурсов.

Имеет ли desindexación robots.txt?

Одной из наиболее часто используемых функций файла робота является деиндексация. Теоретически, если вы хотите удалить файлы и каталоги из Google, вам нужно только добавить соответствующие директивы Disallow , не так ли?

Что ж, вы должны знать, что хотя блокировка с помощью Disallow предотвращает сканирование поисковых систем, она не гарантирует деиндексацию. Вот как объясняет это аналитик Google Джон Мюллер: в этом видео :

Когда индексируемая страница с robots.txt блокируется, обычно происходит удаление информации из предыдущих [...] проверок и индексация URL с помощью общей сводки, которая говорит, что мы не знаем, о чем эта страница [потому что она заблокирована роботами TXT].

Однако иногда бывает так, что мы полностью удаляем страницу. Если мы считаем, что в URL нет информации, входящих ссылок или причин использовать его в классификациях, мы можем удалить его из индекса.

Так что теоретически он может быть деиндексирован, но нет никаких гарантий.

То есть, когда вы блокируете страницу, которая уже проиндексирована, Google сохраняет ее в своем индексе, и существует только отдаленная вероятность, что она будет удалена. Если вы хотите убедиться, что удалили страницу из поисковой системы, вы должны сделать что-то еще, как Мюллер продолжает объяснять:

Если вы добавите тег [Meta Robots] NoIndex на страницу и разрешите сканирование [...], мы удалим его при следующей обработке URL-адреса.

Это имеет большой смысл. Если поисковая система может увидеть явный сигнал о том, что вы не хотите индексировать страницу, она будет деиндексировать ее.

Поэтому в следующий раз, когда вы захотите удалить страницу из Google, используйте тег Meta Robots , Robots.txt Указывает, что только когда страница еще не достигла знаний поискового движка

Пример файла robots.txt для WordPress

Предупреждение : универсального файла robots.txt не существует, в зависимости от конфигурации вашего сайта, вам может потребоваться добавить, изменить или удалить ограничения.

Чтобы помочь вам лучше понять, как работает файл robots.txt, я хотел бы показать вам реальный пример. Это тот же файл, который я использую в этом блоге, поэтому это пример, ориентированный на WordPress.

Я недавно обновил мой файл robots.txt следующим образом (без номеров строк):

  1. Пользователь-агент: *
  2. Disallow: / go /
  3. Карта сайта: http://deteresa.com/sitemap.xml

Теперь я хотел бы объяснить каждую строку:

  • Строка 1 - Я заявляю, что приведенные ниже инструкции относятся к роботам любой поисковой системы.
  • Строка 2 - я блокирую каталог, который я использую для перенаправлений (вам не нужно его иметь).
  • Строка 3 - я указываю маршрут, где находится карта XML моего сайта.

О блокировке / wp-admin /

Вы должны знать, что нет необходимости блокировать / wp-admin / в файле robots.txt. WordPress уже блокирует страницы каталога через HTTP-заголовок X-Robots-Tag ,

средство

Если вам нужна дополнительная информация о файле robots.txt, вы можете найти его на следующих страницах:

Вы уже знаете, как вы собираетесь создать файл robots.txt?

Изображение через Дизель Сладости

Похожие

Что такое SEO
Многое уходит на создание успешной SEO-кампании. Вам нужен профессионал на вашей стороне. В Colorado Internet Solutions мы задаем этот вопрос «что такое SEO» почти каждый день, когда общаемся с владельцами малого бизнеса. Маркетинг вашего бизнеса в Интернете - сложное и чрезвычайно гибкое мероприятие, и попытка поделиться всем на эту тему займет гораздо больше времени, чем вы хотели бы потратить на чтение, поэтому мы поделились
Что такое RSS-канал?
... ин, который блоггеры должны понимать, и в этом руководстве я объяснил, что такое RSS-канал и как его использовать. Для блоггера это один из способов позволить своим пользователям подписываться на обновления блога. Среди блоггеров и людей, которые любят получать информацию из Интернета, RSS-канал не должен быть новым словом, но для многих это жаргон. Сегодня мы узнаем о RSS-каналах и о том, как полезно всем оставаться в курсе новостей. А также для блоггеров, поэтому
Разъяснение файлов WordPress Robots.txt
... для веб-сканеров или пауков и веб-роботов, которые ищут данные в Интернете. Этот файл должен указывать им, куда НЕ следует обращаться. Это запрещенный знак для ваших файлов. С другой стороны, файл Sitemap является положительным знаком для веб-сканеров, пауков и веб-роботов. Robots.txt = исключение Sitemaps = включение По этой причине синтаксис Allow в файле robots.txt обычно не нужен. Намерение для исключения. Предполагается, что остальная часть сайта
Что такое Google TrustRank?
Вы заметили, что во многих результатах поиска страницы с популярных веб-сайтов часто отображаются выше, хотя есть страницы с большим «PageRank»? Реальность такова, что PageRank больше не влияет на ваше общее положение. Многие поисковые маркетологи приняли тактику, чтобы
Robots.txt, очень забытый файл SEO
... robotstxt-ocen-zabytyj-fajl-seo-1.jpg" alt="Что такое файл robots"> Что такое файл robots.txt? Файл robots.txt - это файл с протоколом, который позволяет веб-мастерам защищать определенные части веб-сайта от поисковых систем Google / Yahoo / Bing ect. Поэтому это удобный инструмент для предотвращения того, какие части вашего интернет-сайта могут быть недоступны для поисковых роботов. И чтобы этот контент не был проиндексирован. Протокол Robots также можно использовать
Что такое файл Robots.txt?
... txt-1.jpg" alt="Этот пост является еще одним в духе моего Sitemaps пост, где я объяснил, как создать карту сайта XML для включения в Google и Bing Webmaster Tools"> Этот пост является еще одним в духе моего Sitemaps пост, где я объяснил, как создать карту сайта XML для включения в Google и Bing Webmaster Tools. Сегодня я хочу поговорить о файле robots.txt, который
Все о WordPress и файле robots.txt
... исковые системы регулярно отправляют так называемые сканеры (также называемые поисковыми роботами или пауками) для поиска на веб-сайтах новых записей и подстраниц. Используя файл robots.txt, вы можете контролировать, какие подстраницы вашего сайта не должны отслеживаться сканерами и не должны включаться в индекс Google. Соответствующие страницы не отображаются в результатах поиска. Конечно, вы можете установить это не только для Google, но и для других поисковых систем, таких как Bing, Yahoo
Как создать команду убийцы контента
... для работы, оптимизировать ваш процесс и вооружить вашу команду необходимыми знаниями. Вот что я имею в виду: Люди - кого вы должны нанять и почему? Не переживайте, создавая позицию уровня С. Согласно MarketingProfs статья «Более популярный подход состоял в том, чтобы привлечь к работе кого-то с несколько меньшими полномочиями (и сопутствующими затратами) - вице-президента или
Что такое SEO - определение SEO
определение: SEO (поисковая оптимизация) - это процесс разработки технического плана для обеспечения эффективного использования поисковых систем в качестве инструмента
Виды SEO оптимизации методами
Поскольку большинство услуг и продуктов отличаются Типы SEO оптимизации , Речь идет не о разных пакетах услуг, а о вариантах используемых методов оптимизации. Следует отметить, что в зависимости от результатов вы можете использовать каждый из различных типов SEO, но для некоторых типов сайт риска запрещен gagul, то есть он
Что такое SEO-позиционирование и почему это важно?
Если у вас есть веб-страница, и вы ввели в Google «как привлечь больше посетителей», «как расти в Интернете», «как выйти на первую позицию в Google», вы наверняка видели это слово повторяющееся снова и снова: позиционирование SEO или SEO и больше SEO , Но, если, наоборот, у вас нет веб-страницы, вы можете связаться с нами сейчас, и мы предоставим вам решение. А пока я объясню, что

Комментарии

Мало того, что он имеет симпатичный интерфейс, который очень интуитивно понятен в использовании, но он отлично подходит для управления процессом охвата от «Привет, как дела?
Мало того, что он имеет симпатичный интерфейс, который очень интуитивно понятен в использовании, но он отлично подходит для управления процессом охвата от «Привет, как дела?» До «Спасибо за ссылку!» Это означает, что ни одна перспектива в настоящее время в аутрич-трубопроводе не будет потеряна или забыта. Вы также можете добавить полезные заметки в электронные письма для текущей и будущей ссылки. Если вы не можете позволить себе потратить несколько долларов на BuzzStream,
Сколько раз я слышал, что «PPC не работал, поэтому я хочу попробовать SEO», что странно, как если бы он не конвертировался через PPC, почему он будет органическим?
Сколько раз я слышал, что «PPC не работал, поэтому я хочу попробовать SEO», что странно, как если бы он не конвертировался через PPC, почему он будет органическим? Данные PPC могут быть полезны не только с точки зрения целей ключевых фраз (теперь они не предоставлены!), Но и для обмена метаданными и т. Д.
Итак, как нам сообщить роботу Google, что такое наши изображения, чтобы он понимал, что эта страница предназначена для человека?
Итак, как нам сообщить роботу Google, что такое наши изображения, чтобы он понимал, что эта страница предназначена для человека? Три лучшие практики при работе с изображениями для SEO: Назовите файл Присвоение имени файлу изображения чего-то, что описывает то, что изображение, а не просто неясное число или группу букв. Если у вас есть несколько похожих изображений, используйте уникальный номер в конце имени. Некоторые графические программы позволят вам
Чувствуете ли вы, что курс принес то, что он заявил, что это будет?
Чувствуете ли вы, что курс принес то, что он заявил, что это будет? Да, это так. Он содержал все, что было указано на странице / статье продаж (эта страница; см. Информацию ниже) для курса. 2) Что тебе понравилось меньше всего? Вероятно, МОДУЛЬ № 2, не из-за качества информации, но из-за КОЛИЧЕСТВА информации. Возможно, его можно разбить на два или три модуля? Просто предложение. 3) Что вам понравилось
Что такое онлайн-бренд и как он может помочь посетителям целенаправленно и целенаправленно собирать потенциальных клиентов во время поездки к покупателю?
Что такое онлайн-бренд и как он может помочь посетителям целенаправленно и целенаправленно собирать потенциальных клиентов во время поездки к покупателю? Каков наилучший способ создать бренд с помощью современной поисковой оптимизации? Создание бренда или брендинг - это формирование нового бренда с безошибочным характером. Бренд должен иметь свою индивидуальность. Задачи управления брендом, также называемые управлением брендом или бренд-менеджментом, заключаются в представлении бренда на
Как он может скрыть, что он «инфицирован» в своей жизни, переплетенной с кровью и операциями?
Как он может скрыть, что он «инфицирован» в своей жизни, переплетенной с кровью и операциями? Вампиры в этой серии немного отличаются от того, что мы знаем: вы можете ходить вокруг солнца, входить в места поклонения и не бояться креста. Comedy Movies - Топ 20 комедийных фильмов 2- Невеста века (2014) IMDB: 7.1
Более того, как только вы внесли изменения в свой веб-сайт, как вы узнаете, делает ли он вещи лучше или нет?
Более того, как только вы внесли изменения в свой веб-сайт, как вы узнаете, делает ли он вещи лучше или нет? Внести изменения, которые приносят вред, так же легко, как и внести изменения, улучшающие ситуацию. Вот почему поисковая аналитика является такой важной частью любой деятельности SEO. Измерение ключевых показателей эффективности SEO помогает понять контекст и понять, что работает, а что нет. Само по себе это утверждение в некоторой степени указывает на очевидное, но каким
Как вы можете не притворяться, что монтадито за 1 евро приносит вам такое же удовольствие, как и еда за 40 или 100 евро?
Как вы можете не притворяться, что монтадито за 1 евро приносит вам такое же удовольствие, как и еда за 40 или 100 евро? В SEO вы играете гораздо больше, чем расстройство желудка: на карту поставлена ​​репутация вашего бизнеса и его возможное наказание в поисковых системах, которое может заставить вас исчезнуть с карты поиска и со всех продаж, которые могут быть генерировать. В этом
Ну, Xanga как исключение, но Xanga здесь не упоминается, потому что они «не следуют», подождите, я только что упомянул их, не так ли?
Ну, Xanga как исключение, но Xanga здесь не упоминается, потому что они «не следуют», подождите, я только что упомянул их, не так ли? 8. Tumblr Теперь это действительно хорошее место для блогов, если вы можете общаться с людьми там, это золотая жила для обратных ссылок и трафика. 9. Блог, или Blog.com, этим все сказано. Это сайт на WordPress, так что его легко использовать и настраивать, просто мой тип сайта. 10. В общем, это сайт, который
Что такое обратные ссылки и как они работают?
Что такое обратные ссылки и как они работают? Давайте начнем наш урок с определения обратных ссылок. Что такое обратные ссылки? Обратные ссылки - это не что иное, как ссылки на ваш сайт. Другими словами, когда на веб-странице или веб-сайте есть ссылка, на которую можно кликнуть, или гиперссылка, такая переадресация на ваш веб-сайт называется обратной ссылкой.
Итак, прежде чем перейти к знакомству с цифровым маркетингом, давайте узнаем, что такое цифровой маркетинг и что он включает в себя?
Итак, прежде чем перейти к знакомству с цифровым маркетингом, давайте узнаем, что такое цифровой маркетинг и что он включает в себя? По сути, это совокупный термин, который используется, когда реклама и маркетинг встречаются с веб-инновациями и различными типами онлайн-платформ. Давайте сначала рассмотрим основы цифрового маркетинга с помощью приведенного ниже определения. Это первый шаг, когда мы поговорим о введении в цифровой маркетинг. Цифровой маркетинг | Определение

Txt и для чего он используется?
Txt?
Проблема возникает, когда вы хотите предотвратить включение определенных страниц в ваши индексы, что вы тогда делаете?
Txt и для чего он используется?
Txt?
Txt?
Вы заметили, что во многих результатах поиска страницы с популярных веб-сайтов часто отображаются выше, хотя есть страницы с большим «PageRank»?
Txt?
Txt?
Вот что я имею в виду: Люди - кого вы должны нанять и почему?

Новости

Реклама

Календарь

Реклама

Copyright © 2016 www.j-operamini.b5bedf3d7