Полезные... Интернет  Безопасность

Русские буквы в URL — Google и Yandex. SEO-фрагменты (SEO Snippets) Google: Можно ли в URL-адресе использовать кириллицу и неанглийские слова? Русский язык в url

28.03.2018 Время прочтения: 1 минута

С 21 декабря 2017 г. Google публикует SEO-фрагменты (SEO Snippets) – короткие обучающие видео. Ниже перевод очередного SEO-фрагмента.

Сегодня вопрос задаёт Джон Мюллер из Швейцарии, т.е. я Вопрос в следующем: можно ли в URL-адресе использовать неанглийские слова? Владельцам сайтов, ориентированных на пользователей за пределами англоязычных регионов, иногда неясно, можно ли использовать местный язык и неанглийские символы в URL-адресах.

Поисковая система Google использует URL-адреса прежде всего для того, чтобы добраться к фрагменту контента – по нему бот Google сканирует содержимое страницы и добавляет ее в выдачу. Если URL-адреса действительны и уникальны, проблем не возникнет. Для доменных имен и доменов верхнего уровня нелатинские символы кодируются с помощью конвертера Punycode. Звучит немного странно, поэтому приведу пример: возьмём мою фамилию Мюллер (Müller). Над второй буквой имеются точки, поэтому в качестве имени домена она будет выглядеть иначе после кодировки – «müller» -> «xn-mller--kva». Обе версии эквиваленты для поисковой системы Google. Остальная часть URL-адреса может быть закодирована с помощью системы Unicode, UTF-8 для нелатинских символов. Вне зависимости от языка, сделайте URL-адрес простым для пользователей – избегайте пробелов, запятых и других символов. Используйте тире для разделения слов в адресе. Некоторые предпочитают использовать знак нижнего подчеркивания – так тоже можно, но тире легче распознается. Если ваш сайт доступен в нескольких языковых версиях, используйте соответствующий язык в URL-адресе для страниц контента на этом языке. Итак, подводя итоги, скажу: использовать неанглийские слова в URL-адресах можно, делать это следует для неанглоязычных сайтов.

VitaliyRodnenko , 03.08.2008

Меня всегда интересовал вопрос, как относятся поисковики к русскоязычным URL .

Сегодня проверял, как индексируется наш блог в поисковиках. И дело дошло до Яндекса, я ввел запрос «работа со строками javascript», в надежде увидеть в выдаче недавнюю статью об и был приятно удивлен. В выдаче блог оказался на 2-й позиции.

В URL статьи были использованы русские буквы: www.. И в результатах выдачи ключевые слова были выделены в URL жирным шрифтом:

У меня появилась мысль, что если уж Яндекс находит ключевые слова в URL , то быть может он использует это в своих поисковых алгоритмах? Или же это выделение сделано только для удобства ориентирования в результатах выдачи?

Google применяет подобную практику и учитывает при ранжировании ключевые слова в URL , набранные латинскими буквами. Тогда я решил проверить, «понимает» ли русскоязычные URL Google? Оказалось, что понимает:

Подписаться на обновления блога

Комментарии (7)

  1. Васька

    Ну как время показало? Какие результаты?

  2. Skaizer

    Да как сказать, по запросу «строки javascript» в яше мы на первом месте. Данный пост было лишь моим предположением и наблюдением. Все таки мне кажется, что русские буквы в URL не влияют на ранжирование.

  3. Приколист

    А как сделать так, чтобы на моём сайте в урле были русские буквы?

  4. dima.london

    Приколист / 26.12.2008 в 05:09
    А как сделать так, чтобы на моём сайте в урле были русские буквы?

    Через мод-реврайт. К примеру, в вашем блоге статьи имеют такие адреса

    Вот когда пишете статьи, анализируйте, придумывайте ссылки, подходящие под тематику, и затем в.htaccess вписывайте адрес типа

    # мод Rewrite включен
    RewriteEngine On
    RewriteRule .* — [L]
    # новый адрес для статьи
    RewriteRule ^новый-адрес-для-статьи$ /papka/podpapka/adres.php?url=125456 [L]

    Теперь в скрипте и, самое главное, в файле sitemap, надо сменить адрес к статье с

    на

    Это первое, что пришло в мою голову в момент прочтения этой статьи.

  5. Кирилл

    А что вы можете сказать на счет времени индексации страниц с русским url’ом Яндексом? Недавно закинул сайт в индекс (прошло 10 дней), и из 3 страниц с русскими урлами-попала 1. Остальные пока не индексируются. Google проиндексировал достаточно быстро. Я считаю, что Google дает некоторые плюсы в ранжировании подобных страниц. Особенно это выражается, если проанализировать западную выдачу ТОПа

Всем привет! Внешняя оптимизация сайта, путем закупки бэклинков, это дорого, не всегда эффективно, а порой опасно. После того, как Гугл ужесточил борьбу с продажными ссылками, а Яндекс и вовсе пытается их отключить, многие видят выход в накрутке поведенческих факторов. Но это не выход. Яндекс прямо заявил, что будет беспощадно наказывать за такие попытки повлиять на результаты выдачи. Таким образом, самым действенным и надежным способом продвижения сайта в поисковых системах была и остается внутренняя оптимизация. И тема сегодняшней статьи на сайт - оптимизация отдельных web-страниц, а точнее, их URL адресов.

Ну в самом деле, все начинающие блоггеры знают, что надо правильно отформатировать текст поста и распределить ключевые слова, грамотно прописать Title и Description. Это описано на каждом втором SEO-блоге, причем не всегда верно. Даже про внутреннюю перелинковку и релевантность многие осведомлены. А вот составить правильный URL адрес страницы могут не многие. Кто-то скажет, что это уже мелочи и, например, WordPress сам умеет формировать урлы. Позвольте не согласиться, URL-факторы очень даже влияют на релевантность страницы и ее ранжирование в результатах поиска. Поэтому я покажу, как изменить URL адрес, который нам любезно подсунул Вордпресс, и выжать максимум в плане SEO.

Что такое URL адрес сайта или web-страницы? Если обратиться к Википедии, то URL (Uniform Resource Locator ) - это Единый Указатель Ресурсов. Проще говоря, это некий стандарт записи адреса интернет-ресурса, в нашем случае, веб-страницы.

Обычно он начинается с протокола передачи данных http:// . Далее следует хост, в виде имени домена, и URL-путь до конечной странички, включающий в себя папки и подпапки, в виде рубрик. Посмотреть URL веб-страницы можно в адресной строке браузера, и выглядит он примерно так:

Чем длиннее путь, тем больший уровень вложенности имеет целевая страница, и тем сложнее ее продвигать. Значит, надо чтобы оптимизированный URL был небольшой длины. Подробнее об этом я расскажу ниже. А пока вернемся к Вордпресс.

Как оптимизировать URL страницы на блоге WordPress

Во-первых , обязательно надо настроить ЧПУ (человекопонятные url) и перевести все ссылки с кириллицы на латиницу при помощи плагина Cyr-To-Lat. Как и зачем это делать, читаем здесь . Я лишь уточню для тех, кто этого еще не сделал, что правильно настроенная логическая структура ЧПУ ясно дает понять посетителю, где он находится и куда попадет при клике по ссылке. Пример смотрите выше. Кто не в курсе, обязательно прочитайте ту статью, а потом возвращайтесь, иначе дальше будет не совсем понятно.

Итак, после этих действий ЧПУ на блоге полностью настроены и можно смело публиковать посты. По умолчанию, Вордпресс генерирует адрес поста из заголовка статьи. В большинстве случаев нам потребуется заменить такой урл более правильным с точки зрения seo-оптимизации. Сделать это не сложно, но надо придерживаться некоторых правил.

Правила оптимизации урлов сайта

1. URL страницы должен содержать ключевые слова. Он отображается под сниппетом в поисковой выдаче и ключи в нем подсвечивается жирным шрифтом. Это в случае, если настроены ЧПУ и ссылка не выглядит набором никому непонятных символов.

Что касается имени домена, то в нем тоже желательно использовать главное ключевое слово для сайта. Это еще продолжает работать, хотя уже не так как раньше. Главное не спамить. Вот так нормально: mir-auto.com , а так делать не надо: kupit-avto-v-moskve-nedorogo.ru .

Кстати, в 2014 году появилось 638 новых доменов верхнего уровня с очень “вкусными” названиями. Например, можно создать сайт SEO.GURU или зарегистрировать домен КУРСЫ.ОНЛАЙН . А как вам такое для арбитражников - tanki.online (пока свободно). Некоторые зоны уже доступны для регистрации, на другие пока можно сделать предварительный заказ. Не знаю, как они будут в плане продвижения, но для брендирования самое то.

2. Веб-адрес должен состоять из 3–5 слов. Максимальная длина URL не ограничивается современными браузерами, они нормально воспринимают адреса, содержащие даже тысячи знаков. Но вот для SEO лучше, чтобы ссылка была покороче. Как сказал Мэтт Каттс (руководитель группы по борьбе с web-спамом в Гугл), если будет больше 5 слов, то вес ключевиков в глазах Google будет снижен . К тому же, длинные ссылки обрезаются при показе в выдаче, что может снизить кликабельность сниппета.

3. Не используйте большую вложенность в адресах. Чем дальше страница от Главной, тем меньший вес имеют ее ключевые слова в url. Большое количество подкатегорий может выглядеть спамно: телевизоры.ру/телевизоры/led-телевизоры/led-телевизоры-самсунг/телевизор-самсунг-модель/ . За избыток кеев можно получить санкции от поисковиков.

Чтобы не было такой проблемы, я настроил постоянные ссылки по схеме /%postname%.html вместо /%category%/%postname%.html . Конечно, такой адрес не будет выглядеть, как “хлебные крошки”, когда легко можно попасть в нужный раздел, удалив часть ссылки справа. Но зато я вижу здесь ряд преимуществ:

  • короткий url и максимальная концентрация веса на ключевом слове;
  • такую ссылку не надо укорачивать, чтобы разместить в социальных сетях, например, в Твиттер;
  • легче запомнить и продиктовать;
  • если надо изменить структуру сайта, то можно спокойно перенести записи в другие рубрики, не создавая битых ссылок.

4. Делайте окончание с расширением .html . Хотя это не играет роли для поисковиков, но дает понять, что дальше идти некуда и выглядит привычно.

5. Для разделения слов лучше использовать дефис (-), чем подчеркивание (_). Раньше так рекомендовал Google. Хотя сейчас, по словам того же Каттса, поисковик одинаково воспринимает эти разделители, но ведь есть еще Яндекс и Mail.ru:-).

6. Все буквы в URL должны быть написаны в нижнем регистре.

7. Перевод, транслит или кириллица в URL? Яндекс и Гугл отлично понимают любую структуру. Что же использовать? Русские буквы я отметаю сразу, так как такие адреса будут слишком громоздкими и непонятными при копировании. Транслит или перевод? Лично я использую транслитерацию, но и тут не все однозначно, ведь существуют разные стандарты. Поэтому, надо смотреть у конкурентов в выдаче, где сами поисковики подсвечивают правильные URL адреса.

8. Используйте только латинские буквы, цифры, дефис и нижнее подчеркивание. Не используйте специальные символы, русские буквы и пробел в url. Не нужно писать предлоги, союзы и другие стоп-слова.

9. Веб-страница должна быть доступна только по одному адресу. Поэтому, если движок генерирует дубли, типа, replytocom в WordPress, то надо закрывать их от индексации и использовать тег rel=”canonical” для указания поисковому боту канонической страницы.

10. Ключевики в ЧПУ учитываются поисковыми системами и влияют на релевантность страниц. То есть, если вы хотите соблюдать какой-то процент тошноты и планируете разместить на странице 3 кейворда, то ключевое слово в URL будет четвертым и может привести к переспаму. Будьте внимательны!

Вот, кстати, наглядный пример влияния кея в урле на ранжирование.

Первые места по запросу “реплитоком” занимают сайты, у которых этот ключ встречается только в url, причем на латинице. На самой странице, естественно, такого слова нет ни в каком виде и написано вообще не об этом. А попали эти дубли в индекс, видимо, только потому, что ни у одного сайта не прописан запрет в robots.txt, так как тег canonical в наличии. Причем, как первый сайт попал в выдачу, вообще непонятка - у него в коде прописано noindex, nofollow.

Может Яндекс глюканул? Так как это явно не тот ответ, который хотел получить пользователь на свой вопрос. Тем более что на SEO-блогах полно оптимизированных статей на эту тему. Ну да ладно, оставим качество поиска на совести “зеркала Рунета”.

Как изменить URL адрес страницы вашего сайта WordPress

При публикации поста в редакторе под полем для заголовка записи отображается “Постоянная ссылка “, где можно найти url адрес текущей страницы.

Нажимаем рядом кнопку “Изменить ” и вписываем нужный нам урл. Обычно для этой цели подходит Title, если он правильно составлен. Можно прописать любой текст на русском языке, следуя правилам выше, и нажать “OK “.

Получаем новый урл страницы.

Далее, при необходимости, замените некоторые символы, если вы видите, что полученная транслитерация не будет подсвечиваться в выдаче Яндекса или Google. В зависимости от того, под какой поисковик вы продвигаете сайт. Возможно, потребуется не транслит, а перевод. Тогда просто скопируйте нужный текст в поиске и вставьте вместо старой ссылки. Не забудьте сохранить изменения.

Важно! При редактировании уже существующего url, появится битая ссылка и надо будет настроить 301 редирект со старой страницы на новую.

Поэтому, сто раз подумайте, стоит ли игра свеч. Продумывайте структуру постоянных ссылок ЧПУ сайта и url адреса web-страниц заранее, чтобы потом не создавать себе проблем, которые неизбежно приведут к временному проседанию позиций в поиске.

Видео-урок по seo-оптимизации URL для Joomla

Сегодня я решил затронуть тему продвижения кириллических доменов. Я отношусь к ним весьма предвзято, поэтому статья будет субъективной, и не будет претендовать на истину. Кроме моего мнения, опыта, и некоторых моментов, уточненных в Google, я попросил знакомого (обладателя кириллического домена) также описать основные нюансы работы с кириллическими доменами, плюсы и минусы. В итоге, получилось много информации, которую я сейчас попытаюсь структурировать.

Что такое кириллический домен

Итак, что собой представляет кириллический домен. Не углубляясь в техническую сторону, можно сказать, что такой домен указывается кириллическими символами, и предназначен для улучшения читабельности и запоминаемости. За почти 30 лет существования системы доменных имен (DNS разработана в 1984 году) все привыкли к доменам в латинице, появление кириллических доменных имен в 2010 году, вызвало небывалый ажиотаж в интернет-обществе. Многие IT-специалисты скептически отнеслись к такому нововведению, уже тогда увидев недостатки использования кириллицы в доменах. Простые же юзеры Сети обрадовались, за первые 6 часов существования зоны «.рф», было зарегистрировано 183 000 кириллических доменов .

Применение кириллических доменов

Первыми кириллическими доменами стали президент.рф и правительство.рф. Спустя некоторое время (конец 2009 – начало 2010), регистрация кириллических доменных имен стала доступной владельцам торговых знаков, позже — для всех резидентов России. Сейчас насчитывается уже несколько десятков кириллических доменных зон, включая «.укр», «.бел», и другие региональные и тематические домены.

Область применения кириллических доменных имен весьма обширна, их используют правительственные и частные организации, интернет-магазины, компании любого уровня, блогеры. Многие вебмастера используют кириллические домены в качестве дополнительных зеркал для своих сайтов. Часто компании покупают такие имена лишь для того, чтобы обезопасить себя от киберсквоттинга.

Преимущества и недостатки

Использование кириллических доменов имеет свои плюсы и минусы. Лично для меня, минусов гораздо больше (включая как объективные, так и субъективные факторы), однако, я честно попытался найти хоть что-то в пользу кириллических доменов. Давайте попытаемся перечислить и то, и другое.

Преимущества кириллических доменов

  1. Домен с использованием кириллицы удобно читать и запоминать . Встречается информация, что такие домены созданы как раз для людей, не очень хорошо понимающих транслитерацию и английский язык.
  2. Возможность добавления ключевых слов в домен , без использования транслита. Имхо, данный пункт не очень однозначный, не наблюдал выраженной зависимости позиций СДЛ от ключа в домене. Лучше потратить больше времени на грамотный нейминг.
  3. Большой выбор свободных доменных имен в кириллических зонах. Тогда как на латинице за три десятка лет «вкусных» доменов осталось довольно мало — введение кириллицы дало шанс найти такой домен для своей компании. Впрочем, через несколько лет этого преимущества уже не будет, скорее всего.

На этом, пожалуй, и все.

Недостатки кириллических доменов

  1. Некоторые браузеры по-разному копируют адрес сайтов . Например, в Google Chrome домен копируется в буфер только в Punycode, тогда как Mozilla Firefox позволяет скопировать домен из адресной строки в кириллице.
  2. Отсутствие возможности создания корпоративной почты для домена. К сожалению, кириллические домены пока нельзя корректно использовать для создания почтового адреса. Можно только использовать адрес в Punycode. Например, вместо «admin@домен.рф», адрес будет выглядеть как «[email protected]». Согласитесь, не очень удобно. Правда, Google не так давно заявил о начале поддержки кириллицы в адресах почт, но пока ее станут корректно воспринимать почтовики и начнут поддерживать другие поисковики (в Рунете, безусловно, основная почта для домена — от Яндекс) — пройдет не один год.
  3. Возможны проблемы при работе со ссылочными биржами , в частности, GGL (GoGetLinks). Дело в том, что часть адреса сайта (доменное имя) трансформируется в Punycode, а сам адрес страницы/папки/ресурса (URL) передается в шестнадцатеричной системе Unicode (UTF-8, как правило). В итоге, адреса могут быть очень и очень длинными, и из-за ограничений систем бирж, могут быть проблемы.
  4. Могут быть сложности с установкой и администрированием CMS . На данный момент, с популярными CMS проблем не должно быть, но вот с самописами или не очень хорошо развивающимися системами могут быть сложности.
  5. Есть информация, что некоторые онлайн-антивирусы могут некорректно работать с кириллическими адресами страниц.
  6. Зарубежные пользователи Сети будут испытывать сложности с доступом к сайту на кириллическом домене, из за проблем с кодировкой. На сегодняшний день, большинство браузеров научились правильно «понимать» и отображать кириллические адреса, но 100% гарантии нет.
  7. С кириллическими адресами неудобно работать оптимизатору/вебмастеру . Специфика нашей профессии такова, что часто приходится копировать адреса страниц, или же анализировать отчеты различных программ. Преобразованные в UTF урлы выглядят абсолютно нечитабельно, и понять, что за страница, можно лишь по title (без перехода по ссылке, разумеется).
  8. Ну и напоследок, если на компьютере не установлена русская раскладка клавиатуры — с введением адреса будут проблемы . Можно использовать виртуальную клавиатуру, конечно, но это не всегда предосталяется возможным, и мягко говоря, не особо удобно.

Заключение

Как я упоминал вначале — кириллические домены, в моем понимании, несут больше минусов, чем наоборот. Но я честно постарался обработать и систематизировать всю найденную и полученную по своим каналам информацию, чтобы каждый желающий приобрести такой домен, мог принять решение самостоятельно. Уверен, что еще год-второй — и описанных мною минусов станет на порядок меньше. Но для большинства интернет-старожилов, давно работающих в сфере WEB, кириллические домены так и продолжат оставаться чем-то слегка странным и неоднозначным. Возможно, среди нас просто много консерваторов 🙂

А каково ваше мнение относительно достоинств и недостатков кириллических доменов?

Дата публикации: 29.08.2012

О том, что для эффективного продвижения сайтов нужно использовать ЧПУ, сегодня знает любой SEO-школьник, ведь об этом говорят все тру блоггеры, пишут в книжках и даже рассказывают на SEO-конференциях… Однако стоит капнуть чуть глубже и спросить «откуда уверенность, что поисковые системы учитывают ключевые слова из URL при ранжировании?», в ответ получаешь что-то вроде «если в выдаче URL выделяется жирным, значит поисковик понимает выделенные слова, а следовательно учитывает их при ранжировании»… Чувствуете слабое звено в этом тезисе?

«Понимает» не равно «учитывает»! За примером далеко ходить не надо – meta name keywords. Понимают ли поисковые системы значение этого тега, а так же ключевые слова, которые в нем перечисляются? Бесспорно. Имеет ли влияние этот тег? К сожалению нет. Возможно так же обстоят дела с ключевыми словами в ЧПУ?

Эксперимент

Что бы не гадать на кофейной гуще, я провел небольшой эксперимент. Цель эксперимента – проверить, будет ли сайт искаться по ключевым словам, которые используется в URL, но которых нет на странице.

  • Vlad написал:
    10 Ноя 2014 в 10:50

    у гугла есть два варианта поиска все результаты и точное соответствие, при точном соответствии он ранжирует страницы по релевантности и учитывает кириллицу в урл, а если в настройках поиска стоят все значения (что включено по умолчанию) то какой запрос не вводи ты ну увидишь кириллических урл, это связано либо с тем что все поголовно используют транслит или с тем что при настройках «все значения» гугл переводит транслит в кириллицу и сравнивает с запросом, вот только это теория как ее проверить я не знаю.

  • chijkov написал:
    02 Янв 2015 в 17:25

    Здравствуйте.Интересное исследованные, но вот вопрос, раз вы теперь знаете что ценнее для ПС кириллические перевод или транслит, то почему вы сами на своих сайтах, в том числе и на это не используете такой прием?

  • Сергиус написал:
    09 Ноя 2015 в 22:14

    Классный эксперимент. Когда у вас стоит кирилица, на что оставляется ссылка? на кучу непонятных символов или или на сайт.ru/статьи??
    Если ссылки идут на кучу символов то вы запаритесь с раскруткой сайта.