Базовые принципы ранжирования

Содержание:

  1. Релевантность и вес сайта
  2. Плотность ключевых слов
  3. Анализ контента конкурентов
  4. Алгоритм PageRank

Релевантность и вес сайта

Релевантность — степень соответствия результатов поиска запросу пользователя.

Самый старый метод оценки релевантности — это анализ текстового содержания страницы. Т.е. анализируя то, какие слова на странице использовались, чаще можно приблизительно понять о чем эта страница. Но тут же вытекает существенный минус такого метода — это возможность манипулировать выдачей. Например, вместо того, чтобы писать качественную и полезную страницу по истории, человек может просто внести на страницу 100 или 1000 слов по теме и тем самым манипулировать поисковой системой. Ранее поисковые системы использовали определенные пороги плотности ключевых слов, что в свою очередь тоже мало эффективно, так как можно писать все, что угодно, и при этом просто добавлять в нужной пропорции ключевые слова. На сегодняшний день ПС используют более сложные алгоритмы анализа данных и для оценки релевантности страницы используют машинное обучение.

Если кратко, то оно из себя представляет следующее, — в штате Гугла и Яндекса есть специальные люди (асессоры), которые оценивают сайты “вручную” и выбирают хорошие страницы, оценивая их по определенному перечню вопросов. Далее, весь этот массив страниц отправляется в алгоритм машинного обучения, где система пытается выявить закономерности у всех этих “хороших страниц” (рис.1).

алгоритм-машинного-обучения

Рисунок 1 — Алгоритм машинного обучения

Например, у всех хороших интернет магазинов указан физический адрес предприятия или все хорошие блоги имеют контактные данные блогера и т.д.

Так вот, машина анализирует все эти общие закономерности и формируются пункты алгоритма ранжирования. Сначала эти факторы тестируются на небольших группах пользователей и если качество выдачи улучшается, то факторы остаются в алгоритме.

Плотность ключевых слов

Также вычисляются и качественные уровни плотности ключевых слов на странице.

Предположим, что у нас есть 10 страниц которые выбраны как хорошие, например, в теме покупки ноутбуков. Далее, оценивается количество ключевых слов на каждой странице и определяется средняя плотность и некий диапазон границ от минимума до максимума, в рамках которого все страницы хорошие. Эти параметры и попадают в алгоритм ранжирования, как значения плотности ключевых слов на странице, которые должны быть ( рис. 2)(рис. 3).

Процентное соотношение ключевых слов

Рисунок 2 — Процентное соотношение ключевых слов

какая-должна-быть-плотность-ключевых-слов-в-тексте

Рисунок 3 — Диапазон ключевых слов

В дальнейшем, если плотность ниже заданного диапазона, то страница считается не релевантной и также те,  в которых плотность выше.

Очень часто Seo специалисты пытались рассчитать идеальный процент ключей на странице, но это направление ошибочно. Тут все таки лучше направить энергию на создание полезных, легко читаемых текстов. А количество ключевых слов в них при этих условиях само собой будет оптимальным.

Анализ контента конкурентов

Как один из инструментов, который тут может быть полезен — это анализ конкурентов.

Берете выборку, например топ 10, и анализируете плотность ключей на странице, и вот на этот параметр можно в какой-то мере равняться. Произвести анализ плотности ключевых слов можно при помощи сервиса istio.com. Хотя, не исключено, что конкуренты в вашей нише, предоставляют некачественный контент, т.е. тут должна включиться ваша экспертная оценка. Помимо самих ключей, ПС анализирует и слова “окружения”, например, пользователь может ввести слово “наполеон” и ПС для оценки релевантности будет использовать слова окружения, т.е. на какой странице встречаются слова: мука, крем, рецепт и т.д., а на какой будет: битва, политик, история, полководец…

ПС нужно будет понять, какая страница соответствует информации о торте, а какая — о полководце, и выдать ту, которая больше соответствует теме запроса. Отсюда вывод, что продумывать и насыщать текст нужно не только ключами, но словами из темы.

Общий смысл этого — контент должен быть не только интересным, но и тематическим. Иначе можно допустить, например такую ошибку, — у вас интернет магазин по продаже самурайских мечей, но вместо того, чтобы писать в тексте о том, как купить меч и его характеристики, пишут о том, когда они появились, их историю или что-то подобное.

Поисковые системы, конечно же, не ограничиваются только текстовыми факторами ранжирования.

Предположим, что пользователь ввел запрос «Адольф Гитлер», в этом случае достаточно показать пользователю страницы с хорошей энциклопедии, а их не так уж и много, следовательно задача не сложная для ПС.

Сложности начинаются, когда человек вводит запрос например, — купить айфон 10.

Продавцов этого товара может быть сотни или тысячи. И текстовое содержимое у нескольких десятков будет практически одинаковое по плотности ключей и тематике. Так как же система будет определять позиции тех или иных страниц в  выдаче?

Алгоритм PageRank

Тут в действие вступает придуманный Лари Пейджем алгоритм, который называется PageRank. Суть его заключается в следующем. Представим, что у нас есть две страницы, одна у Максима, а другая — у Саши. Про свои страницы они никому не говорили, а, следовательно, вероятность, что на этих страницах кто-то есть, кроме их авторов, очень мала (условно 0,01) (рис. 4).

Алгоритм-PageRank

Рисунок 4 — Страницы Максима и Саши

Теперь представим, что со страницы Максима появилась ссылка на страницу Саши. Теперь вероятность, что на странице у Саши будет еще кто-то, кроме него, существенно возросла(рис. 5). А вот шанс того, что на странице у Максима кто-то есть, уменьшился. Т.е. ссылка передала как бы некий плюс рейтингу от страницы Макса на страницу Саши.

Алгоритм-PageRank-логика

Рисунок 5 — Передача рейтинга странице Саши

Если это сформулировать академически, то получится такое определение, — вероятностный показатель пребывания пользователя на странице с учетом только ссылочных связей. Этот рейтинг, который передается по ссылке, часто еще называют ссылочным весом. Поисковой системе это дает возможность оценивать авторитетность той конкретной страницы, которая определяется количеством ссылок на нее.

Рисунок 6 даст вам понять, какая из страниц более важна, с точки зрения алгоритма PageRank. И страница (а), и страница (б) имеют по одной входящей ссылке. Но тем не менее, на страницу (б) ссылается страница с большим весом,  чем на страницу (а), следовательно, страница (б) в результате более значимая.

Ссылочный-вес

Рисунок 6 — Важность страниц по алгоритму PageRank

Итого: Все необходимые страницы должны  быть в индексе. Страницы должны быть релевантны и усилены ссылочными рекомендациями.

to be continued…

Автор Виталий Сухомлинов
практикующий Seo-специалист
и программист любитель

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *