Использование PageRank для оптимизации внутренних ссылок

  1. PageRank мертв !? Немного истории это то, что нам нужно ...
  2. Как получить ваш текущий внутренний дистрибутив PageRank?
  3. Практический анализ PageRank
  4. Альтернативы ручным вычислениям PageRank

Большинство маркетологов знают о PageRank, потому что использует его как одну из своих основных концепций для определения ценности внешних (входящих) ссылок. В течение многих лет это значение (число от 0 до 10) использовалось для сравнения важности веб-сайта, качества ссылок и потенциала рейтинга домена или отдельной страницы.

В течение многих лет маркетологи могли получать эти значения PageRank через API или собственную панель инструментов Google, но с начала 2013 года Google уделял меньше внимания распространению этих данных. В декабре 2013 года состоялось последнее публичное обновление серверов «Панель инструментов PageRank».

«PageRank - это то, что мы не обновляли уже больше года, и мы, вероятно, не собираемся обновлять его снова, по крайней мере, версию панели инструментов».

«PageRank - это то, что мы не обновляли уже больше года, и мы, вероятно, не собираемся обновлять его снова, по крайней мере, версию панели инструментов»

PageRank мертв !? Немного истории это то, что нам нужно ...

SEO объявил PageRank мертвым, поскольку маркетологи пытались сделать то же самое с SEO в целом. Чтобы понять, почему я все еще использую PageRank в качестве метрики во время моей работы по SEO, мы должны вернуться к основам. PageRank ( Википедия ) - алгоритм, разработанный в 1999 году Ларри Пейджем, по совпадению один из основателей Google. Целью алгоритма является измерение относительной важности в наборе связанных документов, например, в World Wide Web.

WWW - это всего лишь один набор документов, но алгоритм может применяться практически к любому набору документов, которые ссылаются друг на друга. Исследование, приведшее к PageRank, находилось под сильным влиянием более ранних исследований по анализу цитирования. Подумайте о научных работах, которые часто основаны на предыдущих, исторических исследованиях и все связаны друг с другом. Используя PageRank, мы можем определить наиболее влиятельного автора или научного автора путем расчета.

Twitter использует PageRank для создания своих списков персональных рекомендаций для пользователей. Каждая ссылка считается как голос, так же как ссылки учитываются как голоса за определенный домен или страницу. Google публично использовал его для оценки доменов и страниц, не только на основе всей сети в виде набора документов, но и с использованием небольших наборов данных, таких как набор URL-адресов из одного конкретного домена, что привело к внутреннему распространению PageRank.

В первые годы влияние внешней и внутренней ссылки было весьма ограниченным, но с 2003-2004 гг. Это стало более актуальным и очень быстрым, если с ним правильно обращаться. Как только SEO обнаружил это, «Скульптура PageRank» родилась. Используя элементы nofollow, обманывая Google, чтобы он не учитывал определенные ссылки, веб-мастера оптимизировали внутреннее распределение значений ссылок. Добавив тег nofollow к конкретным сторонним ссылкам, таким как контактные формы, страницы входа и отказ от ответственности, вы смогли избежать того, что страницы получали какой-либо PageRank. Я никогда не видел четких доказательств того, что это работает, с точки зрения ценности ссылки.

Эффективное руководство сканеров Google через ваш веб-сайт, оптимизация бюджета сканирования дает лучшие результаты, потому что Google не будет переходить по ссылкам nofollow. В 2008 Google сделал обновление исходному алгоритму PageRank для предотвращения PageRank Sculpting:

Так что же происходит, когда у вас есть страница с «десятью баллами PageRank» и десятью исходящими ссылками, и пять из этих ссылок не разрешены? «… Первоначально пять ссылок без nofollow имели бы две точки PageRank каждая (по сути, nofollowed ссылки не учитывались в знаменателе при делении PageRank на конечную степень страницы). Более года назад Google изменил, как работает PageRank, так что пять ссылок без nofollow будут проходить по одной точке PageRank.

Использование внутренних ссылок nofollow буквально испаряет PageRank. Скажите спасибо всем этим умным SEO-специалистам, которые посоветовали вам добавить ссылки nofollow на ваш сайт. 🙂 Единственный способ создать PageRank - просто не размещать ссылки на определенные страницы или скрывать ссылки от Google. Положите отказ от ответственности, например, формы входа в etecetera в динамическом AJAX-поповере. Использование JavaScript, чтобы скрыть ссылки в меню большого поиска. Поскольку Google становится все умнее и умнее, я ожидаю, что они смогут отображать и понимать большинство сценариев на основе JavaScript в течение года или двух. Тем не менее, оптимизация архитектуры вашего сайта и внутренних ссылок по-прежнему является ценным инструментом для повышения рейтинга SEO!

Если вы хотите узнать больше о проблемах Google при расчете PageRank для всей сети, взгляните на Лекции по технологии Google Stack 1: Введение в PageRank , Эта сессия была также записано ,

Как получить ваш текущий внутренний дистрибутив PageRank?

PageRank - это алгоритм, который дает оценки, основанные на отношениях между документами: в данном случае внутренние ссылки. Первый шаг - получить все URL-адреса на веб-сайте, включая все внутренние ссылки. Мой любимый инструмент для этого - ScreamingFrog который является дешевым и масштабируемым.

Просканируйте веб-сайт (нужны только URL-адреса) и экспортируйте с помощью функции экспорта All Inlinks. Тема эффективного сканирования веб-сайта без создания непреднамеренной DDOS-атаки стоит отдельной статьи, но если вы хотите протестировать несколько сканеров, Алейда Солис сделала хороший список на веб-сайте The Marketers Toolbox: SEO сканеры !

После того, как у вас есть все ваши внутренние ссылочные данные, вам нужен инструмент для их расчета или визуализации. До сих пор я считал Gephi самым надежным и интуитивно понятным инструментом для использования. Посмотрите видео ниже для получения подробных инструкций о том, как преобразовать ваш внутренний лист данных ссылок в визуальный график распределения PageRank; Программное обеспечение работает аналогично для Windows и Mac:

На приведенном ниже графике я сопоставил все внутренние ссылки, красные узлы имеют наибольшее значение PageRank, а желтые - наименьшее. Как вы можете видеть, веб-сайт буквально разделен на 7 групп страниц категорий и продуктов без каких-либо реальных перекрестных ссылок, что приводит к равномерному распределению стоимости ссылок. В идеальном мире вам нужны страницы с таргетингом на наиболее конкурентоспособные ключевые слова, чтобы получить максимум PageRank:

В идеальном мире вам нужны страницы с таргетингом на наиболее конкурентоспособные ключевые слова, чтобы получить максимум PageRank:

Если у вас есть тяжелый ПК или сервер, и ваш набор данных не слишком велик для Excel, но у вас хорошие математические навыки, вы можете попробовать использовать Excel для перебора дистрибутива PageRank. Это выполнимо для обычного веб-сайта и дает вам хорошее представление о том, что происходит, когда вы добавляете или удаляете сидячую ссылку в нижнем колонтитуле вашего сайта.

Это выполнимо для обычного веб-сайта и дает вам хорошее представление о том, что происходит, когда вы добавляете или удаляете сидячую ссылку в нижнем колонтитуле вашего сайта

Более подробную информацию о расчете PageRank и использовании Excel можно найти в Математика доставляет! Google PageRank (pdf) ,

Если вы больше разбираетесь в сценариях с языком программирования, таким как PHP, сценарий, представленный в этом Stackoverflow тема могу вам помочь Я пробовал это на нескольких веб-сайтах, но это стоит вам некоторой серверной емкости, так как он должен зацикливаться до тех пор, пока значения PageRank не станут достаточно стабильными, что обычно составляет около 30-50 итераций на набор данных.

Если вы используете R, попробуйте этот пакет: page.rank {igraph} , Хотите пойти на большие сеты? Программист Наюки делится своими Java-программами, которые он использовал для расчета внутреннего PageRank для Википедии: Вычисление внутренних PageRanks Википедии , вычисляя значения через 11 миллионов страниц. Идеально подходит для анализа крупных платформ электронной коммерции. Результаты, по меньшей мере, интересны, так как страница Соединенных Штатов, являющаяся третьей наиболее взаимосвязанной страницей, посетите ранее упомянутую страницу, чтобы просмотреть интерактивную иллюстрацию.

Результаты, по меньшей мере, интересны, так как страница Соединенных Штатов, являющаяся третьей наиболее взаимосвязанной страницей, посетите ранее упомянутую страницу, чтобы просмотреть интерактивную иллюстрацию

Практический анализ PageRank

Рассчитав распределение PageRank веб-сайта и индивидуальные значения URL, вы можете легко ответить на следующие вопросы:

  • Каков эффект добавления или удаления ссылки в моем главном меню
  • Что будет делать добавление элемента breadcrumb к распределению значений ссылок?
  • Сколько стоит ссылка на главную страницу, если на моем сайте 500 000 страниц?
  • Что будет с распределением PageRank моих доменов, если я добавлю 100 000 страниц продукта?
  • Получают ли страницы категорий внутри интернет-магазина достаточно внутренних ссылок по сравнению со страницами со статическим содержимым?
  • Может ли плохое внутреннее распространение привести к тому, что Google не сможет проиндексировать все мои страницы?
  • Использование структурированных данных для разметки данных о товаре (запас, предложение, диапазоны цен и т. Д.) Может быть затруднено из-за задержек. Оптимизируйте внутренние ссылки, чтобы они направлялись на страницы, которые вы хотите, чтобы Google сканировал в первую очередь и чаще всего.

Запуск нового веб-сайта или переход на новую платформу?
Перед запуском нового веб-сайта я всегда буду пытаться создать текстовую версию новой платформы, включая все внутренние элементы ссылок, которые будут присутствовать на новой платформе. Сделав это, я вижу, как будет выглядеть распределение PageRank по сравнению со старым сайтом.

Используя только текстовое решение, управляемое базой данных, его легко масштабировать и настраивать перед запуском еще одного сканирования и пересчета соотношений между конкретными страницами, которые вы хотите иметь ранжирование. Объедините этот процесс с историческими данными о производительности SEO, такими как рейтинги, трафик, объем поиска, пользовательские метрики, и добавьте в систему некоторые алгоритмы машинного обучения, и вы станете самым умным и быстрым SEO-ниндзя (не фанатом использования этого типа характеристик, но настоящий, это классная штука!) вокруг офиса!

Альтернативы ручным вычислениям PageRank

Начиная с запуска облачных сканеров, вы можете использовать несколько опций, которые генерируют похожие показатели:

1. DeepCrawl : этот британский стартап использует DeepRank: «DR - это измерение веса внутренней ссылки, рассчитанное аналогично основному алгоритму Google PageRank. Каждая внутренняя ссылка сохраняется и изначально имеет одно и то же значение. Затем ссылки повторяются несколько раз, и сумма всех значений ссылок, указывающих на страницу, используется для расчета их соответствующего DeepRank. Этот процесс дает числовое значение от 1 до 10, что позволяет вам определить страницы и проблемы, которые указывают на наибольшее влияние на ваш сайт ».
2. Botify : этот французский инструмент фактически рассчитывает три метрики для каждого URL для вас: внутренний PageRank, внутренняя позиция PageRank и необработанный внутренний PageRank
3. Onpage.org : Немецкий инструмент и теперь, наконец, доступный на английском, использует традиционную концепцию PageRank

Получайте удовольствие от визуализации и оптимизации вашей внутренней структуры ссылок!

Как получить ваш текущий внутренний дистрибутив PageRank?
Сколько стоит ссылка на главную страницу, если на моем сайте 500 000 страниц?
Что будет с распределением PageRank моих доменов, если я добавлю 100 000 страниц продукта?
Получают ли страницы категорий внутри интернет-магазина достаточно внутренних ссылок по сравнению со страницами со статическим содержимым?
Может ли плохое внутреннее распространение привести к тому, что Google не сможет проиндексировать все мои страницы?
Запуск нового веб-сайта или переход на новую платформу?