Все его используют, но мало кто знает, как он работает. Google PageRank, это один из важнейших для веб-разработчиков параметров.
Поиск среди миллиардов существующих и миллионов создаваемых каждый день страниц, задача более сложная, чем вы можете сразу представить. PageRank, только один из сотен факторов, используемых Google для улучшения качества поиска. Но как он работает, и какие факторы на него влияют, а какие нет, и, что мы знаем о PageRank?
В этой статье мы излагаем только факты.
Последнюю неделю мы рассмотрели множество фактов и предположений, которые показались нам реалистичными. Кроме того, мы собрали некоторые материалы академические материалы по поиску и 16 полезных инструментов для работы с PageRank.
Наиболее важные факты кратко описаны в начале статьи.
Как работает PageRank?
- PageRank один из многочисленных методов используемых Google для определения релевантности и важности страницы.
- Google интерпретирует ссылку со страницы A на страницу B как голос A в пользу B, конечно учитывается не только количество голосов, но и качество голосующих страниц.
- PageRank основан на количестве входящих ссылок, но не только на нем, релевантность и качество тоже важны.
- PR( A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)).
- Не все ссылки одинаково влияют на PageRank.
- Если на странице с PR8 есть только одна ссылка, то сайт, на который она ссылается, получит весь PR который она может передать, если же ссылок 100 то каждая ссылка будет передавать только часть этого PR.
- Плохие входящие ссылки не влияют на PR.
- В PR учитывается время существования сайта, релевантность входящих ссылок и время их существования.
- При расчете PR контент не учитывается.
- PR рассчитывается не для сайта в целом, а для каждой страницы в отдельности.
- Важна каждая входящая ссылка, за исключением ссылок с забаненых сайтов.
- PR это не только целые значения от 0 до 10, это вещественное число.
- Достичь каждого следующего уровня PR все сложнее, предположительно используется логарифмическая шкала.
- PR пересчитывается постоянно, но данные для тулбара обновляются раз в несколько месяцев.
- Google старается найти страницы солидные и релевантные одновременно.
Факторы, влияющие на PageRank
- Частые обновления сайта не увеличивают PR автоматически.
- Высокий PR не гарантирует высокие позиции в результатах поиска.
- Каталоги DMOZ и Yahoo! не увеличивают PR автоматически.
- .edu и .gov сайты не увеличивают PR автоматически.
- Внутренние страницы не обязательно имеют меньший PR чем главная.
- Ссылки с сайта Wikipedia не увеличивают PR автоматически.
- Ссылки с атрибутом nofollow не влияют на PR.
- Эффективные внутренние ссылки влияют на PR.
- Ссылки с тематических сайтов влияют сильнее.
- Текст, используемый в ссылке, часто может быть важнее, чем PR ссылающейся страницы.
- Исходящие и входящие ссылки на качественные тематические сайты положительно влияют на PR.
- Несколько одинаковых ссылок с одной страницы считаются за одну.
- Сайт может быть забанен за ссылки на забаненные сайты.
1.1 Что такое PageRank?
- PR это только один из методов используемых Google для определения релевантности и важности страницы. [PageRank Explained Correctly]
- Google использует множество факторов для ранжирования страниц, PageRank один из лучших. PR отражает два важных момента, как много страниц ссылаются на данную и какого уровня страницы на нее ссылаются. Пять шесть ссылок с таких сайтов как www.cnn.com или www.nytimes.com, могут быть более полезны, чем гораздо большее количество ссылок с менее солидных сайтов. [Google Librarian Central]
- PR может отражать только приблизительное качество страницы, но никак не связан с ее тематической релевантностью, которую можно определить только учитывая контекст ссылок, и такие факторы как плотность ключевых слов, заголовок страницы и т.п. [PageRank: An Essay]
1.2 Как работает PageRank?
- Никто точно не знает, как Google рассчитывает PR. [Google PageRank Explained]
- PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)). Так выглядит примерная формула расчета PR, где t1-tn страницы, ссылающиеся на A, С(tn) количество исходящих ссылок на соответствующий странице, d коэффициент обычно равный 0.85.
- Можно предположить, что PR вычисляется по формуле PR = 0.15 + 0.85 * (часть PR каждой ссылающейся страницы передаваемая нашей). Количество PR, которое страница может использовать, чтобы голосовать за другие, чуть меньше чем ее собственный PR, а точнее 0.85 * PR, это количество и делиться между страницами, на которые она ссылается. [Google’s Page Rank]
- Алгоритм вычисления PR, основан на распределении собственного PR страницы, между страницами на которые она ссылается. К примеру, если на странице с PR8 есть только одна ссылка, то страница, на которую она ссылается, получит весь доступный PR, но если на этой странице 100 ссылок, то каждая из них получит только сотую часть доступного PR. [The Importance of PageRank]
- Вследствие, такого алгоритма вычисления PR, ссылка со страницы с PR4 и 5 внешними ссылками, эффективнее ссылки со страницы с PR8 и 100 внешних ссылок. PR ссылающихся страниц важен, но не менее важно и количество исходящих ссылок, которое они содержат, чем больше исходящих ссылок тем меньше PR перейдет каждой. [Google’s Page Rank]
- PR использует входящие ссылки как индикатор важности страницы. Google интерпретирует ссылку со страницы A на страницу B как голос страницы A в пользу страницы B. Учитывается не только количество голосов, но и качество голосующих страниц. Чем выше PR страницы, тем большее значение имеет ее голос. [Google: Technology]
- Не все ссылки одинаково полезны. Чем выше PR ссылающейся страницы, тем больший PR она передает, но нужно учитывать и то, что этот PR делиться в равной степени между всеми страницами на которые она ссылается. Поэтому ссылка со страницы с PR4 и единственной исходящей ссылкой, может дать больше чем ссылка со страницы с PR5 и 100 исходящих ссылок. Типичный пример всем известные миллионодоларовые главные страницы, такая страница с PR7 и сотнями исходящих ссылок, несмотря на свою важность, передает другим страницам незначительный PR. [Google PageRank Explained]
- Каждый следующий уровень PR достигается значительно сложнее предыдущего. При вычислении PR используется логарифмическая шкала, это значит, что для перехода с PR0 к PR1 требуется один шаг, несколько труднее набрать PR3, еще труднее PR4, и значительно труднее PR5. [Google Page Rank FAQ]
[via einfach-persoehnlich] - PR вычисляется не для сайта в целом, а для каждой отдельной страницы и рекурсивно связан с PR страниц которые на нее ссылаются. [The Page Rank algorithm]
- Google комбинирует PR со сложными техниками текстового поиска, анализируются многие аспекты содержимого страницы и ссылающихся на нее страниц, чтобы найти страницы лучше других, соответствующие запросу пользователя. [What Is Google PageRank?]
- PR пересчитывается постоянно, но данные для тулбара обновляются раз в несколько месяцев, новым сайтам присваивается PR0. [Google PageRank Explained]
- PR это не только целые значения от 0 до 10, PR вещественное число. Правильно думать о PR как о вещественном числе, потому что при внутренних вычислениях мы используем множество градаций, а не только значения от 0 до 10 отображаемые в тулбаре. [Matt Cutts]
- Робот не анализирует сайты мгновенно. Часто необходимо два полных апдейта чтобы все входящие ссылки были обнаружены, засчитаны и отображены как входящие ссылки. [Google FAQ]
1.3 Факторы, влияющие на PageRank
- Важна каждая входящая ссылка, за исключение ссылок с забаненных сайтов. PR это своеобразная система голосования, каждая ссылка на страницу это голос в ее пользу. Страницы с высоким PR считаются более важными, и их голоса в некоторых случаях имеют большее значение, но в основном, чем больше входящих ссылок, тем лучше. [Google PageRank FAQ]
- Добавление новых страниц может уменьшить PR. Этот эффект заключается в том, что суммарный PR сайта возрастает, но одна или нескольких старых страниц теряют часть PR, за счет чего новые его получают, чем больше добавлено страниц тем больше PR теряют существующие. На крупных сайтах этот эффект незаметен, но на малых его иногда можно наблюдать. [PageRank Explained]
- Уменьшение PR. PR страницы может уменьшиться из-за исчезновения некоторых важных ссылок, которые передавали ей PR, или падения PR ссылающихся на нее страниц. [Google PageRank FAQ]
- Заголовки ( h1, … , h6) и теги strong важны, но не влияют на PR. Используйте мета-теги, заголовки и теги b, strong, но так чтобы контент оставался читабельным и полезным. Обращайте внимание на текст окружающий ключевые слова, поисковики все лучше работают с семантикой, поэтому контекст ключевых слов очень важен.
- Большое значение имеет эффективность внутренней структуры сайта. Страницы на сайте должны быть связаны как можно более простым способом, в идеале не должно быть страниц в более чем трех кликах от главной. [Let Google’s Algorithm Show You The Traffic]
- Ссылки с и на тематические сайты с высоким PR очень важны. Чем ближе тематика страниц, тем больше PR передает ссылка. Ссылки на уважаемые сайты с близкой тематикой показывают поисковым машинам, что сайт полезен для посетителей, это не всегда верно для сайтов, которые существуют уже несколько лет и имеют высокий рейтинг в Google. Ссылаясь только на качественные сайты, можно получить некоторое преимущество перед конкурентами. [Let Google’s Algorithm Show You The Traffic, FAQ]
- Важен текст ссылки. Чем более специфичен текст ссылки тем лучше Google может связать ее с запросами пользователей.
- Ссылочные фермы (линкопомойки) пенализируются. Google заинтересован в страницах содержащий менее 100 исходящих ссылок, страницы с большим количеством ссылок считаются ссылочными фермами и пенализируются. [Google FAQ]
- Очень важны входящие ссылки с популярных сайтов. Если на страницу ссылаются страницы с высоким PR она получает часть их репутации.
- Сайт может быть забанен, если ссылается на забаненные сайты. Будьте очень осторожны с исходящими ссылками, не ссылайтесь на подозрительные сайты (линкопомойки, забаненные сайты и т.д.), Google может пенализировать ваш сайт за такие ссылки, всегда проверяйте PR сайтов на которые ссылаетесь.
- Мошенничество наказывается пенализацией PR и может привести к бану. Скрытый текст, редиректы, клоакинг, автоматизированный обмен ссылками и другие действия, противоречащие Google’s quality guidelines, могут привести к бану сайта в Google.
- Google учитывает время существования сайта, релевантность входящих ссылок, и время их существования, если входящая ссылка не релевантна она не будет давать много PR.
- Миф: чем выше PR тем выше позиция в результатах поиска. Конечно, страницы с высоким PR в результатах поиска расположены выше, чем конкуренты с меньшим PR, но нельзя забывать, что Google учитывает контекст входящих ссылок, и только те ссылки, которые связаны со словами в запросе позволяют занять высокое место в результатах поиска по этому запросу. [Top 10 Google Myths Revealed]
- Ссылки с популярных сайтов схожей тематики влияют на PR гораздо сильнее, чем ссылки с других сайтов. Конечно, ссылки с сайтов другой тематики тоже влияют на PR, но не так сильно. [What Is Page Rank?]
- У различных страниц сайта может быть разный PR. Поисковые машины индексируют страницы, а не сайты, поэтому у каждой страницы есть свой PR. [What Is Page Rank?]
- Текст ссылки, часто более важен, чем PR ссылающейся страницы. [What Is Google PageRank?]
- Если нужно найти важные и релевантные страницы, с которых стоит получить ссылки, забудьте о PR, используйте ранжирование в результатах поиска. Введите в поиск слова, по которым хотите продвигаться, в ответ получите страницы, которые Google считает наиболее важными и лучше всего отвечающими такому запросу. [What Is Google PageRank?]
1.4 Факторы, не влияющие на PR
- Частые обновления содержания не увеличивают PR автоматически. Зато робот будет чаще посещать ваш сайт, к тому же больше вероятность, что на вас будут ссылаться.
- Контент не учитывается при расчете PR, но учитывается при поиске. [Google PageRank]
- Высокий PR не гарантирует, высоких позиций в результатах поиска, для любых запросов, иначе сайты с PR10, такие как Adobe, всегда занимали бы первые позиции в выдаче, а этого не происходит. [What Is Google PageRank?]
- Ссылки с сайта Wikipedia не увеличивают PR автоматически. Wikipedia использует nofollow, чтобы показать поисковикам, что эти ссылки не нужно учитывать. [A Survival Guide to SEO & Wikipedia]
- Размещение в DMOZ и Yahoo! не дают сайту никаких бонусов PR. Google использует DMOZ.org, для работы своего каталога, и в связи с этим фактом возникли предположения, что размещение сайта в DMOZ дает некоторый прирост PR, на самом деле этот прирост точно такой же как и от любой другой входящей ссылки. Но не стоит забывать, что данные DMOZ используют сотни сайтов. [Top 10 Google Myths Revealed]
- Внутренние страницы не обязательно имеют PR ниже, чем главная, в зависимости от популярности сайта внутренние страницы могут иметь и более высокий PR.
- Мета-теги не увеличивают PR. Google иногда использует мета-тег description, при индексации сайта, он может быть полезен если страница состоит преимущественно из графики, но конечно не влияет на PR. [10 Google Myths Revealed]
- .edu и .gov сайты не имеют преимуществ в PR. Нет никаких доказательств того, что ссылки с ODP, .edu или .gov дают какие-то особые преимущества, просто эти сайты обычно имеют высокий PR, потому что многие на них ссылаются. [A Google Myth Busted]
- Ссылки с атрибутом nofollow не влияют на PR. Google использует значение nofollow чтобы создатели сайтов могли использовать ссылки которые не должны учитываться при расчете PR, эти ссылки не являются «голосом» в пользу страницы на которую они ссылаются. [Wikipedia: PageRank]
- Несколько одинаковых ссылок с одной страницы считаются за одну. Достаточно разумно, что страница может голосовать за другую только один раз. [PageRank FAQ]
- Ссылки страницы на саму себя не увеличивают PR. Понятно, что страница не должна голосовать за себя, и такие ссылки нельзя учитывать. [PageRank Explained]
- Плохие входящие ссылки не влияют на PR. Не важно, откуда на страницу размещаются входящие ссылки, сайты не пенализируются за то, что на них ссылаются забаненные сайты или линкопомойки. [Google PageRank]
- Висячие ссылки не влияют на PR. Висячие ссылки — это ссылки на страницы, не имеющие исходящих ссылок, их достаточно много и они разрушают модель, поэтому исключены из расчета PR. [PageRank Paper]
2.1 Теория Google PageRank и ее научные основания
- Обзор Google PageRank
Расчет PageRank, реализация PageRank, входящие ссылки, исходящие ссылки, количество страниц, распределения PageRank, дополнительные факторы и другое. - Линейная алгебра на службе Google
Анализ формулы PageRank хорошая тема для курса линейной алгебры. - Вероятностное комбинирование ссылочной и контентной информации в PageRank.
- Тематический PageRank
- Метод ранжирования узлов в связанной базе данных
- Как Google находит иголку в стоге сена.
Математические основания Google PageRank. Девид Остин, университет штата Grand Valley - Крупномасштабная гипертекстовая поисковая машина
Слайды. Лари Пейдж - Wikipedia: PageRank
Математические основания Google PageRank
3.1 Инструменты и сервисы для работы с PageRank
- PageRank Search
Упорядочивает результаты поиска по PR. - Google PageRank Inspector
Скрипт, выводящий PR всех страниц сайта. Новые страницы, на которые ссылаются страницы с высоким PR, могут быть проиндексированы быстрее и иметь лучшие позиции в результатах поиска. - Google’s PageRank - Calculator
Позволяет рассчитывать распределение PR между страницами.
- Webmastereyes, Visual PageRank View
Отображают страницу указывая PR каждой ссылки, отмечают nofollow и внешние ссылки. - Smart PageRank
Проверяет PR во многих датацентрах, есть возможность уведомления об изменении PR по email. - Google PageRank Notifier
Уведомления об изменении PR на email, использует Google Toolbar «API», PR проверяется каждый час. - Google PageRank™ Checker (необходима регистрация)
Мониторинг PR сайтов с помощью RSS и уведомления об его изменении на email. - Dig PageRank
Проверяет PR на более чем 100 датацентрах. - Live PageRank Check
Текущее значение PageRank можно использовать как индикатор значения которое будет отображено когда Google экспортирует значения в Google Toolbar. Live PageRank показывает текущее значение PR в индексах Google, это значение постоянно обновляется и только раз в три месяца экспортируется для отображения в Google Toolbar. - Page Rank Widget для Mac OS
Небольшой виджет отображающий PR.
- Google PageRank Prediction
Инструмент анализирует популярность сайта и пытается предсказать будущее значение PR. More Page Rank Tools. - PageRank Checker
Отображает PR ссылающихся на сайт страниц. - PageRank Overlay (PR Mapper)
Посещайте сайт конкурентов и смотрите PR каждой ссылки одновременно. Доступен и в виде расширения Firefox. - PageRank Decoder (Demo)
Этот маленький инструмент не сильно отличается от других, отображающих PR, тем не менее, позволяет собирать сайты в визуальную сеть и соединять их с помощью стрелок, перемещать как карточки, соединять или удалять в корзину.
- Page Rank Export List History
Даты экспорта PR в Google Toolbar. - Google Ranking Factors
Факторы ранжирования страниц в Google.
3.2 Инструменты и сервисы Google
- Google Quality Guidelines
Это руководство упоминает множество форм обмана или мошенничества, приводящих к пенализации или бану сайта, конечно даже если вы будете использовать другие недобросовестные методы, негативная реакция Google гарантирована. - Проверьте, включен ли ваш сайт в базу данных Google
- Форма запроса на повторное включение сайта в базу Google
Запрос на повторное включение в базу Google сайта однажды нарушившего правила Google. - Google Tools
Исчерпывающий обзор инструментов Google на Dmoz.org.