Общее правило:
Из анкора Яндекс учитывает только первый пассаж.
При этом правила разбиения текстов на пассажи у Яндекса универсальные, и влияют они не только на учет анкоров, но и на находимость по многословным запросам с переколдовкой &.
Запятая считается разделителем наподобие пробела.
Пробел - это чисто разделитель между словами. Но со знаком препинания перед ним (разделяющим пассаж) - соответственно в комплексе дает два разных пассажа.
Элементы меню, к примеру, по логике построения контента можно считать отдельными предложениями, хотя они и не оканчиваются точкой. Но случается (из-за особенностей верстки), что они попадают в один пассаж.
Пока конструкция вида
слово1 & слово2
дает результат - значит, они находятся в одном пассаже.
То, что войдет в пассаж, зависит от того, какая будет переколдовка. Она часто бывает разная, и для запросов А Б тоже - варианты: от "подряд" до "в пределах документа".
Пассажи — непересекающиеся отрезки, на которые Яндекс разбивает документ (в том числе его анкор-лист) и которые характеризуются рядом важных свойств.
Важные свойства пассажа:
(i) по пассажам рассчитывается (текстовая) релевантность документа (см. «Яндекс на РОМИП»);
(ii) внутри пассажа определено междусловное расстояние (оператор &/(расстояние));
(iii) между пассажами в теле документа определено межпассажное расстояние (оператор &&/(расстояние));
(iv) два слова из одного пассажа могут быть найдены (?=подсвечены) по запросу «слово1 & слово2» (следствие из (ii));
(v) два слова из разных пассажей не могут быть найдены (?=подсвечены) по запросу «слово1 & слово2» (следствие из (ii));
(vi) только первый пассаж, входящий в текст ссылки, может попадать в анкор-лист акцептора. (с) Иванов
Список свойств можно расширять и дополнять. Свойства пассажа могут (с определенными оговорками) использоваться при анализе как признаки пассажа.
Разбиение на пассажи тайтла происходит точно так же, как и разбиение ссылки.
Стоп-символами в анкоре ссылки являются ".", "!", "?", ";", в том случае, если после них идет предложение ТОЛЬКО с большой буквы, в противном случае на пассажи не разобьет.
Ссылки в тему:
http://www.blogovo.ru/archives/12
Интересно мнение Михи Кузьмина: "что мы понимаем под пассажем, запросонезависимо. Разбивается от первого слова по разделителям пассажей. При индексации.
Затем, при использовании операторов типа &(x y), используеццо именно оно. При && и так понятно."
No comments:
Post a Comment