Расчет индекса видимости SISTRIX

Наряду с Xovi, инструмент SISTRIX является наиболее широко используемой программой анализа в Германии в области SEO. Индекс видимости зарекомендовал себя как квазистандарт для видимости страницы в поиске Google. Параметры, которые включены в его расчет , объясняются, например , здесь, здесь, здесь, здесь и здесь , но точная формула расчета официально не публикуется. Ниже приведены результаты моего личного исследования в течение шести месяцев, которые не претендуют на полноту или правильность.


С участием

  • \(A_l\): Набор ключевых слов SISTRIX (отсортированное количество четко определенных ключевых слов для конкретной страны, набор включает постоянное - на основе трафика на основе среднего значения за 12 месяцев - и меньшее, переменная пропорция)
  • \(\vert A_l \vert\) : толщина \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (статус: 01.10.2021)
  • \(k \in A_l\): Ключевое слово отключено \(A_l\)
  • \(u\): URL-адрес (интерпретируется как домен, поддомен, каталог, отдельный URL-адрес, в зависимости от формата)
  • \(r_{uklgt}\) : Рейтинг URL \(u\) в \(r_{uklgt}\) результатах поиска поисковой системы Google по ключевому слову \(k\) в стране \(l\) по типу устройства \(g\) в момент \(t\)
  • \(s_{klgt}\) : объем поиска ( в среднем поисковых запросов в месяц с данными SISTRIX, а не из Planner Google по \(k\) ключевым словам , но, по нашему собственному утверждению, накопленное из более десятки в основном внешние дилеры данных) по ключевому слову \(k\) im Страна \(l\) на типе устройства \(g\) в момент \(t\)
  • \(c_{uklgt}\) : Расчетное количество кликов по URL \(u\) для ключевого слова \(k\) в стране \(l\) по типу устройства \(g\) в момент \(t\)
  • \(l \in L=\{DE;...;JP\}\) : Страна с \(\vert L \vert=30\) (по состоянию на: 01.06.2021)
  • \(g\in\{D;M\}\): Тип устройства (настольный / мобильный)
  • \(t\): Время (дата в 00:00:00)
  • \(S_{ulgt}\) : индекс видимости SISTRIX URL \(u\) страны \(l\) для типа устройства \(g\) в момент \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) значений \(W_S = \, \mathbb{Q}^{+}_{0}\)

применимо

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

с участием

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Эта формула была преимущественно извлечена путем обратного проектирования с преимущественно помощью официальной SISTRIX A PI . Основная идея заключалась в следующем: свести проблему к простым примерам (найти URL-адреса с положительным индексом видимости только с одним / двумя / тремя / ... ключевыми словами), а затем попытаться воспроизвести более сложные случаи.

Свойства индекса видимости:

  • В индекс видимости включаются только ключевые слова из «постоянного набора ключевых слов» из 1000000 ключевых слов, а не ключевые слова из постоянно расширяющейся «полной базы данных» (которая адаптируется к текущим событиям и обстоятельствам), которая в настоящее время включает 100000000 ключевых слов (по состоянию на октябрь 1 января 2021 г.). Соответствующие группы ключевых слов можно легко отфильтровать, выбрав значение в разделе «Дата» или установив значение, расширенное до 0 в API. Стандартные данные или исторические данные являются постоянными и собираются еженедельно с 2008 года, теперь ежедневно.
  • Обращения AMP не включаются в индекс видимости.
  • Желательно начать с анализа в недавно созданных странах, таких как Румыния, Хорватия, Словения и Болгария, или с создания собственного индекса видимости . Причина этого в том, что SISTRIX несет в себе «исторический балласт» в таких странах, как Германия, а это означает, что ключевые слова, которым раньше давали более высокий вес, в настоящее время используются даже больше, чем можно было бы ожидать, несмотря на (также в течение длительного времени ) низкий объем поиска. По словам поддержки, все должно постепенно корректироваться и больше не отображаться в долгосрочной перспективе.
  • Вопреки моему первоначальному предположению, объем поиска играет лишь косвенную роль в индексе видимости. Вместо этого решающее значение имеют ожидаемые клики. Связь между объемом поиска и предполагаемыми кликами в основном основана на предполагаемом поисковом намерении , которое также указывается. Сама SISTRIX прямо указывает на это.
  • Ожидаемые клики являются движущим фактором индекса видимости. Их влияние ограничено вверх и вниз, так что индекс видимости всегда находится между верхним и нижним пределом и линейным между ними.
  • К кликам нельзя получить доступ через официальный API, а только через веб-интерфейс или через экспорт CSV вручную. В обоих случаях значения округляются, но модель DOM представления «Ключевые слова» также содержит исходные значения.:
Помимо округленных значений, вы также можете найти необработанные значения.

Следующая формула также может использоваться в Excel или Google Таблицах; Он вычисляет индекс видимости для листа, в котором каждая строка содержит ключевое слово с его позицией в столбце A и ожидаемыми кликами в столбце B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Это позволяет получить следующие результаты:

СтранаУстройствоДата\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)URL / каталог
SIМ.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIМ.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIМ.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIМ.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIМ.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIМ.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIМ.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIМ.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIМ.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIМ.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIМ.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIМ.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROМ.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
МИСТЕРМ.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGМ.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

Разница между реальными и вычисленными значениями вызвана ошибками округления и ограниченным набором данных, на котором основано обучение модели. Приведенные выше утверждения могут служить основой для дальнейшего уточнения формулы и, например, расчета взаимосвязи между объемом поиска и ожидаемыми кликами. Если вас интересуют сценарии, возникшие в ходе моего исследования, пожалуйста, свяжитесь со мной .

Назад