Розрахунок індексу видимості SISTRIX

Поряд з Xovi, інструмент SISTRIX є найбільш широко використовуваною програмою аналізу в Німеччині в області SEO. Індекс видимості зарекомендував себе як квазістандарт для видимості сторінки в пошуку Google. Параметри, які входять до його розрахунку , пояснюються , наприклад , тут і тут, і тут, і тут, і тут , але точна формула розрахунку офіційно не опублікована. Нижче наведено результати мого шестимісячного особистого дослідження, які не претендують на повноту чи точність.


З

  • \(A_l\): Набір ключових слів SISTRIX (відсортована кількість чітко визначених ключових слів для певної країни, набір включає постійну - на основі трафіку на основі середнього за 12 місяців - і меншу, різну частку)
  • \(\vert A_l \vert\) : Товщина \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (статус: 01.10.2021)
  • \(k \in A_l\): Ключове слово вимкнено \(A_l\)
  • \(u\): URL-адреса (інтерпретується як домен, субдомен, каталог, окрема URL-адреса, залежно від формату)
  • \(r_{uklgt}\) : Рейтинг URL-адреси \(u\) у результатах звичайного пошуку пошукової системи Google за ключовим словом \(k\) у країні \(l\) на типі пристрою \(g\) у момент \(t\)
  • \(s_{klgt}\) : Обсяг пошуку (середня кількість пошукових запитів на місяць з даними від SISTRIX, а не з Google Keyword Planner , але, згідно з нашим власним твердженням, накопичений від понад десятка переважно зовнішніх дилерів даних) для ключового слова \(k\) im Країна \(l\) на пристрої типу \(g\) у момент часу \(t\)
  • \(c_{uklgt}\) : приблизні кліки за URL-адресою \(u\) для ключового слова \(k\) у країні \(l\) на пристрої типу \(g\) на момент \(t\)
  • \(l \in L=\{DE;...;JP\}\) : Країна з \(\vert L \vert=30\) (станом на: 01.06.2021)
  • \(g\in\{D;M\}\): Тип пристрою (настільний/мобільний)
  • \(t\): Час (дата 00:00:00)
  • \(S_{ulgt}\) : індекс видимості SISTRIX URL-адреси \(u\) країни \(l\) на пристрої типу \(g\) на момент \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) значень \(W_S = \, \mathbb{Q}^{+}_{0}\)

є застосовним

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

з

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Ця формула була переважно отримана шляхом зворотного інжинірингу переважно за допомогою офіційного SISTRIX A PI . Основна ідея була: звести проблему до простих прикладів (знайти URL-адреси з позитивним індексом видимості лише з одним / двома / трьома / ... ключовими словами), а потім спробувати відтворити більш складні випадки.

Властивості індексу видимості:

  • До індексу видимості включені лише ключові слова «постійного набору ключових слів» із 1 000 000 ключових слів, а не ключові слова «повної бази даних», що постійно розширюється (яка адаптується до поточних подій та обставин), яка наразі містить 100 000 000 ключових слів (станом на жовтень 1-го 2021 року). Відповідні групи ключових слів можна легко відфільтрувати, вибравши значення в розділі "Дата" або встановивши значення, розширене на 0 в API. Стандартні дані або історичні дані є постійними і збираються щотижня з 2008 року, тепер щодня.
  • Звернення AMP не включаються в індекс видимості.
  • Бажано почати з аналізу в нещодавно створених країнах, таких як Румунія, Хорватія, Словенія та Болгарія, або зі створення власного індексу видимості . Причина цього полягає в тому, що SISTRIX несе з собою «історичний баласт» у таких країнах, як Німеччина, а це означає, що ключові слова, яким раніше надавалась більша вага, зараз використовуються навіть частіше, ніж можна було б очікувати, незважаючи на (також протягом тривалого часу). ) низький обсяг пошуку. Згідно з підтримкою, все це має поступово коригуватися і більше не видно в довгостроковій перспективі.
  • Всупереч моєму початковому припущенню, обсяг пошуку відіграє лише непряму роль в індексі видимості. Натомість вирішальне значення мають очікувані кліки. Зв’язок між обсягом пошуку та прогнозованими кліками в основному ґрунтується на приблизному намірі пошуку , який також вказується. Сама SISTRIX чітко вказує на це.
  • Очікувані кліки є рушійним фактором індексу видимості. Їх вплив обмежено вгору і вниз, так що індекс видимості завжди знаходиться між верхньою і нижньою межею і лінійним між ними.
  • Доступ до кліків неможливий через офіційний API, а лише через веб-інтерфейс або за допомогою ручного експорту CSV. В обох випадках значення округляються, але DOM перегляду «Ключові слова» також містить вихідні значення:
Окрім округлених значень, ви також можете знайти вихідні значення.

Наступну формулу також можна використовувати в Excel або Google Таблицях; Він обчислює індекс видимості для робочого аркуша, в якому кожен рядок містить ключове слово з його позицією в стовпці A і очікуваними кліками в стовпці B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Це дозволяє отримати наступні результати:

КраїнаПристрійДата\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)Url / каталог
SIМ.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIМ.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIМ.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIМ.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIМ.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIМ.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIМ.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIМ.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIМ.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIМ.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIМ.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIМ.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROМ.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
МІСТЕРМ.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGМ.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

Різниця між реальним і розрахованим значеннями викликана помилками округлення та обмеженим набором даних, на якому базується навчання моделі. Наведені вище твердження можуть послужити основою для подальшого уточнення формули і, наприклад, розрахунку співвідношення між обсягом пошуку та очікуваними кліками. Якщо вас цікавлять сценарії, які виникли під час мого дослідження, будь ласка, зв’яжіться зі мною .

Назад