Calculul indicelui de vizibilitate SISTRIX

Alături de Xovi, instrumentul SISTRIX este cel mai utilizat program de analiză din Germania în domeniul SEO. Indicele de vizibilitate s-a impus ca un cvasi-standard pentru vizibilitatea unei pagini în căutarea Google. Parametrii care sunt incluși în calculul său sunt, de exemplu , explicați aici și aici și aici și aici și aici , dar o formulă de calcul exactă nu este publicată oficial. Următoarele sunt rezultatele cercetării mele personale de șase luni, care nu pretind a fi complete sau corecte.


Cu

  • \(A_l\): Set de cuvinte cheie SISTRIX (cantitate sortată de cuvinte cheie bine definite pentru o anumită țară, setul include constant - pe baza traficului bazat pe o medie pe 12 luni - și mai mic, proporție variabilă)
  • \(\vert A_l \vert\) : Grosimea \(A_l\) cu, de \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (stare: 01.10.2021)
  • \(k \in A_l\): Cuvânt cheie dezactivat \(A_l\)
  • \(u\): URL (de interpretat ca domeniu, subdomeniu, director, URL individual, în funcție de format)
  • \(r_{uklgt}\) : Clasamentul adresei URL \(u\) în rezultatele căutării organice ale motorului de căutare Google pentru cuvântul cheie \(k\) în țara \(l\) pe tipul de dispozitiv \(g\) la momentul \(t\)
  • \(s_{klgt}\) : volumul de căutări (interogări medii de căutare pe lună cu date de la SISTRIX, nu din Google Keyword Planner , ci, conform propriei noastre declarații, acumulat de la peste o duzină de dealeri de date, în mare parte externi) pentru cuvântul cheie \(k\) im Țara \(l\) pe tipul de dispozitiv \(g\) la ora \(t\)
  • \(c_{uklgt}\) : clicuri estimate pe adresa URL \(u\) pentru cuvântul cheie \(k\) în țara \(l\) pe tipul de dispozitiv \(g\) la momentul \(t\)
  • \(l \in L=\{DE;...;JP\}\) : Țara cu \(\vert L \vert=30\) (începând cu: 01.06.2021)
  • \(g\in\{D;M\}\): Tip de dispozitiv (desktop/mobil)
  • \(t\): Ora (data la 00:00:00)
  • \(S_{ulgt}\) : indicele de vizibilitate SISTRIX al adresei URL \(u\) țării \(l\) pe tipul de dispozitiv \(g\) la momentul \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) valori \(W_S = \, \mathbb{Q}^{+}_{0}\)

este aplicabil

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

cu

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Această formulă a fost extrasă predominant prin inginerie inversă cu ajutorul preponderent al SISTRIX A PI oficial. Ideea de bază a fost: Reduceți problema la exemple simple (găsiți URL-uri cu un indice de vizibilitate pozitiv cu doar unul / două / trei / ... cuvinte cheie) și apoi încercați să reproduceți cazuri mai complexe.

Proprietățile indicelui de vizibilitate:

  • Doar cuvintele cheie din „setul permanent de cuvinte cheie” de 1.000.000 de cuvinte cheie sunt incluse în indexul de vizibilitate, nu cuvintele cheie ale „bazei de date complete” în continuă expansiune (care se adaptează evenimentelor și circumstanțelor curente), care cuprinde în prezent 100.000.000 de cuvinte cheie (În octombrie 1, 2021). Grupurile de cuvinte cheie respective pot fi filtrate cu ușurință selectând o valoare sub „Data” sau setând valoarea extinsă la 0 în API. Datele standard sau datele istorice sunt constante și sunt colectate săptămânal din 2008, acum zilnic.
  • Accesările AMP nu sunt incluse în indexul de vizibilitate.
  • Este recomandabil să începeți cu analiza în țări recent create precum România, Croația, Slovenia și Bulgaria sau prin crearea propriului indice de vizibilitate . Motivul pentru aceasta este că SISTRIX poartă cu sine „balast istoric” în țări precum Germania, ceea ce înseamnă că cuvintele cheie cărora obișnuiau li se acorda o ponderare mai mare sunt utilizate în prezent chiar mai mult decât s-ar aștepta, în ciuda (de asemenea pentru o lungă perioadă de timp). ) un volum scăzut de căutare. Potrivit suportului, totul ar trebui ajustat treptat și să nu mai fie vizibil pe termen lung.
  • Contrar presupunerii mele inițiale, volumul de căutare joacă doar un rol indirect în indicele de vizibilitate. În schimb, clicurile de așteptat sunt cruciale. Relația dintre volumul de căutare și clicurile estimate se bazează în principal pe intenția de căutare estimată , care este de asemenea indicată. SISTRIX însuși subliniază acest lucru în mod explicit .
  • Clicurile așteptate sunt factorul determinant din spatele Indexului de vizibilitate. Efectul lor este limitat în sus și în jos, astfel încât indicele de vizibilitate să fie întotdeauna între o limită superioară și inferioară și liniar între ele.
  • Clicurile nu pot fi accesate prin intermediul API-ului oficial, ci doar prin interfața web sau printr-un export manual CSV. În ambele cazuri, valorile sunt rotunjite, dar DOM-ul vizualizării „Cuvinte cheie” conține și valorile originale:
Pe lângă valorile rotunjite, puteți găsi și valorile brute.

Următoarea formulă poate fi folosită și în Excel sau Google Sheets; Acesta calculează indicele de vizibilitate pentru o foaie de lucru în care fiecare rând conține un cuvânt cheie cu poziția sa în coloana A și clicurile așteptate în coloana B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Acest lucru permite obținerea următoarelor rezultate:

ȚarăDispozitivData\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)Url / director
SIM.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIM.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIM.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIM.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIM.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIM.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIM.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIM.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIM.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIM.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIM.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIM.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROM.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
DOMNULM.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGM.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

Diferența dintre valorile reale și cele calculate este cauzată de erorile de rotunjire și de setul limitat de date pe care se bazează antrenamentul modelului. Declarațiile de mai sus pot servi ca bază pentru rafinarea în continuare a formulei și, de exemplu, pentru calcularea relației dintre volumul de căutare și clicurile așteptate. Dacă sunteți interesat de scenariile care au apărut în timpul cercetării mele, vă rugăm să nu ezitați să mă contactați .

Înapoi