Berekening van de SISTRIX-zichtbaarheidsindex

Samen met Xovi is de SISTRIX- tool het meest gebruikte analyseprogramma in Duitsland op het gebied van SEO. De zichtbaarheidsindex heeft zichzelf gevestigd als een quasi-standaard voor de zichtbaarheid van een pagina in Google Zoeken. De parameters die in de berekening worden meegenomen, worden bijvoorbeeld hier en hier en hier en hier en hier uitgelegd, maar een exacte berekeningsformule wordt officieel niet gepubliceerd. De volgende zijn de resultaten van mijn persoonlijke onderzoek van zes maanden, die niet beweren volledig of correct te zijn.


Met

  • \(A_l\): SISTRIX-zoekwoordenset (gesorteerd aantal vast gedefinieerde zoekwoorden voor een specifiek land, set bevat constant - op basis van verkeer op basis van een 12-maandsgemiddelde - en een kleiner, variërend percentage)
  • \(\vert A_l \vert\) : Dikte van \(A_l\) met \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (status: 01.10.2021)
  • \(k \in A_l\): Zoekwoord uit \(A_l\)
  • \(u\): URL (te interpreteren als domein, subdomein, directory, individuele URL, afhankelijk van het formaat)
  • \(r_{uklgt}\) : Ranking van de URL \(u\) in de organische zoekresultaten van de zoekmachine Google voor het trefwoord \(k\) in het land \(l\) op het apparaattype \(g\) op het moment \(t\)
  • \(s_{klgt}\) : Zoekvolume (gemiddelde zoekopdrachten per maand met gegevens van SISTRIX, niet van Google Keyword Planner , maar volgens onze eigen verklaring verzameld van meer dan een dozijn voornamelijk externe datadealers) voor het trefwoord \(k\) im Land \(l\) op het apparaattype \(g\) op tijdstip \(t\)
  • \(c_{uklgt}\) : Geschatte klikken op de URL \(u\) voor het trefwoord \(k\) in het land \(l\) op het apparaattype \(g\) op dat moment \(t\)
  • \(l \in L=\{DE;...;JP\}\) : Land met \(\vert L \vert=30\) (per: 01.06.2021)
  • \(g\in\{D;M\}\): Apparaattype (desktop / mobiel)
  • \(t\): Tijd (datum om 00:00:00 uur)
  • \(S_{ulgt}\) : SISTRIX zichtbaarheidsindex van de URL \(u\) het land \(l\) op het apparaattype \(g\) op dat moment \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) waarden \(W_S = \, \mathbb{Q}^{+}_{0}\)

is toepasbaar

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

met

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Deze formule werd voornamelijk geëxtraheerd door reverse engineering met voornamelijk de hulp van de officiële SISTRIX A PI . Het basisidee was: reduceer het probleem tot eenvoudige voorbeelden (zoek URL's met een positieve zichtbaarheidsindex met slechts één / twee / drie / ... trefwoorden) en probeer vervolgens complexere gevallen te reproduceren.

Eigenschappen van de zichtbaarheidsindex:

  • Alleen de trefwoorden van de "permanente trefwoordenset" van 1.000.000 trefwoorden worden opgenomen in de zichtbaarheidsindex, niet de trefwoorden van de steeds groter wordende "complete database" (die zich aanpast aan de actualiteit en omstandigheden), die momenteel 100.000.000 trefwoorden omvat (per oktober 1e, 2021). De respectievelijke trefwoordgroepen kunnen eenvoudig worden gefilterd door een waarde te selecteren onder "Datum" of door de waarde uitgebreid naar 0 in de API te zetten. De standaardgegevens of historische gegevens zijn constant en worden sinds 2008 wekelijks verzameld, nu dagelijks.
  • AMP-hits worden niet opgenomen in de zichtbaarheidsindex.
  • Het is raadzaam om te beginnen met de analyse in recent gecreëerde landen zoals Roemenië, Kroatië, Slovenië & Bulgarije of door uw eigen zichtbaarheidsindex te maken. De reden hiervoor is dat SISTRIX in landen als Duitsland "historische ballast" met zich meedraagt, waardoor trefwoorden die vroeger een hoger gewicht kregen, tegenwoordig nog meer worden gebruikt dan je zou verwachten, ondanks (ook al lange tijd ) een laag zoekvolume. Volgens de ondersteuning moet het geheel geleidelijk worden aangepast en op termijn niet meer zichtbaar zijn.
  • In tegenstelling tot mijn oorspronkelijke veronderstelling speelt het zoekvolume slechts een indirecte rol in de zichtbaarheidsindex. In plaats daarvan zijn de te verwachten klikken cruciaal. De relatie tussen zoekvolume en geschatte klikken is voornamelijk gebaseerd op de geschatte zoekintentie , die ook wordt aangegeven. SISTRIX wijst er zelf expliciet op .
  • De verwachte klikken zijn de drijvende factor achter de zichtbaarheidsindex. Hun effect is naar boven en beneden afgetopt, zodat de zichtbaarheidsindex altijd tussen een boven- en ondergrens loopt en lineair daartussen.
  • De klikken zijn niet toegankelijk via de officiële API, maar alleen via de webinterface of via een handmatige CSV-export. In beide gevallen zijn de waarden afgerond, maar de DOM van de "Trefwoorden" weergave bevat ook de originele waarden:
Naast de afgeronde waarden vindt u ook de ruwe waarden.

De volgende formule kan ook worden gebruikt in Excel of Google Spreadsheets; Het berekent de zichtbaarheidsindex voor een werkblad waarin elke rij een trefwoord bevat met de positie in kolom A en de verwachte klikken in kolom B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Hierdoor kunnen de volgende resultaten worden geproduceerd::

LandApparaatDatum\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)URL / map
SIM.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIM.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIM.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIM.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIM.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIM.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIM.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIM.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIM.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIM.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIM.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIM.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROM.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
DHRM.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGM.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

Het verschil tussen de reële en de berekende waarden wordt veroorzaakt door afrondingsfouten en de beperkte dataset waarop de training van het model is gebaseerd. Bovenstaande stellingen kunnen als basis dienen om de formule verder te verfijnen en bijvoorbeeld de relatie tussen zoekvolume en verwachte clicks te berekenen. Als je geïnteresseerd bent in de scripts die tijdens mijn onderzoek zijn ontstaan, neem dan gerust contact met me op .

Terug