Beregning af SIstrix synlighedsindeks

Sammen med Xovi er SISTRIX- værktøjet det mest udbredte analyseprogram i Tyskland inden for SEO-området. Synlighedsindekset har etableret sig som en kvasi-standard for synlighed af en side i Google-søgning. De parametre, der indgår i dens beregning, er for eksempel forklaret her og her og her og her og her , men en nøjagtig beregningsformel er ikke officielt offentliggjort. Følgende er resultaterne af mine seks måneder lange personlige undersøgelser, som ikke hævder at være fuldstændige eller korrekte.


Med

  • \(A_l\): SISTRIX søgeordssæt (sorteret mængde af fast definerede søgeord for et specifikt land, sæt inkluderer konstant - baseret på trafik baseret på et 12-måneders gennemsnit - og mindre, varierende andel)
  • \(\vert A_l \vert\) : Tykkelse af \(A_l\) med \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (status: 01.10.2021)
  • \(k \in A_l\): Søgeord slået fra \(A_l\)
  • \(u\): URL (skal fortolkes som et domæne, underdomæne, mappe, individuel URL, afhængigt af formatet)
  • \(r_{uklgt}\) : Rangering af URL'en \(u\) i søgemaskinens organiske søgeresultater Google for søgeordet \(k\) i landet \(l\) på enhedstypen \(g\) på tidspunktet \(t\)
  • \(s_{klgt}\) : \(s_{klgt}\) (gennemsnitlige søgeforespørgsler pr. måned med data fra SISTRIX, ikke fra Google Keyword Planner , men ifølge vores eget udsagn akkumuleret fra over et dusin, hovedsagelig eksterne dataforhandlere) for søgeordet \(k\) im Land \(l\) på enheden type \(g\) på tidspunktet \(t\)
  • \(c_{uklgt}\) : Anslåede klik på URL'en \(u\) for søgeordet \(k\) i landet \(l\) på enhedstypen \(g\) på det tidspunkt \(t\)
  • \(l \in L=\{DE;...;JP\}\) : Land med \(\vert L \vert=30\) (pr.: 01.06.2021)
  • \(g\in\{D;M\}\): Enhedstype (desktop/mobil)
  • \(t\): Tid (dato kl. 00:00:00)
  • \(S_{ulgt}\) : SISTRIX synlighedsindeks for URL'en \(u\) landet \(l\) på enhedstypen \(g\) på tidspunktet \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) værdier \(W_S = \, \mathbb{Q}^{+}_{0}\)

er gældende

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

med

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Denne formel blev overvejende udvundet ved reverse engineering med overvejende hjælp fra den officielle SISTRIX A PI . Grundideen var: Reducer problemet til simple eksempler (find URL'er med et positivt synlighedsindeks med kun et / to / tre / ... søgeord) og prøv derefter at gengive mere komplekse sager.

Egenskaber for synlighedsindekset:

  • Kun nøgleordene i det "permanente søgeordssæt" på 1.000.000 søgeord er inkluderet i synlighedsindekset, ikke nøgleordene i den konstant ekspanderende "komplette database" (som tilpasser sig aktuelle begivenheder og omstændigheder), som i øjeblikket omfatter 100.000.000 søgeord (fra oktober 1, 2021). De respektive søgeordsgrupper kan nemt filtreres ved at vælge en værdi under "Dato" eller ved at indstille værdien udvidet til 0 i API'en. Standarddata eller historiske data er konstante og er blevet indsamlet ugentligt siden 2008, nu dagligt.
  • AMP-hits er ikke inkluderet i synlighedsindekset.
  • Det er tilrådeligt at starte med analysen i nyligt oprettede lande som Rumænien, Kroatien, Slovenien og Bulgarien eller ved at oprette dit eget synlighedsindeks . Grunden til dette er, at SISTRIX bærer "historisk ballast" med sig i lande som Tyskland, hvilket betyder, at søgeord, der før blev vægtet højere, i øjeblikket bliver brugt endnu mere, end man kunne forvente, på trods af (også i lang tid) ) en lav søgevolumen. Ifølge supporten skal det hele gradvis justeres og ikke længere ses på længere sigt.
  • I modsætning til min oprindelige antagelse spiller søgevolumen kun en indirekte rolle i synlighedsindekset. I stedet er de klik, der kan forventes, afgørende. Forholdet mellem søgevolumen og estimerede klik er hovedsageligt baseret på den estimerede søgeintention , som også er angivet. SISTRIX selv påpeger dette eksplicit .
  • De forventede klik er den drivende faktor bag synlighedsindekset. Deres effekt er begrænset opad og nedad, så sigtbarhedsindekset altid løber mellem en øvre og nedre grænse og lineært imellem dem.
  • Klikkene kan ikke tilgås via den officielle API, men kun via webgrænsefladen eller via en manuel CSV-eksport. I begge tilfælde er værdierne afrundet, men DOM i "Søgeord"-visningen indeholder også de originale værdier:
Udover de afrundede værdier kan du også finde råværdierne.

Følgende formel kan også bruges i Excel eller Google Sheets; Den beregner synlighedsindekset for et regneark, hvor hver række indeholder et nøgleord med dets position i kolonne A og dets forventede klik i kolonne B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Dette gør det muligt at producere følgende resultater:

LandEnhedDato\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)Url / bibliotek
SIM.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIM.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIM.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIM.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIM.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIM.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIM.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIM.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIM.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIM.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIM.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIM.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROM.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
HRM.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGM.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

Forskellen mellem de reelle og de beregnede værdier er forårsaget af afrundingsfejl og det begrænsede datasæt, som træningen af ​​modellen er baseret på. Ovenstående udsagn kan tjene som grundlag for yderligere finpudsning af formlen og for eksempel beregning af sammenhængen mellem søgevolumen og forventede klik. Hvis du er interesseret i de scripts, der opstod under min research, er du velkommen til at kontakte mig .

Tilbage