Beräkning av SIstrix synlighetsindex

Tillsammans med Xovi är SISTRIX- verktyget det mest använda analysprogrammet i Tyskland inom SEO-området. Synlighetsindexet har etablerat sig som en kvasistandard för synligheten av en sida i Google-sökning. Parametrarna som ingår i dess beräkning förklaras till exempel här och här och här och här och här , men en exakt beräkningsformel är inte officiellt publicerad. Följande är resultaten av min sex månader långa personliga forskning, som inte gör anspråk på att vara komplett eller korrekt.


Med

  • \(A_l\): SISTRIX sökordsuppsättning (sorterad mängd fast definierade sökord för ett specifikt land, uppsättningen inkluderar konstant - baserat på trafik baserat på ett 12-månaders genomsnitt - och mindre, varierande andel)
  • \(\vert A_l \vert\) : Tjocklek på \(A_l\) med \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (status: 01.10.2021)
  • \(k \in A_l\): Nyckelord av \(A_l\)
  • \(u\): URL (att tolkas som en domän, underdomän, katalog, individuell URL, beroende på formatet)
  • \(r_{uklgt}\) : Rangordning av URL:en \(u\) i de organiska sökresultaten för sökmotorn Google för sökordet \(k\) i landet \(l\) på enhetstypen \(g\) vid tiden \(t\)
  • \(s_{klgt}\) : Sökvolym (genomsnittliga sökfrågor per månad med data från SISTRIX, inte från Googles sökordsplanerare , men, enligt vår egen utsago, ackumulerad från över ett dussin mestadels externa datahandlare) för sökordet \(k\) im Country \(l\) på enheten typ \(g\) vid tidpunkten \(t\)
  • \(c_{uklgt}\) : Uppskattade klick på URL:en \(u\) för nyckelordet \(k\) i landet \(l\) på enhetstypen \(g\) vid tiden \(t\)
  • \(l \in L=\{DE;...;JP\}\) : Land med \(\vert L \vert=30\) (per: 01.06.2021)
  • \(g\in\{D;M\}\): Enhetstyp (dator/mobil)
  • \(t\): Tid (datum kl. 00:00:00)
  • \(S_{ulgt}\) : SISTRIX synlighetsindex för URL:en \(u\) landet \(l\) på enhetstypen \(g\) vid tiden \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) värden \(W_S = \, \mathbb{Q}^{+}_{0}\)

är tillämplig

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

med

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Denna formel extraherades övervägande genom omvänd ingenjörskonst med övervägande hjälp av den officiella SISTRIX A PI . Grundidén var: Minska problemet till enkla exempel (hitta webbadresser med ett positivt synlighetsindex med endast ett / två / tre / ... nyckelord) och försök sedan återskapa mer komplexa fall.

Egenskaper för synlighetsindex:

  • Endast nyckelorden för den "permanenta nyckelordsuppsättningen" på 1 000 000 sökord ingår i synlighetsindexet, inte nyckelorden i den ständigt expanderande "kompletta databasen" (som anpassar sig till aktuella händelser och omständigheter), som för närvarande omfattar 100 000 000 sökord (per oktober 1:a, 2021). De respektive nyckelordsgrupperna kan enkelt filtreras genom att välja ett värde under "Datum" eller genom att sätta värdet utökat till 0 i API:et. Standarddata eller historiska data är konstanta och har samlats in varje vecka sedan 2008, nu dagligen.
  • AMP-träffar ingår inte i synlighetsindexet.
  • Det är lämpligt att börja med analysen i nyligen skapade länder som Rumänien, Kroatien, Slovenien och Bulgarien eller genom att skapa ditt eget synlighetsindex . Anledningen till detta är att SISTRIX bär med sig "historisk barlast" i länder som Tyskland, vilket gör att sökord som tidigare fick en högre viktning för närvarande används ännu mer än man förväntar sig, trots (även under lång tid) ) en låg sökvolym. Enligt supporten ska det hela successivt anpassas och inte längre synas på sikt.
  • Tvärtemot mitt ursprungliga antagande spelar sökvolymen bara en indirekt roll i synlighetsindexet. Istället är de förväntade klicken avgörande. Sambandet mellan sökvolym och uppskattade klick baseras huvudsakligen på den uppskattade sökintentionen , som också anges. SISTRIX själv påpekar detta uttryckligen .
  • De förväntade klicken är den drivande faktorn bakom Visibility Index. Deras effekt är begränsad uppåt och nedåt, så att siktindexet alltid löper mellan en övre och nedre gräns och linjärt mellan dem.
  • Klicken kan inte nås via det officiella API:t, utan endast via webbgränssnittet eller via en manuell CSV-export. I båda fallen är värdena avrundade, men DOM i vyn "Sökord" innehåller också de ursprungliga värdena:
Utöver de avrundade värdena kan du även hitta råvärdena.

Följande formel kan också användas i Excel eller Google Sheets; Den beräknar synlighetsindexet för ett kalkylblad där varje rad innehåller ett nyckelord med dess position i kolumn A och dess förväntade klick i kolumn B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Detta gör att följande resultat kan produceras:

LandEnhetDatum\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)URL / katalog
SIM.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIM.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIM.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIM.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIM.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIM.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIM.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIM.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIM.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIM.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIM.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIM.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROM.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
HERRM.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGM.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

Skillnaden mellan de verkliga och de beräknade värdena orsakas av avrundningsfel och den begränsade datamängden som utbildningen av modellen bygger på. Ovanstående påståenden kan tjäna som underlag för att ytterligare förfina formeln och till exempel beräkna sambandet mellan sökvolym och förväntade klick. Om du är intresserad av de manus som uppstod under min forskning får du gärna kontakta mig .

Tillbaka