Calcul de l'indice de visibilité SISTRIX

Avec Xovi, l'outil SISTRIX est le programme d'analyse le plus utilisé en Allemagne dans le domaine du référencement. L'indice de visibilité s'est imposé comme un quasi-standard pour la visibilité d'une page dans la recherche Google. Les paramètres qui sont inclus dans son calcul sont, par exemple , expliqués ici et ici et ici et ici et ici , mais une formule de calcul exacte n'est pas officiellement publiée. Ce qui suit sont les résultats de mes recherches personnelles de six mois, qui ne prétendent pas être complètes ou correctes.


Avec

  • \(A_l\): Ensemble de mots-clés SISTRIX (quantité triée de mots-clés fermement définis pour un pays spécifique, l'ensemble comprend une constante - basée sur le trafic basé sur une moyenne de 12 mois - et une proportion plus petite et variable)
  • \(\vert A_l \vert\) : Épaisseur de \(A_l\) avec \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (statut : 01.10.2021)
  • \(k \in A_l\): Mot clé désactivé \(A_l\)
  • \(u\): URL (à interpréter comme un domaine, un sous-domaine, un répertoire, une URL individuelle, selon le format)
  • \(r_{uklgt}\) : Classement de l'URL \(u\) dans les résultats de recherche organique du moteur de recherche Google pour le mot clé \(k\) dans le pays \(l\) sur le type d'appareil \(g\) à l'instant \(t\)
  • \(s_{klgt}\) : volume de recherche (moyenne des requêtes de recherche par mois avec des données de SISTRIX, pas de Google Keyword Planner , mais, selon notre propre déclaration, accumulé par plus d'une douzaine de revendeurs de données pour la plupart externes) pour le mot clé \(k\) im Country \(l\) sur le type d'appareil \(g\) à l'heure \(t\)
  • \(c_{uklgt}\) : Clics estimés sur l'URL \(u\) pour le mot clé \(k\) dans le pays \(l\) sur le type d'appareil \(g\) à l'instant \(t\)
  • \(l \in L=\{DE;...;JP\}\) : Pays avec \(\vert L \vert=30\) (au : 01.06.2021)
  • \(g\in\{D;M\}\): Type d'appareil (ordinateur de bureau / mobile)
  • \(t\): Heure (date à 00:00:00)
  • \(S_{ulgt}\) : indice de visibilité SISTRIX de l'URL \(u\) pays \(l\) sur le type d'appareil \(g\) à l'instant \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) valeurs \(W_S = \, \mathbb{Q}^{+}_{0}\)

est applicable

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

avec

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Cette formule a été principalement extraite par ingénierie inverse avec principalement l'aide du SISTRIX A PI officiel. L'idée de base était : Réduire le problème à des exemples simples (trouver des URL avec un indice de visibilité positif avec seulement un / deux / trois / ... mots-clés) puis essayer de reproduire des cas plus complexes.

Propriétés de l'indice de visibilité:

  • Seuls les mots-clés du "jeu de mots-clés permanents" de 1 000 000 de mots-clés sont inclus dans l'indice de visibilité, pas les mots-clés de la "base de données complète" en constante expansion (qui s'adapte aux événements et circonstances actuels), qui comprend actuellement 100 000 000 de mots-clés (à compter d'octobre 1er 2021). Les groupes de mots clés respectifs peuvent être facilement filtrés en sélectionnant une valeur sous "Date" ou en définissant la valeur étendue à 0 dans l'API. Les données standards ou historiques sont constantes et sont collectées hebdomadairement depuis 2008, désormais quotidiennes.
  • Les appels AMP ne sont pas inclus dans l'indice de visibilité.
  • Il est conseillé de commencer par l'analyse dans des pays récemment créés comme la Roumanie, la Croatie, la Slovénie et la Bulgarie ou en créant votre propre indice de visibilité . La raison en est que SISTRIX porte en lui un « lest historique » dans des pays comme l'Allemagne, ce qui signifie que les mots-clés auxquels on accordait une pondération plus élevée sont actuellement utilisés encore plus que ce à quoi on pourrait s'attendre, malgré (aussi pendant longtemps ) un faible volume de recherche. Selon le support, l'ensemble devrait être ajusté progressivement et ne plus être visible à long terme.
  • Contrairement à mon hypothèse initiale, le volume de recherche ne joue qu'un rôle indirect dans l'indice de visibilité. Au lieu de cela, les clics à attendre sont cruciaux. La relation entre le volume de recherche et les clics estimés est principalement basée sur l' intention de recherche estimée , qui est également indiquée. SISTRIX lui-même le signale explicitement .
  • Les clics attendus sont le facteur déterminant de l'indice de visibilité. Leur effet est plafonné à la hausse et à la baisse, de sorte que l'indice de visibilité se situe toujours entre une limite supérieure et inférieure et linéaire entre elles.
  • Les clics ne sont pas accessibles via l'API officielle, mais uniquement via l'interface web ou via un export CSV manuel. Dans les deux cas, les valeurs sont arrondies, mais le DOM de la vue "Mots clés" contient également les valeurs d'origine:
En plus des valeurs arrondies, vous pouvez également trouver les valeurs brutes.

La formule suivante peut également être utilisée dans Excel ou Google Sheets ; Il calcule l'indice de visibilité d'une feuille de calcul dans laquelle chaque ligne contient un mot-clé avec sa position dans la colonne A et ses clics attendus dans la colonne B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Cela permet de produire les résultats suivants:

PaysDispositifDate\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)URL / répertoire
SIM.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIM.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIM.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIM.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIM.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIM.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIM.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIM.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIM.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIM.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIM.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIM.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROM.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
MONSIEURM.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGM.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

La différence entre les valeurs réelles et calculées est causée par des erreurs d'arrondi et l'ensemble de données limité sur lequel est basé l'apprentissage du modèle. Les déclarations ci-dessus peuvent servir de base pour affiner davantage la formule et, par exemple, calculer la relation entre le volume de recherche et les clics attendus. Si vous êtes intéressé par les scripts issus de mes recherches, n'hésitez pas à me contacter .

Retour