Cálculo del índice de visibilidad SISTRIX

Junto con Xovi, la herramienta SISTRIX es el programa de análisis más utilizado en Alemania en el área de SEO. El índice de visibilidad se ha establecido como un cuasi estándar para la visibilidad de una página en la búsqueda de Google. Los parámetros que se incluyen en su cálculo se explican, por ejemplo , aquí y aquí y aquí y aquí y aquí , pero no se publica oficialmente una fórmula de cálculo exacta. Los siguientes son los resultados de mi investigación personal de seis meses, que no pretenden ser completos ni correctos.


Con

  • \(A_l\): Conjunto de palabras clave SISTRIX (cantidad ordenada de palabras clave firmemente definidas para un país específico, el conjunto incluye constante, según el tráfico basado en un promedio de 12 meses, y una proporción más pequeña y variable)
  • \(\vert A_l \vert\) : Espesor de \(A_l\) con, \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (estado: 01.10.2021)
  • \(k \in A_l\): Palabra clave desactivada \(A_l\)
  • \(u\): URL (a interpretar como dominio, subdominio, directorio, URL individual, según el formato)
  • \(r_{uklgt}\) : Clasificación de la URL \(u\) en los resultados de búsqueda orgánicos del motor de búsqueda Google para la palabra clave \(k\) en el país \(l\) en el tipo de dispositivo \(g\) en el momento \(t\)
  • \(s_{klgt}\) : volumen de búsqueda (consultas de búsqueda promedio por mes con datos de SISTRIX, no de Google Keyword Planner , pero, según nuestra propia declaración, acumulado de más de una docena de distribuidores de datos, en su mayoría externos) para la palabra clave \(k\) im Country \(l\) en el tipo de dispositivo \(g\) en el momento \(t\)
  • \(c_{uklgt}\) : clics estimados en la URL \(u\) para la palabra clave \(k\) en el país \(l\) en el tipo de dispositivo \(g\) en ese momento \(t\)
  • \(l \in L=\{DE;...;JP\}\) : País con \(\vert L \vert=30\) (desde: 01.06.2021)
  • \(g\in\{D;M\}\): Tipo de dispositivo (escritorio / móvil)
  • \(t\): Hora (fecha a las 00:00:00 a.m.)
  • \(S_{ulgt}\) : índice de visibilidad SISTRIX de la URL \(u\) país \(l\) en el tipo de dispositivo \(g\) en el momento \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) valores \(W_S = \, \mathbb{Q}^{+}_{0}\)

es aplicable

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

con

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Esta fórmula se extrajo principalmente mediante ingeniería inversa con la ayuda predominante del SISTRIX A PI oficial. La idea básica era: Reducir el problema a ejemplos simples (encontrar URL con un índice de visibilidad positivo con solo una / dos / tres / ... palabras clave) y luego intentar reproducir casos más complejos.

Propiedades del índice de visibilidad:

  • Solo las palabras clave del "conjunto de palabras clave permanente" de 1.000.000 de palabras clave se incluyen en el índice de visibilidad, no las palabras clave de la "base de datos completa" en constante expansión (que se adapta a los eventos y circunstancias actuales), que actualmente comprende 100.000.000 de palabras clave (a partir de octubre 1 ° de 2021). Los respectivos grupos de palabras clave se pueden filtrar fácilmente seleccionando un valor en "Fecha" o estableciendo el valor ampliado a 0 en la API. Los datos estándar o históricos son constantes y se han recopilado semanalmente desde 2008, ahora a diario.
  • Los hits de AMP no se incluyen en el índice de visibilidad.
  • Es recomendable comenzar con el análisis en países de reciente creación como Rumanía, Croacia, Eslovenia y Bulgaria o creando su propio índice de visibilidad . La razón de esto es que SISTRIX lleva consigo un "lastre histórico" en países como Alemania, lo que significa que las palabras clave que solían tener una ponderación más alta se utilizan actualmente incluso más de lo que cabría esperar, a pesar de (también durante mucho tiempo ) un volumen de búsqueda bajo. Según el soporte, todo debería ajustarse gradualmente y dejar de ser visible a largo plazo.
  • Contrariamente a mi suposición original, el volumen de búsqueda solo juega un papel indirecto en el índice de visibilidad. En cambio, los clics esperados son cruciales. La relación entre el volumen de búsqueda y los clics estimados se basa principalmente en la intención de búsqueda estimada, que también se indica. La propia SISTRIX señala esto explícitamente .
  • Los clics esperados son el factor determinante del índice de visibilidad. Su efecto se limita hacia arriba y hacia abajo, de modo que el índice de visibilidad siempre se encuentra entre un límite superior e inferior y es lineal entre ellos.
  • No se puede acceder a los clics a través de la API oficial, sino solo a través de la interfaz web o mediante una exportación CSV manual. En ambos casos, los valores se redondean, pero el DOM de la vista "Palabras clave" también contiene los valores originales.:
Además de los valores redondeados, también puede encontrar los valores brutos.

La siguiente fórmula también se puede utilizar en Excel o Google Sheets; Calcula el índice de visibilidad para una hoja de trabajo en la que cada fila contiene una palabra clave con su posición en la columna A y sus clics esperados en la columna B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Esto permite producir los siguientes resultados:

PaísDispositivoFecha\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)URL / directorio
SIMETRO.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIMETRO.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIMETRO.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIMETRO.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIMETRO.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIMETRO.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIMETRO.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIMETRO.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIMETRO.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIMETRO.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIMETRO.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIMETRO.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROMETRO.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
SEÑORMETRO.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGMETRO.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

La diferencia entre los valores reales y calculados se debe a errores de redondeo y al conjunto de datos limitado en el que se basa el entrenamiento del modelo. Las declaraciones anteriores pueden servir como base para refinar aún más la fórmula y, por ejemplo, calcular la relación entre el volumen de búsqueda y los clics esperados. Si está interesado en los guiones que surgieron durante mi investigación, no dude en ponerse en contacto conmigo .

Atrás