Pengiraan indeks keterlihatan SISTRIX

Bersama Xovi, alat SISTRIX ialah program analisis yang paling banyak digunakan di Jerman dalam bidang SEO. Indeks keterlihatan telah menetapkan dirinya sebagai kuasi-standard untuk keterlihatan halaman dalam carian Google. Parameter yang disertakan dalam pengiraannya adalah, sebagai contoh , dijelaskan di sini dan di sini dan di sini dan di sini dan di sini , tetapi formula pengiraan yang tepat tidak diterbitkan secara rasmi. Berikut adalah hasil penyelidikan peribadi saya selama enam bulan, yang tidak mengaku lengkap atau betul.


Dengan

  • \(A_l\): Set kata kunci SISTRIX (jumlah diisih kata kunci yang ditakrifkan dengan tegas untuk negara tertentu, set termasuk pemalar - berdasarkan trafik berdasarkan purata 12 bulan - dan perkadaran yang lebih kecil, berbeza-beza)
  • \(\vert A_l \vert\) : Ketebalan \(A_l\) dengan \(A_l\) \(\vert A_{DE} \vert = 1.000.000\) (status: 01.10.2021)
  • \(k \in A_l\): Kata kunci dimatikan \(A_l\)
  • \(u\): URL (untuk ditafsirkan sebagai domain, subdomain, direktori, URL individu, bergantung pada format)
  • \(r_{uklgt}\) : Kedudukan URL \(u\) dalam hasil carian organik enjin carian Google untuk kata kunci \(k\) dalam negara \(l\) pada jenis peranti \(g\) pada masa itu \(t\)
  • \(s_{klgt}\) : Jumlah carian (purata pertanyaan carian setiap bulan dengan data daripada SISTRIX, bukan daripada Perancang Kata Kunci Google , tetapi, menurut kenyataan kami sendiri, terkumpul daripada lebih sedozen kebanyakannya peniaga data luaran) untuk kata kunci \(k\) im Negara \(l\) pada jenis peranti \(g\) pada masa \(t\)
  • \(c_{uklgt}\) : Anggaran klik pada URL \(u\) untuk kata kunci \(k\) dalam negara \(l\) pada jenis peranti \(g\) pada masa itu \(t\)
  • \(l \in L=\{DE;...;JP\}\) : Negara dengan \(\vert L \vert=30\) (setakat: 01.06.2021)
  • \(g\in\{D;M\}\): Jenis peranti (desktop / mudah alih)
  • \(t\): Masa (tarikh pada 00:00:00 a.m.)
  • \(S_{ulgt}\) : Indeks keterlihatan SISTRIX bagi URL \(u\) negara \(l\) pada jenis peranti \(g\) pada masa itu \(t\)
  • \(W_S = \, \mathbb{Q}^{+}_{0}\) nilai \(W_S = \, \mathbb{Q}^{+}_{0}\)

adalah terpakai

$$S_{ulgt} = \sum_{k=1}^{\vert A_l \vert} f(r_{uklgt}, c_{uklgt})$$

dengan

$$\begin{multline} \mathbb{N_0} \times \mathbb{Q}^{+}_{0} \to \, \mathbb{Q}^{+}_{0}, f(r, c) = ((1-\text{sgn}(r - 1)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot 0{,}0194 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-34{,}4796))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-378{,}325))) \cdot (0{,}0004 \cdot c + 0{,}0119)))) + (\text{sgn}(r-1)^2 \cdot \\ ((1-\text{sgn}(r - 2)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot 0{,}0136 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-17{,}418))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-230{,}6839))) \cdot (0{,}0006 \cdot c + 0{,}0035)))) + (\text{sgn}(r-2)^2 \cdot \\ ((1-\text{sgn}(r - 3)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot 0{,}0098 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-11{,}0236))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-231{,}3121))) \cdot (0{,}0006 \cdot c + 0{,}0025)))) + (\text{sgn}(r-3)^2 \cdot \\ ((1-\text{sgn}(r - 4)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot 0{,}0077 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}8619))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-219{,}6195))) \cdot (0{,}0006 \cdot c + 0{,}002)))) + (\text{sgn}(r-4)^2 \cdot \\ ((1-\text{sgn}(r - 5)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot 0{,}0068 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-8{,}0684))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot 0{,}125 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-249{,}3706))) \cdot (0{,}0006 \cdot c + 0{,}0017)))) + (\text{sgn}(r-5)^2 \cdot \\ ((1-\text{sgn}(r - 6)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot 0{,}0058 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-5{,}357))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot 0{,}1011 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-133{,}2103))) \cdot (0{,}0007 \cdot c + 0{,}0015)))) + (\text{sgn}(r-6)^2 \cdot \\ ((1-\text{sgn}(r - 7)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot 0{,}0049 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-4{,}3643))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot 0{,}0727 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-90{,}3704))) \cdot (0{,}0008 \cdot c + 0{,}0013)))) + (\text{sgn}(r-7)^2 \cdot \\ ((1-\text{sgn}(r - 8)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot 0{,}0039 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-3{,}3292))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot 0{,}0706 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-87{,}6123))) \cdot (0{,}0008 \cdot c + 0{,}0011)))) + (\text{sgn}(r-8)^2 \cdot \\ ((1-\text{sgn}(r - 9)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot 0{,}0029 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}944))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot 0{,}0515 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-75{,}6014))) \cdot (0{,}0007 \cdot c + 0{,}0012)))) + (\text{sgn}(r-9)^2 \cdot \\ ((1-\text{sgn}(r - 10)^2) \cdot ((1-\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot 0{,}0019 + \\ (\text{ceil}(0.5 \cdot \text{sgn}(c-2{,}4797))) \cdot ((1+\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot 0{,}0199 - \\ (\text{floor}(0.5 \cdot \text{sgn}(c-36{,}7911))) \cdot (0{,}0005 \cdot c + 0{,}0005)))) + (\text{sgn}(r-10)^2 \cdot 0)))))))))) \end{multline}$$

Formula ini kebanyakannya diekstrak oleh kejuruteraan terbalik dengan kebanyakannya bantuan SISTRIX A PI rasmi. Idea asasnya ialah: Kurangkan masalah kepada contoh mudah (cari URL dengan indeks keterlihatan positif dengan hanya satu / dua / tiga / ... kata kunci) dan kemudian cuba menghasilkan semula kes yang lebih kompleks.

Sifat indeks keterlihatan:

  • Hanya kata kunci "set kata kunci kekal" daripada 1,000,000 kata kunci dimasukkan dalam indeks keterlihatan, bukan kata kunci "pangkalan data lengkap" yang sentiasa berkembang (yang menyesuaikan diri dengan peristiwa dan keadaan semasa), yang pada masa ini terdiri daripada 100,000,000 kata kunci (Sehingga Oktober 1hb, 2021). Kumpulan kata kunci masing-masing boleh ditapis dengan mudah dengan memilih nilai di bawah "Tarikh" atau dengan menetapkan nilai yang dilanjutkan kepada 0 dalam API. Data standard atau data sejarah adalah malar dan telah dikumpul setiap minggu sejak 2008, kini setiap hari.
  • Hit AMP tidak termasuk dalam indeks keterlihatan.
  • Adalah dinasihatkan untuk memulakan dengan analisis di negara yang baru dicipta seperti Romania, Croatia, Slovenia & Bulgaria atau dengan mencipta indeks keterlihatan anda sendiri . Sebabnya ialah SISTRIX membawa bersamanya "balast sejarah" di negara seperti Jerman, yang bermaksud kata kunci yang dahulunya diberi pemberat yang lebih tinggi pada masa ini digunakan malah lebih daripada yang dijangkakan, walaupun (juga untuk masa yang lama ) volum carian yang rendah. Mengikut sokongan, semuanya harus diselaraskan secara beransur-ansur dan tidak lagi kelihatan dalam jangka panjang.
  • Bertentangan dengan andaian asal saya, volum carian hanya memainkan peranan tidak langsung dalam indeks keterlihatan. Sebaliknya, klik yang dijangkakan adalah penting. Perhubungan antara volum carian dan anggaran klik terutamanya berdasarkan anggaran niat carian , yang juga ditunjukkan. SISTRIX sendiri menunjukkan perkara ini secara eksplisit .
  • Klik yang dijangkakan adalah faktor pendorong di sebalik Indeks Keterlihatan. Kesannya dihadkan ke atas dan ke bawah, supaya indeks keterlihatan sentiasa berjalan di antara had atas dan bawah serta linear di antaranya.
  • Klik tidak boleh diakses melalui API rasmi, tetapi hanya melalui antara muka web atau melalui eksport CSV manual. Dalam kedua-dua kes, nilai dibundarkan, tetapi DOM bagi paparan "Kata kunci" juga mengandungi nilai asal:
Selain nilai bulat, anda juga boleh mencari nilai mentah.

Formula berikut juga boleh digunakan dalam Excel atau Helaian Google; Ia mengira indeks keterlihatan untuk lembaran kerja di mana setiap baris mengandungi kata kunci dengan kedudukannya dalam lajur A dan klik dijangkanya dalam lajur B.:

=SUMME(WENN(A1:A999999=1;WENN(B1:B999999=378,32500379436;0,125;(0,00037306471297181*B1:B999999+0,011944496557952))); WENN(A1:A999999=2;WENN(B1:B999999=230,68394113271;0,125;(0,00055449577110866*B1:B999999+0,0035350976909409))); WENN(A1:A999999=3;WENN(B1:B999999=231,31214231278;0,125;(0,00059715499256153*B1:B999999+0,0025455442270028))); WENN(A1:A999999=4;WENN(B1:B999999=219,61948739302;0,125;(0,00063710437878404*B1:B999999+0,0020405503130787))); WENN(A1:A999999=5;WENN(B1:B999999=249,37064996217;0,125;(0,00058906284391034*B1:B999999+0,0017391721053351))); WENN(A1:A999999=6;WENN(B1:B999999=133,21031841331;0,1011;(0,00074744619531311*B1:B999999+0,0015021940435474))); WENN(A1:A999999=7;WENN(B1:B999999=90,370431493381;0,0727;(0,00078977592541601*B1:B999999+0,0012962057526498))); WENN(A1:A999999=8;WENN(B1:B999999=87,612293584114;0,0706;(0,00079399080394233*B1:B999999+0,0010648385910406))); WENN(A1:A999999=9;WENN(B1:B999999=75,601377547472;0,0515;(0,00066458507066795*B1:B999999+0,0011972721128791))); WENN(A1:A999999=10;WENN(B1:B999999=36,79114711734;0,0199;(0,00052397754322654*B1:B999999+0,00053850952142599))); 0)))))))))))

Ini membolehkan keputusan berikut dihasilkan:

NegaraPerantiTarikh\(S_{echt}\)\(S_{berechnet}\)\(\Delta\)\(\Delta_{\%}\)Url / direktori
SIM.29.10.21\( 0{,}1348 \)\( 0{,}1348 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/?hl=sl
SIM.29.10.21\( 0{,}2156 \)\( 0{,}2155 \)\( 0{,}0001 \)\( 0{,}05% \)https://Me.twitter.com/youtube
SIM.29.10.21\( 0{,}3746 \)\( 0{,}3740 \)\( 0{,}0006 \)\( 0{,}16% \)https://sl.m.wikipedia.org/wiki/YouTube
SIM.29.10.21\( 0{,}6771 \)\( 0{,}6760 \)\( 0{,}0011 \)\( 0{,}16% \)https://m.facebook.com/youtube/
SIM.29.10.21\( 0{,}6836 \)\( 0{,}6830 \)\( 0{,}0006 \)\( 0{,}09% \)https://x2convert.com/en117/download-youtube-to-mp3-music
SIM.29.10.21\( 0{,}7636 \)\( 0{,}7555 \)\( 0{,}0081 \)\( 1{,}06% \)https://www.youtubekids.com/
SIM.29.10.21\( 0{,}8749 \)\( 0{,}8730 \)\( 0{,}0019 \)\( 0{,}22% \)https://www.4kdownload.com/products/youtubetomp3/6
SIM.29.10.21\( 4{,}0020 \)\( 3{,}9980 \)\( 0{,}0040 \)\( 0{,}10% \)https://ytmp3.cc/en23/
SIM.29.10.21\( 8{,}0520 \)\( 8{,}0520 \)\( 0{,}0000 \)\( 0{,}00% \)https://support.google.com/youtube/
SIM.29.10.21\( 11{,}6600 \)\( 11{,}6100 \)\( 0{,}0500 \)\( 0{,}43% \)https://m.facebook.com/events/
SIM.29.10.21\( 19{,}7000 \)\( 19{,}6890 \)\( 0{,}0110 \)\( 0{,}06% \)https://minecraft.fandom.com/wiki/
SIM.29.10.21\( 32{,}5900 \)\( 32{,}5890 \)\( 0{,}0010 \)\( 0{,}00% \)https://hr.m.wikipedia.org/wiki/
ROM.29.10.21\( 0{,}1516 \)\( 0{,}1516 \)\( 0{,}0000 \)\( 0{,}00% \)https://lol.fandom.com/wiki/LCK/2021_Season/Summer_Season
ENCIKM.29.10.21\( 0{,}2191 \)\( 0{,}2190 \)\( 0{,}0000 \)\( 0{,}00% \)https://starwars.fandom.com/wiki/Mandalorian
BGM.03.11.21\( 0{,}3703 \)\( 0{,}3702 \)\( 0{,}0001 \)\( 0{,}03% \)https://leagueoflegends.fandom.com/wiki/List_of_champions

Perbezaan antara nilai sebenar dan yang dikira disebabkan oleh ralat pembundaran dan set data terhad yang menjadi asas latihan model. Pernyataan di atas boleh menjadi asas untuk memperhalusi formula dan, sebagai contoh, mengira perhubungan antara volum carian dan klik yang dijangkakan. Jika anda berminat dengan skrip yang timbul semasa penyelidikan saya, sila hubungi saya .

Belakang