Paradoks Stein11
22

Pada tahun 1961 James dan Stein menerbitkan karya Estimation with Quadratic Loss . Ambil data taburan biasa dengan min yang tidak diketahui $\mu$ dan varians $1$ . Jika anda kini memilih nilai rawak $x$ daripada data ini dan perlu menganggarkan min $\mu$ berdasarkan ini, secara intuitif $x$ ialah anggaran yang munasabah untuk $\mu$ (memandangkan taburan normal wujud, $x$ yang dipilih secara rawak mungkin berhampiran $\mu$ ).

Kini percubaan diulang - kali ini dengan tiga set data bebas, sekali lagi diedarkan secara normal, masing-masing dengan varians $1$ dan nilai min $\mu_1$ , $\mu_2$ , $\mu_3$ . Selepas memperoleh tiga nilai rawak $x_1$ , $x_2$ dan $x_3$ , satu anggaran (menggunakan prosedur yang sama) $\mu_1=x_1$ , $\mu_2=x_2$ dan $\mu_3=x_3$ .

Keputusan James dan Stein yang mengejutkan ialah terdapat anggaran yang lebih baik untuk $ \left( \mu_1, \mu_2, \mu_3 \right) $ (iaitu gabungan tiga set data bebas) daripada $ \left( x_1, x_2, x_3 \right) $ . "Penganggar James Stein" kemudiannya:

$$ \begin{pmatrix}\mu_1\\\mu_2\\\mu_3\end{pmatrix} = \left( 1-\frac{1}{x_1^2+x_2^2+x_3^2} \right) \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} \neq \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} $$

Purata sisihan kuasa dua penganggar ini kemudiannya sentiasa lebih kecil daripada purata sisihan kuasa dua $ E \left[ \left|| X - \mu \right||^2 \right] $ penganggar biasa.

Adalah menghairankan dan mungkin paradoks bahawa penganggar James-Stein mengalihkan penganggar biasa (dengan faktor pengecutan) ke arah asal dan dengan itu memberikan hasil yang lebih baik dalam kebanyakan kes. Ini terpakai pada dimensi $ \geq 3 $ , tetapi tidak dalam kes dua dimensi.

Penjelasan geometri yang bagus tentang sebab kerja ini disediakan oleh Brown & Zao . Harap maklum bahawa ini tidak bermakna anda mempunyai anggaran yang lebih baik untuk setiap set data - anda hanya mempunyai anggaran yang lebih baik dengan risiko gabungan yang lebih kecil.

Belakang

VielhuberDavid

Paradoks Stein1122

Paradoks Stein11
22