Pada tahun 1961 James dan Stein menerbitkan karya Estimation with Quadratic Loss . Ambil data taburan biasa dengan min yang tidak diketahui \(\mu\) dan varians \(1\) . Jika anda kini memilih nilai rawak \(x\) daripada data ini dan perlu menganggarkan min \(\mu\) berdasarkan ini, secara intuitif \(x\) ialah anggaran yang munasabah untuk \(\mu\) (memandangkan taburan normal wujud, \(x\) yang dipilih secara rawak mungkin berhampiran \(\mu\) ).
Kini percubaan diulang - kali ini dengan tiga set data bebas, sekali lagi diedarkan secara normal, masing-masing dengan varians \(1\) dan nilai min \(\mu_1\) , \(\mu_2\) , \(\mu_3\) . Selepas memperoleh tiga nilai rawak \(x_1\) , \(x_2\) dan \(x_3\) , satu anggaran (menggunakan prosedur yang sama) \(\mu_1=x_1\) , \(\mu_2=x_2\) dan \(\mu_3=x_3\) .
Keputusan James dan Stein yang mengejutkan ialah terdapat anggaran yang lebih baik untuk \( \left( \mu_1, \mu_2, \mu_3 \right) \) (iaitu gabungan tiga set data bebas) daripada \( \left( x_1, x_2, x_3 \right) \) . "Penganggar James Stein" kemudiannya:
$$ \begin{pmatrix}\mu_1\\\mu_2\\\mu_3\end{pmatrix} = \left( 1-\frac{1}{x_1^2+x_2^2+x_3^2} \right) \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} \neq \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} $$
Purata sisihan kuasa dua penganggar ini kemudiannya sentiasa lebih kecil daripada purata sisihan kuasa dua \( E \left[ \left|| X - \mu \right||^2 \right] \) penganggar biasa.
Adalah menghairankan dan mungkin paradoks bahawa penganggar James-Stein mengalihkan penganggar biasa (dengan faktor pengecutan) ke arah asal dan dengan itu memberikan hasil yang lebih baik dalam kebanyakan kes. Ini terpakai pada dimensi \( \geq 3 \) , tetapi tidak dalam kes dua dimensi.
Penjelasan geometri yang bagus tentang sebab kerja ini disediakan oleh Brown & Zao . Harap maklum bahawa ini tidak bermakna anda mempunyai anggaran yang lebih baik untuk setiap set data - anda hanya mempunyai anggaran yang lebih baik dengan risiko gabungan yang lebih kecil.