مفارقة شتاين

في عام 1961 نشر جيمس وستاين مقالة التقدير مع الخسارة التربيعية . خذ البيانات الموزعة بشكل طبيعي بمتوسط \(\mu\) وتباين \(1\) غير معروف. إذا اخترت الآن قيمة عشوائية \(x\) من هذه البيانات وعليك تقدير المتوسط \(\mu\) على أساس هذا ، بشكل حدسي \(x\) هو تقدير معقول لـ \(\mu\) (نظرًا لوجود توزيع عادي ، فمن المحتمل أن يكون \(x\) المختار عشوائيًا بالقرب من \(\mu\) ).


الآن تتكرر التجربة - هذه المرة بثلاث مجموعات بيانات مستقلة موزعة بشكل طبيعي مرة أخرى لكل منها تباين \(1\) والقيم المتوسطة \(\mu_1\) ، \(\mu_2\) ، \(\mu_3\) . بعد الحصول على ثلاث قيم عشوائية \(x_1\) ، \(x_2\) و \(x_3\) ، أحد التقديرات (باستخدام نفس الإجراء) \(\mu_1=x_1\) ، \(\mu_2=x_2\) و \(\mu_3=x_3\) .

النتيجة المفاجئة لجيمس وستاين هي أن هناك تقديرًا أفضل لـ \( \left( \mu_1, \mu_2, \mu_3 \right) \) (أي مجموعة مجموعات البيانات المستقلة الثلاث) من \( \left( x_1, x_2, x_3 \right) \) . ثم "مقدر جيمس شتاين":

$$ \begin{pmatrix}\mu_1\\\mu_2\\\mu_3\end{pmatrix} = \left( 1-\frac{1}{x_1^2+x_2^2+x_3^2} \right) \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} \neq \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} $$

يكون الانحراف التربيعي المتوسط ​​لهذا المقدّر دائمًا أصغر من الانحراف التربيعي المتوسط \( E \left[ \left|| X - \mu \right||^2 \right] \) للمقدر المعتاد.

إنه لأمر مدهش وربما مفارقة أن مقدر جيمس شتاين يغير المقدر المعتاد (بواسطة عامل تقلص) نحو الأصل وبالتالي يعطي نتيجة أفضل في غالبية الحالات. ينطبق هذا على الأبعاد \( \geq 3 \) ، ولكن ليس في الحالة ثنائية الأبعاد.

شرح هندسي جميل لسبب هذا العمل مقدم من Brown & Zao . لاحظ أن هذا لا يعني أن لديك تقديرًا أفضل لكل مجموعة بيانات - لديك فقط تقدير أفضل مع مخاطر مجمعة أصغر.

عودة