স্টেইনের প্যারাডক্স

1961 সালে জেমস এবং স্টেইন চতুর্মুখী ক্ষতি সহ প্রাক্কলন গবেষণাপত্র প্রকাশ করেন। একটি অজানা গড় \(\mu\) এবং প্রকরণ \(1\) সহ সাধারণত বিতরণ করা ডেটা নিন। আপনি যদি এখন এই ডেটা থেকে একটি এলোমেলো মান \(x\) চয়ন করেন এবং এর ভিত্তিতে গড় \(\mu\) অনুমান করতে হয়, তাহলে স্বজ্ঞাতভাবে \(x\) হল \(\mu\) জন্য একটি যুক্তিসঙ্গত অনুমান। (যেহেতু একটি স্বাভাবিক বন্টন বর্তমান, এলোমেলোভাবে নির্বাচিত \(x\) সম্ভবত \(\mu\) কাছাকাছি)।


এখন পরীক্ষাটি পুনরাবৃত্তি করা হয়েছে - এইবার তিনটি স্বাধীন, আবার সাধারণত বিতরণ করা ডেটা সেটগুলির প্রত্যেকটি বৈকল্পিক \(1\) এবং গড় মান \(\mu_1\) , \(\mu_2\) , \(\mu_3\) তিনটি এলোমেলো মান \(x_1\) , \(x_2\) এবং \(x_3\) পাওয়ার পর, একটি অনুমান (একই পদ্ধতি ব্যবহার করে) \(\mu_1=x_1\) , \(\mu_2=x_2\) এবং \(\mu_3=x_3\)

জেমস এবং স্টেইনের আশ্চর্যজনক ফলাফল হল যে \( \left( \mu_1, \mu_2, \mu_3 \right) \) (অর্থাৎ তিনটি স্বাধীন ডেটা সেটের সংমিশ্রণ ) এর জন্য \( \( \left( x_1, x_2, x_3 \right) \) left( এর চেয়ে ভাল অনুমান রয়েছে \( \left( x_1, x_2, x_3 \right) \) । তখন ‘জেমস স্টেইন এস্টিমেটর’:

$$ \begin{pmatrix}\mu_1\\\mu_2\\\mu_3\end{pmatrix} = \left( 1-\frac{1}{x_1^2+x_2^2+x_3^2} \right) \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} \neq \begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix} $$

এই অনুমানকের গড় বর্গ বিচ্যুতি সর্বদা সাধারণ অনুমানকের গড় বর্গ বিচ্যুতি \( E \left[ \left|| X - \mu \right||^2 \right] \) থেকে ছোট।

এটি আশ্চর্যজনক এবং সম্ভবত বিরোধপূর্ণ যে জেমস-স্টেইন অনুমানকারী স্বাভাবিক অনুমানকারীকে (একটি সঙ্কুচিত ফ্যাক্টর দ্বারা) উৎপত্তির দিকে স্থানান্তরিত করে এবং এইভাবে বেশিরভাগ ক্ষেত্রে একটি ভাল ফলাফল দেয়। এটি মাত্রার ক্ষেত্রে প্রযোজ্য \( \geq 3 \) , কিন্তু দ্বি-মাত্রিক ক্ষেত্রে নয়।

কেন এটি কাজ করে তার একটি সুন্দর জ্যামিতিক ব্যাখ্যা Brown & Zao দ্বারা সরবরাহ করা হয়েছে। মনে রাখবেন যে এর অর্থ এই নয় যে প্রতিটি ডেটাসেটের জন্য আপনার কাছে একটি ভাল অনুমান রয়েছে - আপনার কাছে একটি ছোট সম্মিলিত ঝুঁকি সহ আরও ভাল অনুমান রয়েছে৷

পেছনে