مفارقة سيمبسون هي واحدة من الظواهر التي يمكن فهمها بسهولة وفي نفس الوقت مذهلة في الإحصاء. يحدث ذلك عندما تُظهر مجموعات البيانات اتجاهًا معينًا ، ولكن يتم عكس هذا الاتجاه عندما يتم دمج المجموعات. بمساعدة مثال بسيط ، يمكن فهم التناقض على الفور.
نحن نعتبر المجموعتين المنفصلتين \(\#1\) و \(\#2\) وكذلك \(G = \#1 \cup \#2\) ونختبر معدل نجاح \(A\) وضمن هذه المجموعات \(B\):
\(A\) | \(B\) | \(win\) | |
\(\#1\) | \(\frac{1}{1}=100\%\) | \(\frac{3}{4}=75\%\) | \(A\) |
\(\#2\) | \(\frac{2}{5}=40\%\) | \(\frac{1}{3}=33\%\) | \(A\) |
\(\#1 \cup \#2\) | \(\frac{3}{6}=50\%\) | \(\frac{4}{7}=57\%\) | \(B\) |
اتضح أن \(A\) أكثر نجاحًا من \(B\) في \(\#1\) وكذلك \(\#2\) \(B\) ، ولكن بشكل مفاجئ في \(G\) \(B\) أكثر نجاحًا من \(A\) . هذا المثال هو أيضًا واحد من هؤلاء الذين لديهم أصغر مجموعة \(G\) مع \(|G|=13\) . لا يوجد \(G\) مع \(|G|<13\) (دليل بالقوة الغاشمة).
نقسم الآن المجموعة \(G\) بدلاً من \(2\) إلى \(3\) مجموعات فرعية منفصلة \(\#1, \, \#2, \, \#3\) مع \(\#1 \cup \#2 \cup \#3 = G\) . ثم نبني الحالة المثيرة التي \(e_k \neq \emptyset\) على كل عنصر \(e_k \neq \emptyset\) مجموعة الطاقة \(P(G)\) من \(G\) : $$\forall e_1, e_2 \in P(G): |e_1| \neq |e_2| \Rightarrow win(e_1) \neq win(e_2) \land |e_1| = |e_2| \Rightarrow win(e_1) = win(e_2)$$ $$\forall e_1, e_2 \in P(G): |e_1| \neq |e_2| \Rightarrow win(e_1) \neq win(e_2) \land |e_1| = |e_2| \Rightarrow win(e_1) = win(e_2)$$
بعد بضع ساعات من القوة الغاشمة على Core i7 القياسي ، يمكن العثور على المثال التالي:
\(A\) | \(B\) | \(C\) | \(win\) | |
\(\#1\) | \(\frac{6}{7}=85,71\%\) | \(\frac{12}{15}=80,00\%\) | \(\frac{22}{37}=59,46\%\) | \(A\) |
\(\#2\) | \(\frac{95}{167}=56,89\%\) | \(\frac{48}{88}=54,55\%\) | \(\frac{38}{67}=56,72\%\) | \(A\) |
\(\#3\) | \(\frac{48}{144}=33,33\%\) | \(\frac{16}{50}=32,00\%\) | \(\frac{2}{20}=10,00\%\) | \(A\) |
\(\#1 \cup \#2\) | \(\frac{101}{174}=58,05\%\) | \(\frac{60}{103}=58,25\%\) | \(\frac{60}{104}=57,69\%\) | \(B\) |
\(\#1 \cup \#3\) | \(\frac{54}{151}=35,76\%\) | \(\frac{28}{65}=43,08\%\) | \(\frac{24}{57}=42,11\%\) | \(B\) |
\(\#2 \cup \#3\) | \(\frac{143}{311}=45,98\%\) | \(\frac{64}{138}=46,38\%\) | \(\frac{40}{87}=45,98\%\) | \(B\) |
\(\#1 \cup \#2\cup \#3\) | \(\frac{149}{318}=46,86\%\) | \(\frac{76}{153}=49,67\%\) | \(\frac{62}{124}=50,00\%\) | \(C\) |
وبالتالي (بافتراض وقت الحوسبة الطويل بشكل تعسفي) يمكن العثور على أمثلة \(n\) مجموعات فرعية منفصلة لها نفس السلوك. إذا حدثت مثل هذه الحالات في الواقع ، فإن أي استنتاجات بشأن توصية نجاح المجموعة تكون معقولة ولا طائل من ورائها.
في هذه المرحلة ، نوصي أيضًا بقراءة مثيرة للسببية: النماذج والاستدلال والاستدلال بواسطة Judea Pearl .