सिम्पसन विरोधाभास आसानी से समझा जा सकता है और एक ही समय में आंकड़ों में आश्चर्यजनक घटना है। यह तब होता है जब भी डेटा के समूह एक विशेष प्रवृत्ति दिखाते हैं, लेकिन समूहों को जोड़ देने पर यह प्रवृत्ति उलट जाती है। एक साधारण उदाहरण की मदद से विरोधाभास को तुरंत समझा जा सकता है।
हम दो अलग सेटों \(\#1\) और \(\#2\) साथ-साथ \(G = \#1 \cup \#2\) और \(A\) की सफलता दर का परीक्षण करते हैं और इन सेटों के भीतर \(B\):
\(A\) | \(B\) | \(win\) | |
\(\#1\) | \(\frac{1}{1}=100\%\) | \(\frac{3}{4}=75\%\) | \(A\) |
\(\#2\) | \(\frac{2}{5}=40\%\) | \(\frac{1}{3}=33\%\) | \(A\) |
\(\#1 \cup \#2\) | \(\frac{3}{6}=50\%\) | \(\frac{4}{7}=57\%\) | \(B\) |
यह पता चला है कि \(A\) \(B\) \(\#1\) साथ-साथ \(\#2\) \(B\) तुलना में अधिक सफल है, लेकिन आश्चर्यजनक रूप से in \(G\) \(B\) \(A\) तुलना \(B\) अधिक सफल है। यह उदाहरण उन छोटे से सेट \(G\) _ \(G\) साथ \(|G|=13\) । \(G\) \(|G|<13\) साथ कोई \(G\) नहीं है \(G\) जानवर बल द्वारा प्रमाण)।
अब हम सेट पर उप-विभाजन \(G\) के बजाय \(2\) में \(3\) संबंध तोड़ना सबसेट \(\#1, \, \#2, \, \#3\) के साथ \(\#1 \cup \#2 \cup \#3 = G\) । फिर हम रोमांचक मामले का निर्माण करते हैं, जो कि पावर सेट \(P(G)\) के हर तत्व \(e_k \neq \emptyset\) लिए \(G\) निम्नलिखित लागू होता है: $$\forall e_1, e_2 \in P(G): |e_1| \neq |e_2| \Rightarrow win(e_1) \neq win(e_2) \land |e_1| = |e_2| \Rightarrow win(e_1) = win(e_2)$$ $$\forall e_1, e_2 \in P(G): |e_1| \neq |e_2| \Rightarrow win(e_1) \neq win(e_2) \land |e_1| = |e_2| \Rightarrow win(e_1) = win(e_2)$$
एक मानक कोर i7 पर कुछ घंटों की क्रूरता के बाद, निम्नलिखित उदाहरण पाया जा सकता है:
\(A\) | \(B\) | \(C\) | \(win\) | |
\(\#1\) | \(\frac{6}{7}=85,71\%\) | \(\frac{12}{15}=80,00\%\) | \(\frac{22}{37}=59,46\%\) | \(A\) |
\(\#2\) | \(\frac{95}{167}=56,89\%\) | \(\frac{48}{88}=54,55\%\) | \(\frac{38}{67}=56,72\%\) | \(A\) |
\(\#3\) | \(\frac{48}{144}=33,33\%\) | \(\frac{16}{50}=32,00\%\) | \(\frac{2}{20}=10,00\%\) | \(A\) |
\(\#1 \cup \#2\) | \(\frac{101}{174}=58,05\%\) | \(\frac{60}{103}=58,25\%\) | \(\frac{60}{104}=57,69\%\) | \(B\) |
\(\#1 \cup \#3\) | \(\frac{54}{151}=35,76\%\) | \(\frac{28}{65}=43,08\%\) | \(\frac{24}{57}=42,11\%\) | \(B\) |
\(\#2 \cup \#3\) | \(\frac{143}{311}=45,98\%\) | \(\frac{64}{138}=46,38\%\) | \(\frac{40}{87}=45,98\%\) | \(B\) |
\(\#1 \cup \#2\cup \#3\) | \(\frac{149}{318}=46,86\%\) | \(\frac{76}{153}=49,67\%\) | \(\frac{62}{124}=50,00\%\) | \(C\) |
जिससे (मनमाने ढंग से लंबे कंप्यूटिंग समय को मानते हुए) \(n\) एक ही व्यवहार वाले उपसमूह) के उदाहरण मिल सकते हैं। यदि वास्तव में ऐसे मामले होते हैं, तो समूह की सफलता की सिफारिश के आधार पर कोई भी निष्कर्ष दोनों समझदार और व्यर्थ हैं।
इस बिंदु पर, हम रोमांचक पढ़ने की सलाह देते हैं कारण : यहूदिया पर्ल द्वारा मॉडल, तर्क और आविष्कार ।