Paradoxul Simpson este unul dintre fenomenele ușor de înțeles și în același timp uimitoare din statistici. Apare ori de câte ori grupurile de date arată o anumită tendință, dar această tendință este inversată atunci când grupurile sunt combinate. Cu ajutorul unui exemplu simplu, paradoxul poate fi înțeles imediat.
Considerăm cele două seturi disjuncte \(\#1\) și \(\#2\) , precum și \(G = \#1 \cup \#2\) și testăm rata de succes a \(A\) și în cadrul acestor seturi \(B\):
\(A\) | \(B\) | \(win\) | |
\(\#1\) | \(\frac{1}{1}=100\%\) | \(\frac{3}{4}=75\%\) | \(A\) |
\(\#2\) | \(\frac{2}{5}=40\%\) | \(\frac{1}{3}=33\%\) | \(A\) |
\(\#1 \cup \#2\) | \(\frac{3}{6}=50\%\) | \(\frac{4}{7}=57\%\) | \(B\) |
Se pare că \(A\) are mai mult succes decât \(B\) în \(\#1\) , precum și în \(\#2\) \(B\) , dar surprinzător în \(G\) \(B\) mai mult succes decât \(A\) . Acest exemplu este, de asemenea, unul dintre cele cu cel mai mic set \(G\) cu \(|G|=13\) . Nu există \(G\) cu \(|G|<13\) (dovadă prin forță brută).
Acum împărțim setul \(G\) în loc de \(2\) în \(3\) subseturi disjuncte \(\#1, \, \#2, \, \#3\) cu \(\#1 \cup \#2 \cup \#3 = G\) . Apoi construim cazul interesant că pentru fiecare element \(e_k \neq \emptyset\) setul de putere \(P(G)\) din \(G\) se aplică următoarele: $$\forall e_1, e_2 \in P(G): |e_1| \neq |e_2| \Rightarrow win(e_1) \neq win(e_2) \land |e_1| = |e_2| \Rightarrow win(e_1) = win(e_2)$$ $$\forall e_1, e_2 \in P(G): |e_1| \neq |e_2| \Rightarrow win(e_1) \neq win(e_2) \land |e_1| = |e_2| \Rightarrow win(e_1) = win(e_2)$$
După câteva ore de forță brută pe un Core i7 standard, poate fi găsit următorul exemplu:
\(A\) | \(B\) | \(C\) | \(win\) | |
\(\#1\) | \(\frac{6}{7}=85,71\%\) | \(\frac{12}{15}=80,00\%\) | \(\frac{22}{37}=59,46\%\) | \(A\) |
\(\#2\) | \(\frac{95}{167}=56,89\%\) | \(\frac{48}{88}=54,55\%\) | \(\frac{38}{67}=56,72\%\) | \(A\) |
\(\#3\) | \(\frac{48}{144}=33,33\%\) | \(\frac{16}{50}=32,00\%\) | \(\frac{2}{20}=10,00\%\) | \(A\) |
\(\#1 \cup \#2\) | \(\frac{101}{174}=58,05\%\) | \(\frac{60}{103}=58,25\%\) | \(\frac{60}{104}=57,69\%\) | \(B\) |
\(\#1 \cup \#3\) | \(\frac{54}{151}=35,76\%\) | \(\frac{28}{65}=43,08\%\) | \(\frac{24}{57}=42,11\%\) | \(B\) |
\(\#2 \cup \#3\) | \(\frac{143}{311}=45,98\%\) | \(\frac{64}{138}=46,38\%\) | \(\frac{40}{87}=45,98\%\) | \(B\) |
\(\#1 \cup \#2\cup \#3\) | \(\frac{149}{318}=46,86\%\) | \(\frac{76}{153}=49,67\%\) | \(\frac{62}{124}=50,00\%\) | \(C\) |
Astfel, (presupunând un timp de calcul arbitrar lung) se pot găsi exemple de \(n\) subseturi disjuncte cu același comportament. Dacă astfel de cazuri apar în realitate, orice concluzii la recomandarea succesului grupului sunt atât sensibile, cât și inutile.
În acest moment, vă recomandăm lectura interesantă Cauzalitate: modele, raționament și deducție de Judea Pearl .