La Simpson-Paradokso

La Simpson-paradokso estas unu el la facile kompreneblaj kaj samtempe mirigaj fenomenoj en statistikoj. Ĝi okazas kiam ajn grupoj de datumoj montras apartan tendencon, sed tiu tendenco renversiĝas kiam la grupoj estas kombinitaj. Helpe de simpla ekzemplo, la paradokso estas komprenebla tuj.


Ni konsideras la du disajn arojn \(\#1\) kaj \(\#2\) same kiel \(G = \#1 \cup \#2\) kaj testas la sukcesan indicon de \(A\) kaj ene de ĉi tiuj aroj \(B\):

\(A\)\(B\)\(win\)
\(\#1\)\(\frac{1}{1}=100\%\)\(\frac{3}{4}=75\%\)\(A\)
\(\#2\)\(\frac{2}{5}=40\%\)\(\frac{1}{3}=33\%\)\(A\)
\(\#1 \cup \#2\)\(\frac{3}{6}=50\%\)\(\frac{4}{7}=57\%\)\(B\)

Rezultas, ke \(A\) pli sukcesas ol \(B\) en \(\#1\) same kiel \(\#2\) \(B\) , sed surprize en \(G\) \(B\) pli sukcesas ol \(A\) . Ĉi tiu ekzemplo ankaŭ estas unu el tiuj kun la plej malgranda aro \(G\) kun \(|G|=13\) . Ne ekzistas \(G\) kun \(|G|<13\) (pruvo per kruda forto).

Ni nun subdividas la aron \(G\) anstataŭ \(2\) en \(3\) disaj subaroj \(\#1, \, \#2, \, \#3\) kun \(\#1 \cup \#2 \cup \#3 = G\) . Tiam ni konstruas la ekscitan kazon, ke por ĉiu elemento \(e_k \neq \emptyset\) la potenca aro \(P(G)\) de \(G\) validas jeno: $$\forall e_1, e_2 \in P(G): |e_1| \neq |e_2| \Rightarrow win(e_1) \neq win(e_2) \land |e_1| = |e_2| \Rightarrow win(e_1) = win(e_2)$$ $$\forall e_1, e_2 \in P(G): |e_1| \neq |e_2| \Rightarrow win(e_1) \neq win(e_2) \land |e_1| = |e_2| \Rightarrow win(e_1) = win(e_2)$$

Post kelkaj horoj da kruda forto sur norma Core i7, la sekva ekzemplo troveblas:

\(A\)\(B\)\(C\)\(win\)
\(\#1\)\(\frac{6}{7}=85,71\%\)\(\frac{12}{15}=80,00\%\) \(\frac{22}{37}=59,46\%\) \(A\)
\(\#2\)\(\frac{95}{167}=56,89\%\) \(\frac{48}{88}=54,55\%\) \(\frac{38}{67}=56,72\%\) \(A\)
\(\#3\)\(\frac{48}{144}=33,33\%\) \(\frac{16}{50}=32,00\%\) \(\frac{2}{20}=10,00\%\) \(A\)
\(\#1 \cup \#2\)\(\frac{101}{174}=58,05\%\) \(\frac{60}{103}=58,25\%\) \(\frac{60}{104}=57,69\%\) \(B\)
\(\#1 \cup \#3\)\(\frac{54}{151}=35,76\%\) \(\frac{28}{65}=43,08\%\) \(\frac{24}{57}=42,11\%\) \(B\)
\(\#2 \cup \#3\)\(\frac{143}{311}=45,98\%\) \(\frac{64}{138}=46,38\%\) \(\frac{40}{87}=45,98\%\) \(B\)
\(\#1 \cup \#2\cup \#3\)\(\frac{149}{318}=46,86\%\) \(\frac{76}{153}=49,67\%\) \(\frac{62}{124}=50,00\%\) \(C\)

Tiel (supozante arbitre longan komputadan tempon) ekzemploj de \(n\) disaj subaroj kun la sama konduto troveblas. Kiam tiaj kazoj okazas en realo, iuj konkludoj bazitaj sur rekomendo por sukceso de grupo estas kaj prudentaj kaj sencelaj.

Je ĉi tiu punkto, ni rekomendas la ekscitan legadon Kaŭzeco: Modeloj, Rezonado kaj Konkludo de Judea Pearl .

Reen