Exom >> Sven's stuff: >> Problemchen:
Simpsons Paradoxie.

Es handelt sich hierbei um eine statistische Umkehr-Paradoxie - die ursprüngliche Bedeutung einer Statistik wird umgekehrt.
Man stelle sich vor: Ein Arzt vergleicht den Erfolg einer neuen Behandlungsmethode mit dem einer alten Behandlungsmethode. Der Versuch soll in den zwei Städten Alphaville und Betatown durchgeführt werden.
Der Arzt behandelt in Alpahville insgesamt 11.000 Patienten, davon 1000 nach der herkömmlichen Methoden und 10.000 nach der neuen.
In Betatown sind es 10.100 Patienten, davon 10.000 nach der alten Methode und 100 nach der neuen.
Die Ergebnisse des Arztes sehen so aus:

Alphaville: 11.000 Betatown: 10.100
Herkömmliche Behandlung Neue Behandlung Herkömmliche Behandlung Neue Behandlung
nicht erfolgreich 950 (95%) 9000 (90%) 5000 (50%) 5 (5%)
erfolgreich 50 (5%) 1000 (10%) 5000 (50%) 95 (95%)


Wie würdet Ihr die Effektivität der neuen Behandlungsmethode bewerten?
Auf den ersten Blick schaut es so aus, als wäre die neue Methode der alten vorzuziehen, schließlich ist in Alphaville die herkömmliche Methode nur in 5% der Fälle erfolgreich, die neue hingegen in 10%. In Betatown, wo die Menschen allgemein besser auf die Behandlungen anzusprechen scheinen, ist die neue Methode sogar in 95% aller Behandlungen erfolgreich.
Ein anderes Ergebnis erzielt man aber wenn die Ergebnisse beider Städte zusammengefasst werden:

Herkömmliche Behandlung Neue Behandlung
nicht effektiv 5950 (54%) 9005 (89%)
effektiv 5050 (46%) 1095 (11%)

Nun sieht es anders aus. Was ist passiert? Zwei statistische Ergennisse sind zusammengefasst worden. Bei einer solchen Zusammenfassung gibt es immer Informationsverlust! (sonst würde auch niemand Daten zusammenfassen wollen) In diesem Fall sind die spezifischen Eigenschaften der beiden Teststädte vernachlässigt worden. Wie bereits bemerkt genesen die Leute in Betatown besonders gut - erstmal unabhängig von der Behandlungsmethodik. In Alphaville scheint es sich um durchweg sehr kranke Menschen zu handeln. Sie genesen bei keiner Methode. Solche lokalen Umstände sind nicht herbeigeredet, sondern können sehrwohl von z.B. Umweltbedingungen hervorgerufen werden. Auch sind sie für die Statistik des Arztes nicht weiter problematisch. Er will nur zwei Behandlungsmöglichkeiten miteinander vergleichen, das Ziel der Untersuchung war es eben nicht, die Daten zusammenzufassen.
Dieses Problemchen findet sich auch in dem Büchlein "Paradoxon" von Nicholas Faletta, erschienen im Fischer Taschenbuch Verlag 1988.
Direkt email an Sven:
www.exom.de
rev. März 2005