Wahn, Wunsch und Wirklichkeit in der Statistik

Wahn, Wunsch und Wirklichkeit in der Statistik Wie durch statistische Interpretationsfehler irrige Überzeugungen entstehen 13. Juni 2017, Planetarium ...
Author: Busso Frei
2 downloads 2 Views 1MB Size
Wahn, Wunsch und Wirklichkeit in der Statistik Wie durch statistische Interpretationsfehler irrige Überzeugungen entstehen 13. Juni 2017, Planetarium Nürnberg Katharina Schüller

1

Warum ist dieser Ring so wertvoll?

1

2 3 4

Rohmaterial besorgen (Gold, Rohdiamant)

Säuberung und Materialaufbereitung (Gold extrahieren und Diamant schleifen)

Material zu Schmuckstück zusammenfügen

Interpretation hinzufügen (der Tiffany Stempel) Wert und Wahn entstehen in Schritt 4

Quelle: Tiffany

2

Agenda

▪ Einführung

▪ Medien und Verbrauchermeinung ▪ Politisches Handeln ▪ Rechtsprechung

▪ Fazit

3

Einführung

4

Einführung

Vorstellung von Statistik ▪

Liefert Zahlen für rationale Entscheidungen ▪ ▪ ▪



Hinter jeder Mathe-Aufgabe steht ein Wert, der richtig oder falsch ist (Schule) Kopf weiß: bei Statistik geht um Wahrscheinlichkeiten (sehen aber auch aus wie exakte Zahlen) Bauch erwartet: „mathematische“ Aussagen – so werden Statistiken aufgefasst

Statistische Analysen schaffen eine scheinbare Sicherheit – das Problem wird mit Big Data noch zunehmen

“There are a lot of small data problems that occur in big data. They don’t disappear because you’ve got lots of the stuff. They get worse.” (Tim Harford) 5

6

Warum Statistical Literacy? „Nobody wants data. What they want are the answers.“ (David Hand)

▪ Hilft Big Data dabei, schwangere Kundinnen zu identifizieren – womöglich bevor diese es selbst wissen?

Öl? Ziemlich oldschool oder?! Daten sind das neue schwarze Gold, Google Analytics files,… Facebook Credits mein Mädchen!

▪ Oder ist das nur ein Beispiel für das Statistische Gesetz der sehr großen Zahlen? Wir suchen Muster, um in komplexer Welt zu überleben (schnelles Denken).  Aber Statistical Literacy erfordert langsames Denken.

Quelle: Pixabay

6

Einführung

Typische Denkmuster • Was ist Entscheidungskompetenz? • Wichtige Fähigkeit, die von Managern und Politikern verlangt wird • Kompetenz, mit Unsicherheit umzugehen • Falsche Denkmuster: • Es gibt genau eine richtige, gute und Erfolg versprechende Lösung, die man nur finden muss • Es gibt mindestens eine falsche, schlechte, zum Scheitern verurteilte Alternative • Variante für Journalisten: • Es gibt etwas „Wahres“ und die Wahrheit ist dauerhaft • Es gibt etwas „Falsches“, „Schlechtes“, das ein Journalist aufdecken muss • Realität: Zufall, Unsicherheit, Ambivalenzen „Es gibt ein Gentlemen‘s Agreement unserer Medien, dass im Dienste einer guten Sache die Wahrheit nicht so wichtig ist.“ (Walter Krämer) 7

Einführung

Kernthese • Statistisches Denken heißt: Umgang mit Risiken und Unsicherheiten • In einer Informationsgesellschaft gibt es immer mehr und immer mehr widersprüchliche Daten  Unqualifizierte Überinformiertheit • Datenanalyse allein bringt keine 100% Sicherheit • Unsicherheit auszuhalten ist umso schwieriger, je mehr es eigentlich um Moral geht, um „gut“ und „böse“, um „richtig“ und „falsch“ • Hilfs-Lösung zur Entscheidungsfindung: • Wir treffen Annahmen über die Daten, um ihnen Bedeutung zu verleihen • Daten + Annahmen über Daten = „sichere“ Aussage, „zwingender“ Schluss • Wir vergessen dabei oft, dass es mehr als eine mögliche Annahme gibt  Fehlentscheidung, weil die Statistik beweisen soll, was zu den eigenen Annahmen passt  Geht es dabei um gesellschaftsrelevante Entscheidungen, so folgt: Ein Mangel an statistischer Allgemeinbildung ist kein individuelles Problem, sondern ein gesellschaftliches.

8

Medien und Verbrauchermeinung

9

Medien und Verbraucher

Kursverlauf der Deutschen Bank Aktie „Deutsche Bank: Investoren haben kaum Hoffnung“ (Der Aktionär, 17.04.2015)

Deutsche Bank auf Schrumpfkurs: Bestraft der Kapitalmarkt eine falsche Strategie?

Quelle: Onvista

„Sorgen um Strategie lässt (sic!) Risikoprämie steigen“ (Handelsblatt, 21.04.2015)

Bekanntgabe der Strategie am 27.04.2015. „Kritik am Konzernumbau: Deutsche-Bank-Aktie schmiert ab“ (Spiegel Online) 10

Medien und Verbraucher

Kursverlauf der Deutschen Bank Aktie, etwas länger Quelle: Onvista

Oder haben nur ein paar Investoren auf eine andere Strategie spekuliert?

„Neue Strategie: Bank will wieder bei Übernahmen mitmischen“ (Handelsblatt, 29.01.2014)

„Man kann den Medien eben nicht erklären, wie Kapitalmärkte funktionieren.“ (Vorstand der DB auf der Frühjahrssitzung 2015 des Regionalbeirats Bayern) 11

Medien und Verbraucher

Kritische Medien, Pharmalobby und Regenwald Quelle: Facebook

12

Medien und Verbraucher

Kritische Medien, Pharmalobby und Regenwald Wednesday 8 October 2014 03.43 BST*

Cancer tumours destroyed by berry found in Queensland

* Quelle: http://www.theguardian.com/society/201 4/oct/08/cancer-tumours-destroyed-byberry-queensland-rainforest

A single injection of the drug directly into melanoma models in the laboratory, as well as into cancers of the head, neck and colon in animals, destroyed the tumours long-term in more than 70% of cases. (...) “Within five minutes, you see a purpling of the area (...) about 24 hours later, the tumour area goes black, a couple of days later you see a scab, and at around the 1.5 week mark, the scab falls off, leaving clean skin.” (...) There was no evidence EBC-46 would be effective to treat metastatic cancers. The drug is being developed as a pharmaceutical through QBiotics. The company is also examining the potential for a blushwood plantation. (...) Even if [phase 1 human clinical trials] proved successful, it was unlikely the drug would replace conventional chemotherapy treatment. 13

Medien und Verbraucher

Kritische Medien, Pharmalobby und Regenwald Published: October 1, 2014*

Intra-Lesional Injection of the Novel PKC Activator EBC-46 Rapidly Ablates Tumors in Mouse Models

* Quelle: http://journals.plos.org/plosone/article?id =10.1371/journal.pone.0108887

Intra-lesional chemotherapy for treatment of cutaneous malignancies has been used for many decades. Here we describe a novel diterpene ester, EBC-46, and provide preclinical data supporting its use as an intra-lesional treatment. (...) EBC-46 was purified from the kernels of the fruit from Fontainea picrosperma, was provided by QBiotics Ltd.. (...) Our results demonstrate that a single intra-lesional injection of EBC-46 causes PKC-dependent hemorrhagic necrosis, rapid tumor cell death and ultimate cure of solid tumors in pre-clinical models of cancer. (...)

Animal ethics statement Mice were humanly euthanized by asphyxiation at the end of the experiment

14

Politisches Handeln

15

Politisches Handeln

Staatsgarantien People queuing outside a branch in Golders Green, London, on 14 September 2007, to withdraw their savings due to fallout from the subprime crisis.

* Quelle: https://en.wikipedia.org/wiki/Northern_R ock#/media/File:Northern_Rock_Customer s,_September_14,_2007.jpg

16

Politisches Handeln

Geplanter Verschleiß

Wie kommen die kleinen Löcher in unsere T-Shirts? Woher kommen bloß die kleinen Löcher in den T-Shirts? Gibt es kleine Waschmaschinen-Geister, die sich während des Waschgangs an unseren Lieblingsshirts bedienen? (...) Ein Team der WDR-Servicezeit ist nun der Frage nachgegangen und hat eine wahrscheinliche Antwort gefunden. (...) ▪ 1. 2. 3. 4.

Die vier Thesen: Motten Waschmaschine Knöpfe und Co. Die Hersteller * Quelle: http://www.brigitte.de/wohnen/haushalt/l oecher-t-shirts-ursachen-1255748/

17

Politisches Handeln

Geplanter Verschleiß Christian Kreiß, Autor des Buchs "Geplanter Verschleiß", sagt gegenüber dem WDR dazu: "Es ist mit Sicherheit geplant, denn so eine wichtige Größe wie die Haltbarkeit, die Lebensdauer von Gütern, das ist für einen Hersteller ganz extrem wichtig und das überlässt man nicht dem Zufall. Ich würde unterstellen (...), dass das festgelegt wird, wie lang diese T-Shirts ungefähr halten sollen.“ Die WDR Servicezeit kommt zu dem Fazit, dass es eine Kombination aus Reibung und minderwertiger Qualität ist, die die Löcher in T-Shirts verursacht. Der Preis, den wir für ein T-Shirt hinlegen, entscheidet aber im Zweifel nicht über die Qualität.

18

Politisches Handeln

Geplanter Verschleiß Dienstag, 18. August 2015*

Gezielt eingebaute Schwachstellen

Frankreich verbietet geplante Obsoleszenz

* Quelle: http://www.n-tv.de/wirtschaft/Frankreichverbietet-geplante-Obsoleszenzarticle15746266.html

Nachdem die Garantie abgelaufen ist, geht der Laptop kaputt. Das ist nicht nur ärgerlich, sondern von manchen Herstellern so gewollt. Dem sagt Frankreich nun den Kampf an: Ab sofort ist die "geplante Obsoleszenz" strafbar. Doch einfach zu verfolgen ist das nicht. (...) Denn der Kläger muss zunächst zeigen, dass die Lebensdauer bewusst verkürzt wurde, führt der auf Umweltfragen spezialisierte Anwalt Arnaud Gossement aus - aber was wäre dann die theoretische "normale" Lebensdauer? Gezeigt werden müsste auch, dass für die Verkürzung der Lebensdauer eine klar erkennbare "Technik" verwendet wurde. Und dann muss dem Hersteller auch Vorsatz nachgewiesen werden.

19

Rechtsprechung

20

Rechtsprechung

DNA-Spuren: Daten und ihre Bedeutung XX. Oktober 2013* Polizei sucht Zeugen

Mord in der B-Straße

* Quelle: Süddeutsche Zeitung

Seit Tagen wurde sie nicht gesehen, dann bricht die Feuerwehr die Tür ihrer Wohnung auf - und findet die 69-jährige Witwe tot. Sie wurde ermordet. Die Polizei sucht nun nach Zeugen, die das Opfer noch lebend gesehen haben. XX. Januar 2014** Witwenmord in der M-Straße

Polizei verhaftet Tatverdächtigen

** Quelle: Süddeutsche Zeitung

Drei Monate nach dem Mord an einer 69-jährigen in der B-Straße ist der mutmaßliche Täter gefasst worden. Das teilte das Polizeipräsidium am Donnerstag mit. Demnach waren im Oktober DNA-Spuren an der Leiche und in der Wohnung der Witwe gesichert worden, die inzwischen einem 36-Jährigen aus dem Landkreis E zugeordnet werden konnten. Namen und Orte wurden verändert. Genaue Quellen auf Anfrage. 21

Rechtsprechung

DNA-Spuren: Daten und ihre Bedeutung Argumentation der Staatsanwaltschaft • An Tatort und Leiche Vielzahl von Mischspuren (d.h. verursacht von mindestens zwei Personen) • Nicht alle können konkreten Personen zugeordnet werden • Zur DNA des Tatverdächtigen passen Dutzende Spuren; biostatistische Berechnung: Übereinstimmung mit Wahrscheinlichkeit ca. 1:1 Bio Überlegung, was ein Statistiker tun kann: • Datenprüfung: gerichtsmedizinisches Gutachten umfasst ca. 500 Seiten und ca. 1000 Spuren – wurde evtl. etwas übersehen? • Stimmen die biostatistischen Berechnungen (i.d.R. ja) Ergebnis der Datenprüfung: • Großteil der Spuren passen nur zum Tatverdächtigen unter Annahme von Allelic Dropout, Zusatzbanden ...  frisch oder alt? • Viele Spuren: multiple Bandenmuster  eine oder mehrere Personen?

22

Rechtsprechung

DNA-Spuren: Daten und ihre Bedeutung 1. April 2015

Landgericht A

Mord im H-Viertel bleibt ungesühnt • Das Landgericht A spricht einen 37-Jährigen vom Vorwurf frei, die Witwe Erna B. erdrosselt zu haben - obwohl es belastende Hinweise gibt. • In der Wohnung der Toten sowie an deren Körper und Kleidung entdeckten Fahnder zahlreiche DNA-Spuren, die dem Angeklagten zugeordnet wurden. • Neben den DNA-Spuren von Stefan W. war aber auch genetisches Material von drei bis vier weiteren Männern gefunden worden. (...) Allerdings, sagte der Vorsitzende Richter Rudolf K. am Mittwoch bei der Urteilsbegründung, ergäben sich aus den Feststellungen, die hieraus gewonnen wurden, "erhebliche Zweifel" hinsichtlich der Täterschaft des Angeklagten. (...)

* Quelle: Süddeutsche Zeitung

Fortsetzung folgt ...

23

Rechtsprechung

Zeugenaussagen, Indizien und Beweise XX. September 2015*

Strafprozess

Ist Richard R. wirklich der Kapuzenmann? Der „Kapuzenmann“-Prozess ist noch nicht abgeschlossen. Es ist ein Präzedenzfall, wie groß die Kluft sein kann zwischen der tatsächlichen Beweislage und der Meinungsbildung eines Schwurgerichts. Nun muss der Bundesgerichtshof entscheiden. (...) Es gebe zwar keine klassischen Beweise, aber eine schlüssige Indizienkette. (...) Vor Gericht kommen dann auch weitere Merkmale des Täters zur Sprache: "basedowartige (hervorquellende) Augen". Das ist bei Richard R. nachweislich nicht der Fall. "Sehr dichte, stark geschwungene, rotblonde Wimpern; dichte, rotblonde Augenbrauen, Sommersprossen und rötliche Bartstoppeln." Richard R. ist dunkelhaarig. Erwähnenswert auch ihre Größenangabe: 1,70 bis 1,75 Meter. R. ist 1,85 Meter groß. Dass der „Kapuzenmann" höchstens 1,75 Meter maß, hatten übrigens auch Helmut K. und dessen Frau angegeben.

* Quelle: Morgenpost

Namen und Orte wurden verändert. Genaue Quellen auf Anfrage. 24

Rechtsprechung

Zeugenaussagen, Indizien und Beweise Argumentation der Staatsanwaltschaft • BKA NRW: Studie, dass Zeugen Körpergröße von Tätern oft unterschätzen • Falsche Größenschätzung spricht nicht gegen Angeklagten Überlegung, was ein Statistiker tun kann: • Typische Unterschätzung? Wie wahrscheinlich unterschätzen mehrere Zeugen den Täter alle in gleichem Ausmaß? • Zumal weitere Zeugen den Angeklagten gesehen haben und seine Körpergröße richtig einschätzen? • Nullhypothese: Tatzeugen haben dieselbe Person gesehen wie diejenigen, die den Angeklagten gesehen haben •  Test auf Mittelwertsunterschiede der Schätzungen 25

Rechtsprechung

Zeugenaussagen, Indizien und Beweise Ergebnis der Datenprüfung: • Klare Signifikanz, auch bei Berücksichtigung Schätzunsicherheit (d.h. Varianz innerhalb der jeweiligen Zeugenaussagen) • Statistische Berechnungen fließen ein in Revisionsbegründung „Die richterliche Überzeugungsbildung darf nicht gegen die allgemeinen Denkgesetze verstoßen; dazu gehört auch die Wahrscheinlichkeitsrechnung.“ (Schweizer, M.: Beweiswürdigung und Beweismaß: Rationalität und Intuition)

Entscheidung des Bundesgerichtshofs im April 2016: • Richard R. ist der Täter 26

Fazit

27

Statistik: Wunsch und Wirklichkeit

Falsches Verständnis von Korrelation Ohne Idee, wie es zu der Korrelation kommt, kann man nicht wissen, was diese Korrelation zerstören könnte (Google Flu Trend Beispiel).

Sampling Bias Im Prinzip ist es möglich, jede Nachricht auf Twitter zu analysieren, um die Stimmung in der Bevölkerung zu erfassen. Aber Twitter repräsentiert nicht die Weltbevölkerung

 Wer und was fehlt?

Falsche Positivrate Sammle so viele Daten, bis es einen Effekt gibt (Target Beispiel).

Multiples Vergleichsproblem Größe, Gewicht, Karies etc. um zu testen, ob Vitamine wirken. Irgendwo wird immer ein Effekt gefunden.

28

Fazit

„Statistik ist das Informationsmittel der Mündigen…“ „Wenn wir mündige Bürger in einer modernen technologischen Gesellschaft möchten, dann müssen wir ihnen drei Dinge beibringen: Lesen, Schreiben und statistisches Denken, das heißt den vernünftigen Umgang mit Risiken und Unsicherheiten. “ (H. G. Wells)

29

Vielen Dank! … und was können wir als Statistik-Experten dafür tun? Darüber würde ich gerne diskutieren!

Zum Weiterlesen: • Schüller, K. (2016): Statistik und Intuition: Alltagsbeispiele kritisch hinterfragt. Heidelberg, Springer Spektrum. • https://www.confront.news/wp-content/uploads/2017/06/confront-2017-2.pdf • http://www.unstatistik.de

30

Suggest Documents