Nahezu täglich sehen wir Nachrichten, welche neusten Test die LLMs gelöst haben - und die Tests sind häufig sehr komplex, wie z.B. Zulassungsprüfungen von Anwälten oder medizinische Examina. Doch gleichzeitig ist es verblüffend, an welchen einfachen Fragen LLMs scheitern. Tyler Cowen schrieb, dass die LLMs die für die Menschen mit Internetzugang einfache Frage nicht richtig beantworten Name three famous people who all share the exact same birth date and year Das Scheitern der LLMs, diese und ähnlich einfachen Fragen zu beantworten, kann uns wichtige Hinweise liefern, wie diese funktionieren. Es ist vielleicht am besten zu sagen, dass LLMs unglaubliche Intuition, aber begrenzte Intelligenz zeigen. Sie können fast jede Frage beantworten, die in einem intuitiven Durchgang beantwortet werden kann. Und mit ausreichend Trainingsdaten und genügend Schritten können sie sich einer Art von begründeter Intelligenz annähern. Mit anderen Worten, es gibt eine "Zielverschiebung", bei der,...
In den letzten Wochen habe Virologen und andere Experten ihre Einschätzungen der Lage treffend beschrieben und immer wieder darauf hingewiesen, warum es wichtig ist, Großveranstaltungen zu untersagen. Klassischerweise geht bei der Risikobeurteilung um die Wahrscheinlichkeit eines Risikoereignisses. Die leitende Beispielfrage soll in diesem Beitrag daher sein: ’Wie hoch ist die Wahrscheinlichkeit, bei einer Veranstaltung mit 42000 Menschen mindestens einen infizierten Überträger unter den Besuchern zu haben?‘ Ich will die Rechnung für eine Stadt mit 580.000 Einwohnern und 58 Infizierten anstellen. Ferner kommen die Besucher aus einer zufällig gezogenen Grundgesamtheit, d.h. Infizierte besuchen nicht absichtlich die Veranstaltung.
Die Wahrscheinlichkeit, einen infizierten Träger als Veranstaltungsbesucher zu haben, lautet $P(Y\geq 1)=(1-P(Y=0))=(1-(1-\frac{i}{g})^b)=(1-(1-\frac{58}{580000})^{42000})$ (i: Anzahl Infizierter, g: Anzahl Stadteinwohner, b: Anzahl Veranstaltungsbesucher). Die Rechnung ergibt 0.985, also rund 98.5%. Mit 98.5%-iger Wahrscheinlichkeit wird mindestens ein infizierter Träger in der Veranstaltung sein, obwohl nur 58 von 580000, also 0.01%, der Stadtbewohner, infiziert sind!
Das Interessante an der Rechnung ist, dass die Größe der Gruppe viel stärker die Wahrscheinlichkeit beeinfluss als die Anzahl der infizierten Träger. Wenn wir die Anzahl der infizierten Träger im Beispiel auf die Hälfte (29 Infizierte) reduzieren, sinkt die Wahrscheinlichkeit gerade mal auf 87.76%. Wenn wir dagegen die Anzahl der Veranstaltungsbesucher im Beispiel von 42000 auf 1000 reduzieren, sinkt die Wahrscheinlichkeit für mindestens einen infizierten Besucher auf 9.5%. Wenn die Anzahl der Besucher 100 ist, ist die Wahrscheinlichkeit gerade bei 1%. Und bei 10 Besuchern ist sie 0.01%.
Da vor allem die Gruppengröße die Wahrscheinlichkeit beeinflusst, einen infizierten Überträger in einer Veranstaltung als Besucher zu haben, ist es (aus statistischer Sicht) sinnvoll, Veranstaltungen von mehr als 100 Menschen zu untersagen. Selbst wenn sich die Anzahl der Infizierten in der Stadt von 58 auf 580 verzehnfacht, steigt die Wahrscheinlichkeit eines infizierten Besuchers auf 9.5%.
Sie können mein Beispiel auf Ihre Veranstaltung, Schulklasse, Firma, Kneipe, den Kindergarten u.ä. in Ihrer Region adaptieren. Dann wird schnell klar, warum wir lieber zu Hause bleiben sollen.
PS. Wir können die Wahrscheinlichkeit auch mit der Binomialverteilung bestimmen. Wenn Sie Excel haben, tippen Sie ein "=1 - BINOM.VERT((Zahl infizierter Träger)-1; Anzahl Besucher der Veranstaltung; (Anzahl bereits Infizierter)/Stadtgröße; 1)" Für unsere obige Ausgangsfrage hätten wir "=1 - BINOM.VERT(0; 42000; 58/580000; 1)" benutzt.
Comments
Post a Comment