Testen von Hypothesen < Fachdidaktik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) reagiert/warte auf Reaktion | Datum: | 14:52 So 03.07.2011 | Autor: | Mathegirl |
Aufgabe | Verdeutlichen sie anhand der Hörtest Aufgabe, was Krauss und Wassner mit ihrem Vorschlag zum veränderten Herangehen an das Testen von Hypothesen meinen. Stellen sie diese Vorgehensweise dem bisher üblichen Verfahren gegenüber.
(Hinweis: Sie müssen die Aufgabenstellung gegebenenfalls anpassen)
Aufgabe:
Als Studiogast bekommt man im Tonstudio über Raumboxen 12 Musikstücke einegspielt. Jedes Musikstück wird entweder in Tonqualität MP3-96, MP3-128 oder CD vorgespielt. Die Klangqualität jedes Musikstückes soll erkannt werden.
Für einen Preis muss man von 12 Liedern mindestens 8 Lieder in ihrer Qualität richtig erkennen.
Angenommen: Ein Studiogast hört die Qualotät bei 8 Liedern richtig raus und bekommt einen Preis. ist er damit wirklich besser als ein sogenannter Nullhörer, also jemand, der die Klangqualität bei jedem Lied nur errät?
Vorgensweise von Kraus und Wassner:
1. Bedingte wahrscheinlichkeit, Satz von Bayes und den Gegriff der Hypothese einführen.
2. Signifikanztests sollten durch Zuhilfenahme bedingter Wahrscheinlichkeiten dargestellt und über einen vergleich von a) und b) der Formel von Bayes gegeübergestellt werden.
(a) P(H|D) liegt Bayesschen Testverfahren zugrunde
(b) [mm] P(D|H_0) [/mm] liegt Signifikanztests zugrunde
Herkömmliches Verfahren:
1. bedingte Wahrscheinlichkeit, Satz von Bayes mit allgemeinen Ereignissen A und B eingeführt, ohne Berücksichtigung des Hypothesenbegriffs
2. Anschließende Einführung davon losgelöster Signifikanztests und Einführung Hypothesenbegriff, und zwar unabhängig von bedingten Wahrscheinlichkeiten. |
Kann mir jemand sagen, wie ich bei dieser Aufgabe am besten Vorgehe? Mich irritiert der Hinweis etwas: Passen sie die Aufgabenstellung gegebenfalls an....
Gruß
Mathegirl
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 15:18 So 03.07.2011 | Autor: | abakus |
> Verdeutlichen sie anhand der Hörtest Aufgabe, was Krauss
> und Wassner mit ihrem Vorschlag zum veränderten
> Herangehen an das Testen von Hypothesen meinen. Stellen sie
> diese Vorgehensweise dem bisher üblichen Verfahren
> gegenüber.
>
> (Hinweis: Sie müssen die Aufgabenstellung gegebenenfalls
> anpassen)
>
> Aufgabe:
> Als Studiogast bekommt man im Tonstudio über Raumboxen 12
> Musikstücke einegspielt. Jedes Musikstück wird entweder
> in Tonqualität MP3-96, MP3-128 oder CD vorgespielt. Die
> Klangqualität jedes Musikstückes soll erkannt werden.
> Für einen Preis muss man von 12 Liedern mindestens 8
> Lieder in ihrer Qualität richtig erkennen.
> Angenommen: Ein Studiogast hört die Qualotät bei 8
> Liedern richtig raus und bekommt einen Preis. ist er damit
> wirklich besser als ein sogenannter Nullhörer, also
> jemand, der die Klangqualität bei jedem Lied nur errät?
>
> Vorgensweise von Kraus und Wassner:
> 1. Bedingte wahrscheinlichkeit, Satz von Bayes und den
> Gegriff der Hypothese einführen.
> 2. Signifikanztests sollten durch Zuhilfenahme bedingter
> Wahrscheinlichkeiten dargestellt und über einen vergleich
> von a) und b) der Formel von Bayes gegeübergestellt
> werden.
>
> (a) P(H|D) liegt Bayesschen Testverfahren zugrunde
> (b) [mm]P(D|H_0)[/mm] liegt Signifikanztests zugrunde
>
>
> Herkömmliches Verfahren:
> 1. bedingte Wahrscheinlichkeit, Satz von Bayes mit
> allgemeinen Ereignissen A und B eingeführt, ohne
> Berücksichtigung des Hypothesenbegriffs
> 2. Anschließende Einführung davon losgelöster
> Signifikanztests und Einführung Hypothesenbegriff, und
> zwar unabhängig von bedingten Wahrscheinlichkeiten.
>
> Kann mir jemand sagen, wie ich bei dieser Aufgabe am besten
> Vorgehe? Mich irritiert der Hinweis etwas: Passen sie die
> Aufgabenstellung gegebenfalls an....4
Hallo,
eine eins-zu-eins-Übertagung ist nicht so ohne weiteres möglich.
Beim klassischen Hypothesentest hat man eine Eigenschaft, die entweder vorhanden ist oder nicht (z.B. ein Teil ist fehlerhaft oder in Ordnung).
Beim beschriebenen Hörtest hat man DREI Qualitätsstufen.
Vermutlich bezieht sich die Notwendigkeit der Anpassung auf diesen Unterschied.
Gruß Abakus
>
>
> Gruß
> Mathegirl
|
|
|
|
|
Das verstehe ich leider nicht. ich weiß auch nicht ganz genau wie ich hierbei Vorgehen soll. Soll ich die Signifikanz sowohl anch herkömmlichem als auch dem neuen verfahren bestimmen? Wobei man das ja nicht so übernehmen kann. ich tue mich da etwas schwer....
Mathegirl
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 21:45 So 03.07.2011 | Autor: | Blech |
Hi,
Für jedes Stück kann man entweder richtig oder falsch liegen, es ist also ein Bernoulli-Experiment mit Erfolgswkeit p. Alle 12 zusammen sind dementsprechend binomialverteilt. Die Nullhypothese ist "alles ist Zufall", d.h. $p=1/3$, und das Ereignis über das wir reden ist, daß jemand 8 von 12 richtig hatte und ob das schon signifikant ist.
Was ist jetzt [mm] $P(D|H_0)$ [/mm] und [mm] $P(H_0|D)$?
[/mm]
ciao
Stefan
|
|
|
|
|
Sorry aber DAS verstehe ich jetzt gerade nicht so richtig....ich weiß auch gerade nicht so richtig wie man [mm] P(H_0/D) [/mm] und [mm] P(D/H_0) [/mm] berechnet...
Mathegirl
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 22:21 Mo 04.07.2011 | Autor: | Blech |
> Sorry aber DAS verstehe ich jetzt gerade nicht so richtig....
Sorry aber DAS verstehe ich jetzt gerade nicht so richtig....etwas präziser, bitte?
> ich weiß auch gerade nicht so richtig wie man $ [mm] P(H_0/D) [/mm] $ und $ [mm] P(D/H_0) [/mm] $ berechnet...
Nicht $ [mm] P(D/H_0) [/mm] $, $ [mm] P(D|H_0) [/mm] $. Bedingte Wahrscheinlichkeit. Davon wirst Du doch sicher schon gehört haben, weil sonst die Aufgabe ziemlich strange wäre.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:50 Mo 04.07.2011 | Autor: | rabilein1 |
>
> (a) P(H|D) liegt Bayesschen Testverfahren zugrunde
> (b) [mm]P(D|H_0)[/mm] liegt Signifikanztests zugrunde
Was sollen denn hier H , D und [mm] H_0 [/mm] bedeuten?
Wie groß sind diese Werte in dem konkreten Beispiel?
Ich vermute mal, dass das eine bedeuten soll: Wie groß ist die Wahrscheinlichkeit, dass man mindestens 8 Treffer erzielt, wenn man rät? (ähnlich wie beim Toto: es gibt 3 Möglichkeiten, und man soll 8 Richtige haben)
Und beim anderen wäre die Frage umgekehrt: Wie groß ist die Wahrscheinlichkeit, dass jemand bloß geraten hat, wenn er 8 Treffer erzielt hat?
|
|
|
|
|
Dann muss ja H=8 sein und D=12 und [mm] H_0=0 [/mm] oder????
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 22:36 Mo 04.07.2011 | Autor: | Blech |
Hast Du schon mal Hypothesentests gemacht? Sagt Dir Bayessche Statistik etwas?
P(12|0) ist nämlich nicht wirklich ein sinnvoller Ausdruck.
[mm] $H_0$ [/mm] ist die Nullhypothese. D das eingetretene Ereignis. H ist eine Erweiterung der Nullhypothese, aber das kommt später.
|
|
|
|
|
das Problem ist, dass ich noch nie Hypothesentests gemacht habe. Vom Bayesschen Testverfahren ist mir lediglich bekannt, dass es angewendet wird,
[mm] H_0 [/mm] ist die Nullhypothese also [mm] p=\bruch{1}{3} [/mm] und D das beobachtete Ereignis, also 8
Das Problem ist, ich kenne bisher nur Hypothesentests wo z.B. Wahrscheinlichkeiten für gutes oder schlechtes Wetter oder ähnliches berechnet werden soll.
[mm] P(H_0) [/mm] ist die apriori W.
P(D) ist die unbedingte W. von D
[mm] P(D|H_0) [/mm] Annahme, dass die Nullhypothese wahr ist
[mm] P(H_0|D) [/mm] Nullhypothese wird verworfen
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:05 Di 05.07.2011 | Autor: | M.Rex |
Hallo
> das Problem ist, dass ich noch nie Hypothesentests gemacht
> habe. Vom Bayesschen Testverfahren ist mir lediglich
> bekannt, dass es angewendet wird,
Dann wirst du jetzt wohl damit anfagen müssen, konkret zu handeln.
Deinem Profil entnehme ich, dass du Lehramtsstudentin bist. Da wirst du wohl oder übel auch vor unbekannten Situationen stehen, die du dann mit deinem bekannten theoretischen Wissen abarbeiten musst.
Du hast in diesem (und anderen Threads) oft genug die Bausteine genannt bekommen, mach also was draus.
Ich kann dir aus der Erfahrung als Lehramtsstudent (und auch Mitglied einer freiwilligen Feuerwehr) nur sagen, dass man oft genug in Situatieon kommt, die auf den ersten Blick unlösbar sind, dann muss man eben versuchen, all das, was man bisher irgendwie tehoretisch aufgeschnappt hat, in diesem Moment umzusetzen.
Es sieht halt blöd aus, wenn du als Lehrer dann so gar keine Idee hast, wie es jetzt weitergeht.
>
> [mm]H_0[/mm] ist die Nullhypothese also [mm]p=\bruch{1}{3}[/mm] und D das
> beobachtete Ereignis, also 8
>
> Das Problem ist, ich kenne bisher nur Hypothesentests wo
> z.B. Wahrscheinlichkeiten für gutes oder schlechtes Wetter
> oder ähnliches berechnet werden soll.
Also hast du schon Hypothesentests gemacht
>
> [mm]P(H_0)[/mm] ist die apriori W.
> P(D) ist die unbedingte W. von D
> [mm]P(D|H_0)[/mm] Annahme, dass die Nullhypothese wahr ist
> [mm]P(H_0|D)[/mm] Nullhypothese wird verworfen
Wohl wahr. Jetzt beziehe das noch auf diese Aufgabe.
Rechne mal selber los, unter Umständen läuft da auch mal was schief, was jetzt aber noch nicht schlimm ist. Nur so bekommst du aber die Sicherheit.
Marius
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:01 Di 05.07.2011 | Autor: | Blech |
> das Problem ist, dass ich noch nie Hypothesentests gemacht habe. Vom Bayesschen Testverfahren ist mir lediglich bekannt, dass es angewendet wird,
oO
Das ist...suboptimal. Wer zum Henker kam auf die brilliante Idee, dann diese Aufgabe zu stellen?
|
|
|
|
|
Status: |
(Frage) reagiert/warte auf Reaktion | Datum: | 14:32 Di 05.07.2011 | Autor: | Mathegirl |
???? das verstehe ich jetzt nicht?
Kann mir nicht irgend jemand erklären wie man sowas amcht? Oder vielleicht an einem ähnlichen beispiel erklären?
Ich weiß halt nur das [mm] H_0= \bruch{1}{3} [/mm] mein D ist 8 so, jetzt bin ich mir aber nicht sicher was H sein soll. Gnau darin liegt ja mein Problem! wenn jemand sagen würde ob dieses so stimmen würde, könnte ich auch rechnen, denn wenn das schonmal komplett falsch ist, dann rechne ich komplett quer!
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:15 Di 05.07.2011 | Autor: | fred97 |
> ???? das verstehe ich jetzt nicht?
Edit: gestrichen
FRED
|
|
|
|
|
Hallo Mathegirl,
ich denke, dass man, um dir auf diese Frage eine fundierte
Antwort geben zu können, sich zuerst ein Stück weit in die
Kritik von Krauss/Wassner am herkömmlichen Umgang mit
Hypothesentests und mit ihren eigenen Vorschlägen vertiefen
müsste.
Du solltest wohl am ehesten in der Lage sein, einen entspre-
chenden Lektüre-Tipp anzugeben. Auf welche Grundlagen
stützt sich die Aufgabe ?
LG Al-Chw.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 17:27 Mo 04.07.2011 | Autor: | Mathegirl |
Für diese Aufgabe ist keine Literaturquelle angegeben, lediglich der Text und die Hinweise zum Vorgehen von Krauss und Wassner.
|
|
|
|
|
Status: |
(Frage) reagiert/warte auf Reaktion | Datum: | 16:43 Di 05.07.2011 | Autor: | Al-Chwarizmi |
Hallo alle,
ich finde, dass hier zum Teil fast etwas zu sehr bemängelt
wurde, dass die Fragestellerin kaum eigene Lösungsansätze
produzieren konnte.
Mir scheint es auch recht seltsam, dass diese Aufgabe
anscheinend ohne eine darauf hinführende Vorbereitung
gestellt wurde. Um mich über die Idee von Krauß und Wassner
schlau zu machen, habe ich einmal deren Aufsatz
"Wie man das Testen von Hypothesen einführen sollte"
gelesen.
Auch nach dieser Lektüre ist mir leider noch nicht klar,
wie man die vorgeschlagene Methode auf das Beispiel
mit dem Hörtest anwenden soll.
Zunächst einmal die "klassische" Methode:
Binomialverteilung mit n=12
Nullhypothese [mm] H_0 [/mm] : p(Treffer) = [mm] \frac{1}{3} [/mm] (für jedes einzelne Musikstück)
Signifikanzniveau (z.B.) : [mm] \alpha [/mm] = 0.05
Versuchsergebnis : k=8
D: [mm] k\ge8
[/mm]
Aus diesen Angaben berechnet man [mm] P(D|H_0)\approx [/mm] 0.019 und
schließt daraus, dass die Abweichung signifikant ist
und man deshalb [mm] H_0 [/mm] verwerfen sollte.
Nach Krauss/Wassner soll man stattdessen (bzw. zusätzlich)
die bedingte Wahrscheinlichkeit P(H|D) mittels Bayes-Formel
berechnen:
$\ P(H|D)\ =\ [mm] \frac{P(D|H)*P(H)}{P(D|H)*P(H)+P(D|\overline{H})*P(\overline{H})}$
[/mm]
Im Hörtest-Beispiel werden wir natürlich für D wieder das
Ereignis " [mm] k\ge8 [/mm] " nehmen. Aber was nehmen wir für H ?
Klar: wieder die Annahme [mm] H_0: [/mm] p(Treffer) = [mm] \frac{1}{3}
[/mm]
Aber dann haben wir ein Problem: um die Bayes-Formel
anwenden zu können, sollten wir P(H) kennen, also die
Wahrscheinlichkeit, dass eine (beliebige) Testperson
ein "Nullhörer" ist, also auf dem Fragebogen jeweils
ganz aufs Geratewohl eine der 3 Aufnahmequalitäten
ankreuzt.
Aber woher sollen wir denn diese Wahrscheinlichkeit
kennen ?
Und noch schlimmer: wie in aller Welt kommen wir
zu [mm] P(D|\overline{H}) [/mm] ?
Muss man das Ganze etwa für verschiedene Werte von
P(H) durchspielen und dann eine Extremalaufgabe
lösen ?
Oder war es gar nicht sinnvoll, für H das frühere [mm] H_0 [/mm] zu
nehmen ?
Wer weiß weiter ?
LG Al-Chwarizmi
|
|
|
|
|
obige "Antwort" war eigentlich (wenigstens teilweise)
auch als Frage gedacht ...
Al
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:09 Di 05.07.2011 | Autor: | Blech |
Hi,
> ich finde, dass hier zum Teil fast etwas zu sehr bemängelt wurde, dass die Fragestellerin kaum eigene Lösungsansätze produzieren konnte.
Eigentlich wurde das nicht einmal bemängelt. Bemängelt wurde, daß die Aufgabe ohne solide Vorkenntnisse im Themengebiet sinnlos ist.
> Aber woher sollen wir denn diese Wahrscheinlichkeit kennen ?
Bayesian inference mit der Gleichverteilung als prior. Das ergibt eine Dichte für die posterior Verteilung der Erfolgswkeit p. Nur muß man dafür an [mm] $H_0$ [/mm] und $D$ rumschrauben. Gerade deswegen bräuchte die Aufgabe Kontext.
ciao
Stefan
P.S.: Aber beim Thema bemängeln: Wenn Du Deine Enter-Taste sparsamer einsetzen würdest, wäre es leichter, Dich zu zitieren. =)
|
|
|
|
|
Status: |
(Frage) reagiert/warte auf Reaktion | Datum: | 19:01 Di 05.07.2011 | Autor: | Mathegirl |
So..ich habe mich jetzt nochmal ausführlich belesen und alles durchgearbeitet und ich habe es fast so ähnlich hinbekommen wie es
Al-Chwarizmi gezeigt hat (dafür nochmal vielen dank! :) Das hab ich jetzt bestens verstanden!
Es ist für mich bloß nicht so einfach gewesen ohne Kenntnisse aus der VL oder sonst woher das mal so einfach zu lösen, mir hat einfach das verständnis dafür gefehlt!
Bayesian inference mit der Gleichverteilung als prior. Das ergibt eine Dichte für die posterior Verteilung der Erfolgswkeit p. Nur muß man dafür an und D rumschrauben. Und da gibt es für mich schon das nächste Problem. Wie stellt man das an?
Ich habe unseren Tutor darauf mal angesprochen und der hatte zu dieser Aufgabe auch keine Ahnung...das ist alles echt kurios.
|
|
|
|
|
> > Aber woher sollen wir denn diese Wahrscheinlichkeit kennen ?
(gemeint waren [mm] P(H_0) [/mm] und [mm] P(D|\overline{H_0}) [/mm]
> Bayesian inference mit der Gleichverteilung als prior. Das
> ergibt eine Dichte für die posterior Verteilung der
> Erfolgswkeit p. Nur muß man dafür an [mm]H_0[/mm] und [mm]D[/mm]
> rumschrauben. Gerade deswegen bräuchte die Aufgabe
> Kontext.
>
> ciao
> Stefan
Hallo Stefan,
Da ich mich noch nie mit Bayes-Statistik beschäftigt habe,
nun aber genauer wissen möchte, wie sie "funktioniert",
wäre ich froh, wenn du (z.B. gerade für die vorliegende
Aufgabe) ein paar Tipps angeben könntest:
0.) Was wäre denn ein (sinnvoller) Kontext ?
1.) Nehmen wir D = "k = 8" oder allenfalls D = "k [mm] \ge [/mm] 8" ?
2.) Nehmen wir [mm] H_0 [/mm] = "p = 1/3" oder etwas anderes ?
3.) Was wählt man (sinnvollerweise) für [mm] P(H_0) [/mm] ?
4.) Was für eine Gleichverteilung meinst du für p im Falle [mm] $\overline{H_0}$ [/mm] ?
5.) Was meinst du mit dem "Herumschrauben" an [mm] H_0 [/mm] und D ?
(das klingt ja nicht unbedingt nach wissenschaftlichem
Vorgehen ...)
Ich habe eine Rechnung angestellt mit D="k=8" , [mm] H_0 [/mm] = "p=1/3 " ,
[mm] P(H_0)=0.8 [/mm] und habe das Ergebnis [mm] P(H_0|D)\approx [/mm] 0.44
erhalten. Wähle ich aber etwa [mm] P(H_0)=0.5 [/mm] , so ergibt sich
$\ [mm] P(H_0|D)\approx [/mm] 0.16$ . Da liegen Welten dazwischen, und der
Prior-Wert ist offenbar der hauptsächliche Parameter, der
das Ergebnis bestimmt.
Ich weiß nun nicht, ob ich etwas ganz falsch mache - ich
habe aber nur ein Beispiel "nachgemacht", das ich in
Bayes für Fußgänger gefunden habe.
Vielen Dank für Aufklärung !
LG Al
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 14:02 Mi 06.07.2011 | Autor: | Blech |
Hi,
> 5.) Was meinst du mit dem "Herumschrauben" an $ [mm] H_0 [/mm] $ und D ? (das klingt ja nicht unbedingt nach wissenschaftlichem Vorgehen ...)
Sehe ich als Hauptproblem mit dem beschriebenen Ansatz.
> 2.) Nehmen wir $ [mm] H_0 [/mm] $ = "p = 1/3" oder etwas anderes ?
Bei normalen Tests sieht man den Parameter als *deterministisch*, aber *unbekannt*. Man schaut dann ob die zufälligen Ausprägungen mit der Annahme eines bestimmten Werts für den Parameter konsistent sind. (Hast Du oben gemacht: Ist [mm] $k\geq [/mm] 8$ konsistent mit der Annahme, daß p=1/3? Antwort: Unwahrscheinlich.)
1. Bei Bayesscher Statistik sieht man den Parameter als zufällig an. Man gibt ihm eine a priori Verteilung (die prior Verteilung), in die alles Wissen über den Parameter vor Durchführung des Experiments einfließt. Hat man keine Vorkenntnisse, nimmt man einen non-informative prior. Das wäre hier die Gleichverteilung auf $[0,1]$.
D.h. a priori nimmt man an, daß p auf $[0,1]$ gleichverteilt ist.
2. Jetzt erhalten wir Daten, nämlich k=8. Wie beeinflußt das unser Wissen über die Verteilung des Parameters?
[mm] $f(x|k=8)\sim f_{p=x}(8)*\pi(x)$
[/mm]
Das ist der Satz von Bayes für Dichten. [mm] $f_{p=x}(8)$ [/mm] ist die Zähldichte der Binomialverteilung unter der Annahme, daß der Parameter x ist, [mm] $\pi$ [/mm] ist die prior Verteilung (d.h. [mm] $1_{[0,1]}(x)$). $\sim$ [/mm] heißt gleich bis auf eine normalisierende Konstante, die sicherstellt, daß das ganze zu 1 intergriert.
3. Die resultierende Dichte $f(x|k=8)$ ist die posterior Verteilung. Das interessante an Bayesscher Statistik ist: Kommen weitere Infos rein, kann man die posterior Verteilung als prior für's nächste Mal hernehmen.
> (gemeint waren $ [mm] P(H_0) [/mm] $ und $ [mm] P(D|\overline{H_0}) [/mm] $
Das erste macht man mit dem prior, der Nenner ergibt sich bei einer Dichte aus der Normierung.
Aus der Dichte kann man dann die Wkeit berechnen, daß der Parameter [mm] $p\leq [/mm] 1/3$, denn $p=1/3$ hat Wkeit 0. Das könnte man ändern, indem man nur diskrete Werte zuläßt, aber es gibt keinen Rechtfertigungsgrund für einen diskreten Parameter. Und die Art der Diskretisierung hätte starken Einfluß auf das Resultat.
Problem ist jetzt, daß
einerseits [mm] $D=``k\geq [/mm] 8''$ gegen die Idee verstößt, die maximale Information in die posterior Verteilung fließen zu lassen (wir wissen ja, daß k=8 war).
Andererseits kann man [mm] $P(D|p\leq [/mm] 1/3)$ nicht wirklich berechnen. Man kann [mm] $p\leq [/mm] 1/3$ als Nullhypothese nehmen und dann einen Test durchführen, bei dem der worst-case Fall $p=1/3$ hergenommen wird, aber das ist nicht das gleiche.
d.h. Wir berechnen [mm] $P(D|H_0)$ [/mm] und $P(H|D')$. Sehen zwar ähnlich aus, aber sind verschieden. Und im Gegensatz zum Hypothesentest muß [mm] $H_0$ [/mm] eingeschränkt werden, so daß die bedingte Wkeit existiert.
ciao
Stefan
|
|
|
|
|
Hallo Stefan,
zuerst mal ein dickes Dankeschön, dass du dich mit meinen Fragen ausführlich auseinandersetzt.
> > 5.) Was meinst du mit dem "Herumschrauben" an [mm]H_0[/mm] und D ?
> (das klingt ja nicht unbedingt nach wissenschaftlichem
> Vorgehen ...)
>
> Sehe ich als Hauptproblem mit dem beschriebenen Ansatz.
>
>
> > 2.) Nehmen wir [mm]H_0[/mm] = "p = 1/3" oder etwas anderes ?
>
> Bei normalen Tests sieht man den Parameter als
> *deterministisch*, aber *unbekannt*. Man schaut dann ob die
> zufälligen Ausprägungen mit der Annahme eines bestimmten
> Werts für den Parameter konsistent sind. (Hast Du oben
> gemacht: Ist [mm]k\geq 8[/mm] konsistent mit der Annahme, daß
> p=1/3? Antwort: Unwahrscheinlich.)
>
>
> 1. Bei Bayesscher Statistik sieht man den Parameter als
> zufällig an. Man gibt ihm eine a priori Verteilung (die
> prior Verteilung), in die alles Wissen über den Parameter
> vor Durchführung des Experiments einfließt. Hat man keine
> Vorkenntnisse, nimmt man einen non-informative prior. Das
> wäre hier die Gleichverteilung auf [mm][0,1][/mm].
>
> D.h. a priori nimmt man an, daß p auf [mm][0,1][/mm] gleichverteilt
> ist.
In der Aufgabenstellung ging es aber um folgende Situation: "Ein Studiogast hört die Qualität bei 8 Liedern richtig raus und bekommt einen Preis. Ist er damit wirklich besser als ein sogenannter Nullhörer, also jemand, der die Klangqualität bei jedem Lied nur errät?"
Und diese "Nullhypothese", für deren bedingte W'keit [mm] P(H_0|k=8) [/mm] man sich nun nach der Bayes-Methode interessiert, wäre doch klar [mm] H_0: [/mm] p(Treffer)=1/3 (oder allenfalls eine Verteilung, die bei p=1/3 einen deutlichen "peak" hat ...)
Das heißt, wir packen unsere intuitive Vorstellung des "blinden" Ratens in diese apriori-Annahme, die wir testen wollen.
Wenn wir stattdessen als "Prior" eine Gleichverteilung auf [0..1] nehmen, gehen wir auf die Fragestellung der Aufgabe überhaupt nicht ein ! Und das soll doch wohl nicht der Zweck sein.
> 2. Jetzt erhalten wir Daten, nämlich k=8. Wie beeinflußt
> das unser Wissen über die Verteilung des Parameters?
>
> [mm]f(x|k=8)\sim f_{p=x}(8)*\pi(x)[/mm]
>
> Das ist der Satz von Bayes für Dichten. [mm]f_{p=x}(8)[/mm] ist die
> Zähldichte der Binomialverteilung unter der Annahme, daß
> der Parameter x ist, [mm]\pi[/mm] ist die prior Verteilung (d.h.
> [mm]1_{[0,1]}(x)[/mm]). [mm]\sim[/mm] heißt gleich bis auf eine
> normalisierende Konstante, die sicherstellt, daß das ganze
> zu 1 intergriert.
>
> 3. Die resultierende Dichte [mm]f(x|k=8)[/mm] ist die posterior
> Verteilung. Das interessante an Bayesscher Statistik ist:
> Kommen weitere Infos rein, kann man die posterior
> Verteilung als prior für's nächste Mal hernehmen.
>
> > (gemeint waren [mm]P(H_0)[/mm] und [mm]P(D|\overline{H_0})[/mm]
>
> Das erste macht man mit dem prior, der Nenner ergibt sich
> bei einer Dichte aus der Normierung.
Nähmen wir nun [mm] H_0="p=1/3" [/mm] , so würde bei einem gleichverteilten p natürlich sofort [mm] P(H_0)=0 [/mm] und damit auch [mm] P(H_0|k=8)=0 [/mm] herauskommen.
Ich habe deshalb in meiner Beispielrechnung angenommen:
[mm] P(H_0)=P(p=1/3)=0.8
[/mm]
[mm] P(t\le [/mm] p<t+dt)=0.2*dt (im Falle [mm] \overline{H_0})
[/mm]
Zusammen gibt dies einen "Prior", der die Vorstellung von einem "Nullhörer", der nur blind raten kann, in etwas abgeschwächter Form wiedergibt, indem auch Trefferwahrscheinlichkeiten p mit p≠1/3 eine gewisse Chance gegeben wird.
Setzen wir aber die Vorstellung vom "Nullhörer" mit p=1/3 wirklich voll um, dann ist [mm] P(H_0)=1 [/mm] und damit dann auch [mm] P(H_0|k=8)=1 [/mm] . Erkenntnisgewinn gleich Null !
> Aus der Dichte kann man dann die W'keit berechnen, daß der
> Parameter [mm]p\leq 1/3[/mm], denn [mm]p=1/3[/mm] hat W'keit 0. Das könnte
> man ändern, indem man nur diskrete Werte zuläßt, aber es
> gibt keinen Rechtfertigungsgrund für einen diskreten
> Parameter. Und die Art der Diskretisierung hätte starken
> Einfluß auf das Resultat.
>
>
> Problem ist jetzt, daß
>
> einerseits [mm]D=''k\geq 8''[/mm] gegen die Idee verstößt, die
> maximale Information in die posterior Verteilung fließen
> zu lassen (wir wissen ja, daß k=8 war).
>
> Andererseits kann man [mm]P(D|p\leq 1/3)[/mm] nicht wirklich
> berechnen. Man kann [mm]p\leq 1/3[/mm] als Nullhypothese nehmen und
> dann einen Test durchführen, bei dem der worst-case Fall
> [mm]p=1/3[/mm] hergenommen wird, aber das ist nicht das gleiche.
>
>
> d.h. Wir berechnen [mm]P(D|H_0)[/mm] und [mm]P(H|D')[/mm]. Sehen zwar
> ähnlich aus, aber sind verschieden. Und im Gegensatz zum
> Hypothesentest muß [mm]H_0[/mm] eingeschränkt werden, so daß die
> bedingte Wkeit existiert.
>
>
> ciao
> Stefan
Nach diesem ersten Schnuppern in Bayes-Statistik muss ich sagen, dass mir dabei noch nicht so wohlig zumute ist. Insbesondere kann ich mir wenigstens im Moment noch nicht recht vorstellen, wie man z.B. den Unterricht zum Thema "beurteilende Statistik", der auch heute schon an vielen Schulen nur recht knapp bemessen ist, auf eine Einführung in Bayes-Statistik umstellen könnte, wie dies Wassner und Krauss offenbar propagierten.
So wie ich sehe, sind die entsprechenden Verfahren erst im Zeitalter des Computers, genauer erst so in den letzten etwa 15 Jahren, einigermaßen praktikabel geworden. Wollte man sie nun in den Statistik-Unterricht an Mittelschulen einführen als eine "bessere" Methode als die klassischen Hypothesentests, dann befürchte ich angesichts der dazu erforderlichen, mindestens ebenso komplexen logischen Gedankengänge und des bei praktisch sinnvollen Beispielen erheblichen Rechenaufwandes, dass damit wohl eine Mehrheit der Lehrkräfte und noch eine größere Mehrheit der Schülerschaft erheblich überfordert wäre ...
Sehr wünschenswert wäre es allerdings, dass heutige Abiturienten - und damit künftige Entscheidungsträger in Wirtschaft, Wissenschaft und Politik - ein solideres und von weniger Irrtümern geprägtes Wissen um die Anwendung statistischer Untersuchungen, deren Wert und deren Grenzen, mitbekommen würden als bisher.
Lieben Gruß !
Al
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:05 Mi 06.07.2011 | Autor: | Blech |
Hi,
> Wenn wir stattdessen als "Prior" eine Gleichverteilung auf [0..1] nehmen, gehen wir auf die Fragestellung der Aufgabe überhaupt nicht ein ! Und das soll doch wohl nicht der Zweck sein.
Doch, weil wir a priori nicht wissen, wie wahrscheinlich es ist, daß p=1/3. Wir haben ja keine Ahnung, ob die Leute Nullhörer sind oder nicht. Sinn eines non-informative priors ist jetzt hier keinen Einfluß auf das Ergebnis zu nehmen (siehe auch weiter unten). D.h. wir gehen a priori davon aus, daß alle p gleichwahrscheinlich sind, updaten diese a priori Annahme durch unsere Daten (hier, daß jemand k=8 hat) und kriegen daraus die beste Schätzung für die Verteilung des Parameters p gegeben die Daten. Anhand dieser posterior distribution überprüfen wir dann unsere Hypothese [mm] "$p\leq [/mm] 1/3$".
> Nähmen wir nun $ [mm] H_0="p=1/3" [/mm] $ , so würde bei einem gleichverteilten p natürlich sofort $ [mm] P(H_0)=0 [/mm] $ und damit auch $ [mm] P(H_0|k=8)=0 [/mm] $ herauskommen.
Ja. Bei stetig verteiltem p ist die Nullhypothese so nicht sinnvoll. Nur bietet sich hier keine spezielle Diskretisierung von p an. Der Parameter einer Binomialverteilung ist nunmal [mm] $\in [/mm] [0,1]$.
> $ [mm] P(H_0)=P(p=1/3)=0.8 [/mm] $
Aber wieso sollte die Wkeit 0.8 sein? Hier bestimmst Du durch die Wahl Deiner a priori Verteilung sehr stark das Ergebnis des Tests. Du könntest die Gleichverteilung natürlich genauso interpretieren (p< 1/3 erscheint unwahrscheinlich und wird mit in die Hypothese [mm] $p\leq [/mm] 1/3$ geschmissen, also ist der Effekt der gleiche wie [mm] $p\in [/mm] [1/3,1]$ mit P(p=1/3)=1/3 und Gleichverteilung auf dem Rest), aber wenigstens hat sie den Vorteil der Eleganz.
Das Problem ist hier, daß wir so wenig Daten haben. Deswegen wird das Resultat stark vom prior beeinflußt.
> Nach diesem ersten Schnuppern in Bayes-Statistik muss ich sagen, dass mir dabei noch nicht so wohlig zumute ist. Insbesondere kann ich mir wenigstens im Moment noch nicht recht vorstellen, wie man z.B. den Unterricht zum Thema "beurteilende Statistik", der auch heute schon an vielen Schulen nur recht knapp bemessen ist, auf eine Einführung in Bayes-Statistik umstellen könnte, wie dies Wassner und Krauss offenbar propagierten.
Ich hab noch nichtmal ne Ahnung, was die beiden Typen überhaupt wollen. Ich denke nicht, daß es möglich ist D und [mm] $H_0$ [/mm] so zu formulieren, daß sowohl [mm] $P(D|H_0)$ [/mm] als auch [mm] $P(H_0|D)$ [/mm] sinnvolle Ausdrücke sind (und ein Aufgabenbezug herrscht. Sonst geht's natürlich =).
Bitte erzähl mir nicht, daß die das tatsächlich in der Schule machen wollen. oO
Es ist ein miserables Beispiel für Bayesian inference weil wir weder einen sich natürlich anbietenden prior haben, noch genug Daten, um den Einfluß des dann zwangsläufig etwas gequälten priors zu minimieren.
ciao
Stefan
P.S.: der Rechenaufwand muß nicht hoch sein, Stichwort conjugate priors.
|
|
|
|
|
> Hi,
>
> > Wenn wir stattdessen als "Prior" eine Gleichverteilung auf
> [0..1] nehmen, gehen wir auf die Fragestellung der Aufgabe
> überhaupt nicht ein ! Und das soll doch wohl nicht der
> Zweck sein.
>
> Doch, weil wir a priori nicht wissen, wie wahrscheinlich es
> ist, daß p=1/3. Wir haben ja keine Ahnung, ob die Leute
> Nullhörer sind oder nicht.
Aber wir wissen exakt, was ein "Nullhörer" wäre !
(praktisch realisierbar, indem man ihn die Musikstücke einfach überhaupt nicht hören lässt - er soll einfach auf dem Fragebogen zufällig und gleichverteilt Kreuze setzen)
In der Aufgabenstellung wird ja ausdrücklich das Konzept dieses "Nullhörers" eingeführt. Wenn es in Bayes-Statistik sinnlos bzw. verboten sein soll, solche durchaus dem gesunden Menschenverstand entsprechende Konzepte einzuführen, dann ist die vorliegende Aufgabe allerdings fauler Käse.
> Sinn eines non-informative
> priors ist jetzt hier keinen Einfluß auf das Ergebnis zu
> nehmen (siehe auch weiter unten). D.h. wir gehen a priori
> davon aus, daß alle p gleichwahrscheinlich sind, updaten
> diese a priori Annahme durch unsere Daten (hier, daß
> jemand k=8 hat) und kriegen daraus die beste Schätzung
> für die Verteilung des Parameters p gegeben die Daten.
> Anhand dieser posterior distribution überprüfen wir dann
> unsere Hypothese "[mm]p\leq 1/3[/mm]".
>
> > Nähmen wir nun [mm]H_0="p=1/3"[/mm] , so würde bei einem
> gleichverteilten p natürlich sofort [mm]P(H_0)=0[/mm] und damit
> auch [mm]P(H_0|k=8)=0[/mm] herauskommen.
>
> Ja. Bei stetig verteiltem p ist die Nullhypothese so nicht
> sinnvoll. Nur bietet sich hier keine spezielle
> Diskretisierung von p an. Der Parameter einer
> Binomialverteilung ist nunmal [mm]\in [0,1][/mm].
> > [mm]P(H_0)=P(p=1/3)=0.8[/mm]
>
> Aber wieso sollte die Wkeit 0.8 sein?
Dies war nur einmal als ein Rechenbeispiel gedacht, weil
P(p=1/3)=1 offensichtlich einigermaßen sinnlos ist.
> Hier bestimmst Du
> durch die Wahl Deiner a priori Verteilung sehr stark das
> Ergebnis des Tests. Du könntest die Gleichverteilung
> natürlich genauso interpretieren (p< 1/3 erscheint
> unwahrscheinlich und wird mit in die Hypothese [mm]p\leq 1/3[/mm]
> geschmissen, also ist der Effekt der gleiche wie [mm]p\in [1/3,1][/mm]
> mit P(p=1/3)=1/3 und Gleichverteilung auf dem Rest), aber
> wenigstens hat sie den Vorteil der Eleganz.
>
> Das Problem ist hier, daß wir so wenig Daten haben.
> Deswegen wird das Resultat stark vom prior beeinflußt.
Klar ist es problematisch, aufgrund eines einzigen Wertes statistische Aussagen machen zu wollen. Bei Hypothesentests "aus dem Schulunterricht" macht man dies zwar auch oft - aber man definiert dort immerhin außerdem eine (hoffentlich plausible) Nullhypothese.
> Nach diesem ersten Schnuppern in Bayes-Statistik muss ich
> sagen, dass mir dabei noch nicht so wohlig zumute ist.
> Insbesondere kann ich mir wenigstens im Moment noch nicht
> recht vorstellen, wie man z.B. den Unterricht zum Thema
> "beurteilende Statistik", der auch heute schon an vielen
> Schulen nur recht knapp bemessen ist, auf eine Einführung
> in Bayes-Statistik umstellen könnte, wie dies Wassner und
> Krauss offenbar propagierten.
>
> Ich hab noch nichtmal ne Ahnung, was die beiden Typen
> überhaupt wollen. Ich denke nicht, daß es möglich ist D
> und [mm]H_0[/mm] so zu formulieren, daß sowohl [mm]P(D|H_0)[/mm] als auch
> [mm]P(H_0|D)[/mm] sinnvolle Ausdrücke sind (und ein Aufgabenbezug
> herrscht. Sonst geht's natürlich =).
> Bitte erzähl mir nicht, daß die das tatsächlich in der
> Schule machen wollen. oO
> Es ist ein miserables Beispiel für Bayesian inference weil
> wir weder einen sich natürlich anbietenden prior haben,
> noch genug Daten, um den Einfluß des dann zwangsläufig
> etwas gequälten priors zu minimieren.
Da sind jetzt zwei wichtige Anmerkungen zu machen:
1.) Die konkrete Aufgabe mit dem Hörtest stammt ziemlich sicher nicht von Krauss/Wassner , sondern aus einer Veranstaltung (Mathegirl könnte dazu ev. nähere Angaben machen) im Rahmen der Ausbildung zum Lehramt in Mathematik, in welcher die Methoden (Hypothesentest vs. Bayesian) gegenübergestellt, aber anscheinend laut Mathegirl nicht einmal besprochen wurden ...
2.) Wenn ich den Aufsatz von K+W richtig verstanden habe, beziehen sie sich dort sehr wohl auf den gymnasialen Stochastikunterricht !
> ciao
> Stefan
>
> P.S.: der Rechenaufwand muß nicht hoch sein, Stichwort
> conjugate priors.
(dieses Stich- ist für mich in erster Linie noch ein Fremdwort ...)
Noch eine Bitte: könntest du nun zu dem zugegebenermaßen etwas verkorksten Beispiel trotzdem noch die Rechnung angeben, wie du sie unter der Annahme einer gleichverteilten apriori-Wahrscheinlichkeit durchführen würdest ? Mir ist dabei der Umgang mit P(H) und [mm] P(\overline{H}) [/mm] und den Integralen noch nicht recht klar.
LG Al
|
|
|
|
|
> Noch eine Bitte: könntest du nun zu dem zugegebenermaßen
> etwas verkorksten Beispiel trotzdem noch die Rechnung
> angeben, wie du sie unter der Annahme einer
> gleichverteilten apriori-Wahrscheinlichkeit durchführen
> würdest ? Mir ist dabei der Umgang mit P(H) und
> [mm]P(\overline{H})[/mm] und den Integralen noch nicht recht klar.
Ciao Stefano,
ich habe nun doch versucht, eine solche Rechnung selber hinzukriegen. Am Ende wurde es einfacher als ich gedacht hatte.
Ich nehme als apriori-Verteilung eine Gleichverteilung von p im Intervall [0..1] an, also mit der Dichtefunktion f: [mm] [0..1]\to \IR [/mm] mit f(p)=1 für alle p. Für H nehme ich (anstatt p=1/3) die Hypothese [mm] p\le1/3 [/mm] und für D das Ereignis "k=8". Zu den "Nullhörern" mit p=1/3 nehme ich also noch alle "Negativhörer" dazu, die tendenziell fast alles falsch identifizieren.
Damit komme ich auf folgende Rechnung:
$\ P(H|D)\ =\ [mm] \frac{P(H\cap{D})}{P(D)}$
[/mm]
Dabei ist
$\ [mm] P(H\cap{D})\ [/mm] =\ [mm] \integral_{p=0}^{1/3}\pmat{12\\8}*p^8*(1-p)^4*\underbrace{f(p)}_1\ [/mm] dp\ [mm] \approx0.0006787$
[/mm]
und
$\ P(D)\ =\ [mm] \integral_{p=0}^{1}\pmat{12\\8}*p^8*(1-p)^4*\underbrace{f(p)}_1\ [/mm] dp\ [mm] \approx0.07692$ $\left(\ =\ \frac{1}{13}\ \right)$
[/mm]
Ergebnis:
$\ P(H|D)\ =\ [mm] \frac{P(H\cap{D})}{P(D)}\ \approx\ \frac{0.0006787}{0.07692}\ \approx\ [/mm] 0.00882$
Wenn jemand also in dem Hörtest bei 8 aus 12 Stücken die Wiedergabequalität korrekt angeben kann, ist die Wahrscheinlichkeit, dass dahinter nur reines Raten (oder gar systematisches Fehlraten) steckt, kleiner als 0.9% .
Wie oft bei solchen Fragen habe ich mal wieder eine Simulation dazu gemacht. Bei einer Million Durchläufe (jedes Mal ein p als Zufallszahl in [0..1] bestimmen, damit 12 "Würfe" machen, Treffer addieren und falls k=8 die Strichliste ergänzen) kam ich auf 76890 Fälle mit k=8, davon 677 mit [mm] p\le [/mm] 1/3. Daraus ergibt sich die relative Häufigkeit [mm] \approx0.0088 [/mm] - in exzellenter Übereinstimmung mit dem theoretischen Ergebnis.
Jetzt ist mir nur noch nicht so recht klar, wie ich nun bei Eintreffen neuer Daten (die Person, die im ersten Test 8 Treffer erzielte, erreicht z.B. in einem zweiten Test nur noch 6 richtige Antworten) die bisherige Erkenntnis in einen neuen "prior" umsetzen könnte.
LG Al-Chw.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:28 Do 07.07.2011 | Autor: | Blech |
Hi,
Deine posterior Dichte ist*
[mm] $f_{post}(p)\sim \pmat{12\\8}\cdot{}p^8\cdot{}(1-p)^4\cdot{}\underbrace{f_{prior}(p)}_1$
[/mm]
Die verwendest Du jetzt beim nächsten Mal als prior. Weil sie jetzt unsere beste Vermutung für die tatsächliche Verteilung des Parameters p ist.
ciao
Stefan
* bis auf normierende Konstante. Eigentlich kann man damit die Konstanten in der Darstellung auch noch weglassen:
[mm] $f_{post}(p)\sim p^8\cdot{}(1-p)^4$
[/mm]
In diesem Beispiel ist es noch recht leicht die Konstanten zu berechnen. Für weniger hübsche Fälle arbeitet man im Normalfall mit Monte Carlo Methoden und da kann man aus einer Verteilung samplen, ohne die Konstanten zu kennen.
|
|
|
|
|
> > Noch eine Bitte: könntest du nun zu dem zugegebenermaßen
> > etwas verkorksten Beispiel trotzdem noch die Rechnung
> > angeben, wie du sie unter der Annahme einer
> > gleichverteilten apriori-Wahrscheinlichkeit durchführen
> > würdest ? Mir ist dabei der Umgang mit P(H) und
> > [mm]P(\overline{H})[/mm] und den Integralen noch nicht recht klar.
>
>
> Ciao Stefano,
>
> ich habe nun doch versucht, eine solche Rechnung selber
> hinzukriegen. Am Ende wurde es einfacher als ich gedacht
> hatte.
> Ich nehme als apriori-Verteilung eine Gleichverteilung von
> p im Intervall [0..1] an, also mit der Dichtefunktion f:
> [mm][0..1]\to \IR[/mm] mit f(p)=1 für alle p. Für H nehme ich
> (anstatt p=1/3) die Hypothese [mm]p\le1/3[/mm] und für D das
> Ereignis "k=8". Zu den "Nullhörern" mit p=1/3 nehme ich
> also noch alle "Negativhörer" dazu, die tendenziell fast
> alles falsch identifizieren.
>
> Damit komme ich auf folgende Rechnung:
>
> [mm]\ P(H|D)\ =\ \frac{P(H\cap{D})}{P(D)}[/mm]
>
> Dabei ist
>
> [mm]\ P(H\cap{D})\ =\ \integral_{p=0}^{1/3}\pmat{12\\8}*p^8*(1-p)^4*\underbrace{f(p)}_1\ dp\ \approx0.0006787[/mm]
>
> und
>
> [mm]\ P(D)\ =\ \integral_{p=0}^{1}\pmat{12\\8}*p^8*(1-p)^4*\underbrace{f(p)}_1\ dp\ \approx0.07692[/mm]
>
> Ergebnis:
>
> [mm]\ P(H|D)\ =\ \frac{P(H\cap{D})}{P(D)}\ \approx\ \frac{0.0006787}{0.07692}\ \approx\ 0.00882[/mm]
>
> Wenn jemand also in dem Hörtest bei 8 aus 12 Stücken die
> Wiedergabequalität korrekt angeben kann, ist die
> Wahrscheinlichkeit, dass dahinter nur reines Raten (oder
> gar systematisches Fehlraten) steckt, kleiner als 0.9% .
>
> Wie oft bei solchen Fragen habe ich mal wieder eine
> Simulation dazu gemacht. Bei einer Million Durchläufe
> (jedes Mal ein p als Zufallszahl in [0..1] bestimmen, damit
> 12 "Würfe" machen, Treffer addieren und falls k=8 die
> Strichliste ergänzen) kam ich auf 76890 Fälle mit k=8,
> davon 677 mit [mm]p\le[/mm] 1/3. Daraus ergibt sich die relative
> Häufigkeit [mm]\approx0.0088[/mm] - in exzellenter Übereinstimmung
> mit dem theoretischen Ergebnis.
>
> Jetzt ist mir nur noch nicht so recht klar, wie ich nun bei
> Eintreffen neuer Daten (die Person, die im ersten Test 8
> Treffer erzielte, erreicht z.B. in einem zweiten Test nur
> noch 6 richtige Antworten) die bisherige Erkenntnis in
> einen neuen "prior" umsetzen könnte.
>
> LG Al-Chw.
Hallo,
ich habe nun nochmals etwas weiter "geackert" und gemerkt, dass es jedenfalls sinnvoll ist, die Hypothese H in der Form H: [mm] p\le1/3 [/mm] zu verwenden. Besser noch: H: [mm] p\le{p_0} [/mm] für einen beliebigen Wert [mm] p_0\in[0..1] [/mm] . Die als "prior" angenommene Dichtefunktion der Gleichverteilung bezeichne ich jetzt mit [mm] f_0. [/mm] Damit erhalten wir:
> $\ [mm] P(H\cap{D})\ [/mm] =\ [mm] \integral_{0}^{p_0}\pmat{12\\8}*p^8*(1-p)^4*\underbrace{f_0(p)}_1\ [/mm] dp\ =\ [mm] Q(p_0)$ [/mm]
(dabei ist Q ein Polynom vom Grad 13)
>
> und
>
> [mm]\ P(D)\ =\ \integral_{0}^{1}\pmat{12\\8}*p^8*(1-p)^4*\underbrace{f_0(p)}_1\ dp\ =\ Q(1)[/mm]
> Ergebnis:
>
> [mm]\ P(H|D)\ =\ \frac{P(H\cap{D})}{P(D)}\ \approx\ \frac{Q(p)}{Q(1)}\ =:\ R(p)[/mm]
R(p) ist nun die posterior-Verteilungsfunktion, die sich nach der Beobachtung k=8 aus der ursprünglich angenommenen Gleichverteilung ergibt. Die Ableitung von R(p) ist die neue Dichtefunktion. Es ist
$\ R'(p)\ =\ [mm] 6435*p^8*(1-p)^4\ [/mm] =\ [mm] 13*\pmat{12\\8}*p^8*(1-p)^4\ [/mm] =:\ [mm] f_1(p)$
[/mm]
Diese Dichtefunktion hat ihr Maximum an der Stelle p=2/3 , was aufgrund der Beobachtung [mm] k=8=\frac{2}{3}*12 [/mm] plausibel ist. Die bedingte Wahrscheinlichkeit $\ [mm] P\left(\,p\le\frac{1}{3}\ |\ k=8\,\right)$ [/mm] kann man als Flächeninhalt unter der Kurve von p=0 bis p=1/3 sehen:
$\ [mm] P\left(\,p\le\frac{1}{3}\ |\ k=8\, \right)\ [/mm] =\ [mm] \integral_{0}^{1/3}f_1(p)\,dp\ \approx\ [/mm] 0.00882$
An der Dichtefunktion [mm] f_1 [/mm] ist interessant, dass sie die Form $\ [mm] f_1(p)\ [/mm] =\ [mm] C*p^{k}*(1-p)^{n-k}$ [/mm] hat.
Nun kann man sich fragen, was man mit einem neu dazugekommenen Beobachtungsergebnis anstellen soll. Die Person, die im Musikhörtest 8 von 12 Stücken richtig nach ihrer Wiedergabequalität beurteilt hat, werde einem zweiten analogen Test, wieder mit 12 (anderen) Musikstücken, unterzogen. Nehmen wir einmal an, dass sie diesmal nur 6 der Stücke richtig zuordne. Wir fügen also der ersten Beobachtung [mm] k_1=8 [/mm] die zweite mit [mm] k_2=6 [/mm] zu.
Nehmen wir jetzt als "prior" die Dichtefunktion [mm] f_1 [/mm] , die aus der Auswertung von [mm] k_1=8 [/mm] gewonnen wurde, so erhalten wir die neue Berechnung:
$\ [mm] P(H\cap{D})\ [/mm] =\ [mm] \integral_{0}^{p_0}\pmat{12\\6}*p^6*(1-p)^6*\underbrace{6435*p^8*(1-p)^4}_{f_1(p)}\ [/mm] dp$
$\ =\ [mm] K*\,\integral_{0}^{p_0}\,p^{14}*(1-p)^{10}\ [/mm] dp\ =: [mm] Q_2(p_0)$ [/mm]
[mm]\ P(D)\ =\ Q_2(1)[/mm]
[mm]\ P(H|D)\ =\ \frac{P(H\cap{D})}{P(D)}\ \approx\ \frac{Q(p)}{Q(1)}\ =:\ R_2(p)[/mm]
Wieder erhält man für $\ [mm] R_2'(p)\ [/mm] =:\ [mm] f_2(p)$ [/mm] eine "Binomialfunktion":
$\ [mm] f_2(p)\ [/mm] =\ [mm] 25*\pmat{24\\14}*p^{14}*(1-p)^{10}$
[/mm]
[mm] f_2 [/mm] nimmt an der Stelle [mm] p=\frac{14}{24}=\frac{7}{12} [/mm] das Maximum an. Der entsprechende Buckel ist schmaler und höher als vorher bei der Funktion [mm] f_1 [/mm] , was man sehr gut interpretieren kann.
Wie sieht nun die Hypothese "Nullhörer" - also "p [mm] \le [/mm] 1/3" im Lichte der erweiterten Datenbasis aus ? Man könnte befürchten, dass P(H|D) wieder zugenommen hat, weil ja die Versuchsperson im zweiten Test mit nur 6 richtigen Antworten klar schlechter als im ersten (8 Richtige) abgeschnitten hat. Dies ist jedoch keineswegs der Fall. Es gilt nämlich neu:
$\ P(H|D)\ =\ [mm] \integral_{0}^{1/3}f_2(p)\,dp\ \approx\ [/mm] 0.0056\ <\ 0.0088$
Schaut man sich die Ergebnisse nochmal an, so fällt natürlich noch auf, dass man, anstatt für den ersten Test eine erste und für den zweiten eine zweite Analyse (mit dem posterior aus der ersten als prior) anzustellen, auch die Testergebnisse zu einem einzigen Versuch (12+12=24 Versuche, 8+6=14 Treffer) hätte zusammenfassen können. In einem analogen Hörtest (oder jedem beliebigen Triple Choice Test - bei jeder Frage 3 Antwortvorschläge, wovon genau einer richtig) mit n Fragen und k Treffern ist die Dichtefunktion für p offenbar
$\ f(p)\ =\ [mm] (n+1)*\pmat{n\\k}*p^k*(1-p)^{n-k}$
[/mm]
und somit
P("Nullhörer"| k Treffer) = $\ [mm] (n+1)*\pmat{n\\k}*\integral_{0}^{1/3}p^k*(1-p)^{n-k}\ [/mm] dp$
Eigentlich ist dies im Nachhinein betrachtet nicht besonders erstaunlich - aber es ist doch immer wieder befriedigend, wenn man an solchen Beispielen die Konsistenz mathematischer Verfahren erfahren kann - so gewissermaßen als Entschädigung für die Mühen der Rechnung ...
LG Al-Chw.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:15 Do 07.07.2011 | Autor: | Blech |
Hi,
> In der Aufgabenstellung wird ja ausdrücklich das Konzept dieses "Nullhörers" eingeführt. Wenn es in Bayes-Statistik sinnlos bzw. verboten sein soll, solche durchaus dem gesunden Menschenverstand entsprechende Konzepte einzuführen, dann ist die vorliegende Aufgabe allerdings fauler Käse.
Ja, aber die Frage, ob die Leute Nullhörer sind, ist ja gerade die, die wir testen wollen. Da können wir doch nicht a priori annehmen, daß sie Nullhörer sind.
ciao
Stefan
|
|
|
|
|
> Hi,
>
> > In der Aufgabenstellung wird ja ausdrücklich das Konzept
> dieses "Nullhörers" eingeführt. Wenn es in
> Bayes-Statistik sinnlos bzw. verboten sein soll, solche
> durchaus dem gesunden Menschenverstand entsprechende
> Konzepte einzuführen, dann ist die vorliegende Aufgabe
> allerdings fauler Käse.
>
> Ja, aber die Frage, ob die Leute Nullhörer sind, ist ja
> gerade die, die wir testen wollen. Da können wir doch
> nicht a priori annehmen, daß sie Nullhörer sind.
>
> ciao
> Stefan
Ich denke, dass ich da einfach die Rolle von "prior" und "Hypothese" durcheinander gebracht hatte. Die Hypothese, die (unter der Voraussetzung k=8) getestet werden soll, ist ja H: p [mm] \le [/mm] 1/3 und hat mit der zugrundegelegten apriori-Verteilung eigentlich nichts zu tun.
Die im gleichverteilten "prior" steckende Annahme ist natürlich, wenn man sie interpretiert, auch einigermaßen abenteuerlich: sie besagt ja, dass man sich quasi vorstellt, dass es potentiell gleich viele Personen gibt, die zwischen (a-1)% und a% der Fragen richtig beantworten - für alle a von 1 bis 100 .
LG Al
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 18:57 Mi 06.07.2011 | Autor: | Blech |
Hi,
mir kam noch was. Eigentlich liegt eine nette Symmetrie darin, daß man beim Hypothesentest [mm] $k\geq [/mm] 8$ anstatt k=8 nimmt, während man bei Bayes [mm] $p\leq [/mm] 1/3$ statt p=1/3 berechnet.
Die ist folgendermaßen begründet: bei dem, worauf man bedingt, will man maximale Präzision. Es soll soviel Information wie möglich einfließen. Während das Ereignis, dessen Wkeit man berechnet, möglichst weitgefaßt sein soll, da man sämtliche ähnlich gelagerten Fälle (k>8, p<1/3) einschließen will.
ciao
Stefan
|
|
|
|