Kugeln aus Urne ziehen < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 13:30 Mi 11.03.2009 | Autor: | burkito |
Hallo,
ich hätte folgende Frage:
Gegeben ist eine Urne mit schwarzen und weißen Kugeln, insgesamt N Kugeln. Aus der Urne ziehe ich k Kugeln und erhalte l schwarze und m weiße Kugeln. Dann ziehe ich ein weiteres Mal s Kugeln. Wie viele schwarze bzw. weiße Kugeln erhalte ich mit welcher Wahrscheinlichkeit (mit oder ohne Zurücklegen der zunächst gezogenen k Kugeln)?
Besten Dank!
Gruß burkito
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:42 Mi 11.03.2009 | Autor: | reverend |
Hallo burkito,
das wird ja nur zu berechnen sein, wenn man auch noch weiß, dass vor der ersten Ziehung genau b schwarze und w weiße Kugeln in der Urne waren.
Außerdem gilt offenbar: $ [mm] b+w=N,\quad l\le b,\quad m\le w,\quad k+s\le [/mm] N $
Du arbeitest nicht zufällig gerade an der Erstellung einer Formelsammlung?
Grüße
reverend
|
|
|
|
|
Hallo burkito,
ich vergaß vorhin zu erwähnen, dass die gesuchten Formeln schon vorliegen. Es handelt sich um eine hypergeometrische Verteilung.
Wenn Du Zahlen vorliegen hast, findet sich hier ein praktischer Rechner dafür.
Grüße
reverend
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 11:07 Do 12.03.2009 | Autor: | burkito |
Hallo reverend,
vielen Dank für die schnelle Antwort!
Ich habe mir den Artikel über die hypergeometrische Verteilung angeschaut, aber es handelt sich nicht so ganz um das was ich suche.
Ich denke da eher an so eine Art Zuverlässigkeitsmaß für Stichproben. Die Verteilung der Kugeln in der Urne ist nicht bekannt, eine Abschätzung dieser Verteilung wird durch die erste Stichprobe bestimmt. Wie zuverlässig ist diese Abschätzung? Wie gut ist diese durch die erste Stichprobe bestimmte Abschätzung durch eine zweite Stichprobe reproduzierbar?
Gruß burkito
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 11:36 Do 12.03.2009 | Autor: | luis52 |
Moin burkito,
entschuldige, wenn ich etwas begriffsstutzig bin, aber mir ist einiges unklar.
1) Wird im ersten bzw.zweiten Durchgang mit oder ohne Zuruecklegen gezogen?
2) Was bedeutet, dass die Verteilung in der Urne unbekannt ist? Angenommen, es gibt M weisse Kugeln (und N-M schwarze). Ist M *und* N unbekannt oder nur M?
3) Du schreibst: eine Abschätzung dieser Verteilung wird durch die erste Stichprobe bestimmt. Wie zuverlässig ist diese Abschätzung? Was meinst du mit "Abschaetzung"? Soll M, N oder M/N geschaetzt werden?
Vielleicht koenntest zu mal die verschiedenen Szenarien genauer schildern, die dich hier interessieren und in diesen Zusammenhaengen, worueber Aussagen getroffen werden sollen.
vg Luis
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 13:17 Do 12.03.2009 | Autor: | burkito |
Hallo Luis,
vielen Dank! Leider war ich in Statistik nie so besonders und mir sind auch einige der relevanten Begriffe nicht mehr so geläufig.
Es geht um eine Urne mit N Kugeln, N unbekannt mit einer unbekannten Anzahl von M weißen und N-M schwarzen Kugeln. Sollte es der Vereinfachung dienen, so kann N beliebig groß [mm] (\to\infty) [/mm] gewählt werden.
1) Zunächst suche ich die Genauigkeit einer Stichprobe, d.h. ziehe ich k Kugeln und erhalte m weiße und k-m schwarze Kugeln, so suche ich eine Abschätzung für M/N mit Zuverlässigkeitsabschätzung. Die genaueste Abschätzung ist vermutlich m/k, aber wie zuverlässig ist diese und jede andere Abschätzung [mm] r\in\IR. [/mm] Für z.B. k=N wäre die Abschätzung m/k=M/N und die Zuverlässigkeit 100%; gesucht ist eine allgemeine Zuverlässigkeitsfunktion Z(k, m, r).
Die Kugeln werden zurückgelegt.
2) Betrachte ich nun eine zweite Stichprobe der Größe s (mit einer unbekannten Anzahl an t weißen und s-t schwarzen Kugeln), wie groß ist die Wahrscheinlichkeit, für die Verteilung t/s dieser Stichprobe wiederum den Quotienten m/k oder einen beliebigen anderen Wert [mm] q\in\IR [/mm] zu erhalten.
Ich hoffe, es ist jetzt etwas klarer :)
Gruß burkito
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 15:45 Do 12.03.2009 | Autor: | luis52 |
1) Es bezeichne H die Anzahl der weissen Kugeln unter den k gezogenen (o.Z.). Wie reverend bereits bemerkte ist H hypergeometrisch verteilt und folglich [mm] $\operatorname{E}[H]=k\frac{M}{N}$ [/mm] und folglich [mm] $\operatorname{E}[\hat P]=\operatorname{E}[H/k]=\frac{M}{N}$. [/mm] Diese Eigenschaft des Schaetzers [mm] $\hat [/mm] P$ bezeichnet man als Erwartungstreue. Die Genauigkeit wird ueber die Varianz beschrieben. Hier ist
[mm] $\operatorname{Var}[\hat P]=\operatorname{E}[(\hat P-\operatorname{E}[\hat P])^2]=\frac{1}{k}\frac{M}{N}\left(1-\frac{M}{N}\right)\frac{N-k}{N-1}$.
[/mm]
Vielleicht entspricht das deiner "Zuverlässigkeitsfunktion". Zumindest bestaetigt sie deine Anmerkung: Fuer $k=N$ verschwindet die Varianz.
Natuerlich ist das eine Groesse, die von den unbekannten M,N abhaengt, und ich vermute, dass dir eine konkrete Zahl in Abhaengigkeit von der realisierten Zahl m weisser Kugeln abhaengt, also noch eine Schaetzung. Hierzu solltest du dich mal nach einem Buch ueber Stichprobenverfahren umsehen (engl: sampling).
2) Hier sehe ich nur insofern einen prinzipiellen Unterschied zur ersten Frage, als dass hier kein konkreter Wert fuer t (oben m) vorliegt. Aber auch hier folgt die Verteilung der weissen Kugeln einer hypergeometrischen Verteilung.
vg Luis
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 22:03 Do 12.03.2009 | Autor: | burkito |
Hallo Luis,
besten Dank für die Antwort!
Die Varianz ist im Prinzip so eine Funktion, wie ich sie suche. Wie du schon anmerktest, suche ich aber eigentlich nach einer von m und k abhängigen Funktion, da mir M und N nicht bekannt sind.
Ich schau mich mal um :)
Gruß burkito
|
|
|
|