Poisson-Verteilung < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 19:44 Mo 02.10.2006 | Autor: | rkeyvan |
Von 78 Pillen verursachten 48 Pillen ein Problem, die restlichen 30 Pillen verursachten KEIN Problem. Eine schnelle Schlussfolgerung wäre, dass 61,5 % dieser Pillen zu Problemen führen und die restlichen 38,5 % nicht. Doch wie Verhalten sich diese Anteile bei größeren Mengen, also beispielsweise bei 1000 Pillen? Lässt sich anhand einer Poisson-Verteilung ausrechnen, ob von 1000 Pillen immernoch 61,5 % der Pillen zu Problemen führen? Welche Ereignisrate (Erwartungswert & Varianz) sollte verwendet werden? Gibt es weitere Verfahren (neben der Poisson-Verteilung), um die Qualität der oben genannten prozentualen Anteile zu beschreiben/ermittlen?
Vielen Dank im Voraus!
Keyvan
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:47 Di 03.10.2006 | Autor: | luis52 |
Moin rkeyvan,
an Poissonverteilung wuerde ich in diesem Zusammenhang zunaechst nicht denken, vielmehr an die Binomialverteilung.
hth
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 13:44 Mo 09.10.2006 | Autor: | rkeyvan |
Hallo luis52,
vielen Dank für die Mitteilung!
Muss ich zuerst prüfen, ob meine Zahlen binomial verteilt sind? Und wie kann ich dies prüfen? Ich habe etwas über einen Hypethesentest gelesen, komme aber nicht weiter.
Gruß,
Keyvan
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 14:42 Mo 09.10.2006 | Autor: | zetamy |
> Hallo luis52,
>
> vielen Dank für die Mitteilung!
>
> Muss ich zuerst prüfen, ob meine Zahlen binomial verteilt
> sind? Und wie kann ich dies prüfen? Ich habe etwas über
> einen Hypethesentest gelesen, komme aber nicht weiter.
>
> Gruß,
> Keyvan
Hallo,
Die Poissonverteilung ist eine Näherungsformel für die Binomialverteilung, die für sehr große n und sehr kleine p verwendet wird. Dein p ist zu groß (finde ich zumindest).
Der Hypothesentest scheint mit sinnvoller, da du oben nach einem Verfahren zur "Qualitätsbestimmung" gefragt hast. Jedoch sehe ich Probleme beim Aufstellen der Hypothesen.
Die Originalaufgabenstellung würde uns helfen, dir besser zu helfen.
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 15:02 Mi 11.10.2006 | Autor: | rkeyvan |
Hallo zetamy und danke fuer die mitteilung!
Es geibt leider keine urspruengliche Aufgabenstellung. Es geht um eine Datenbank, die ich selber fuer meine Diplomarbeit erstellt habe. Danach habe ich eben eine Statistik, die mir sagt dass 48 von 78 'Operationen' fehlgeschlagen sind, die alle auf dieselbe Art und Weise vorgenommen wurden. Nun werde ich gefragt, ob die Wahrscheinlichkeit fuer die genau naechste 'Operation' zu 61% fehlschlagen wird und ob diese 61% auch bei hoeheren Zahlen wie 500 anstatt 78 'Operationen' zu erwarten sind.
Worin siehst Du denn die Probleme, einen Hypothesentest aufzustellen? Und wie funktioniert solch ein Test?
Viele Gruesse!
Keyvan
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 22:48 Mi 11.10.2006 | Autor: | luis52 |
Wie du dein Problem urspruenglich beschrieben hast, vermute ich, dass es
dir um eine Aussage ueber die Wahrscheinlichkeit $ p $ geht, dass eine
Pille ein Problem verursacht. Wenn ich unterstelle, dass die 78 Pillen
unterschiedlichen Testpersonen verabreicht wurden (Unabhaengigkeit), so
gibt es eine naheliegende Antwort auf deine Frage: Verwende ein
Konfidenzintervall fuer die Anzahl derjenigen unter 1000 Personen, bei
denen die Pille ein Problem verursacht (ich vermute, wir sprechen von
*einem* Medikament, welches 1000 unterschiedlichen Personen gegegeben
wird und nicht von 1000 unterschiedlichen Medikamenten).
Das zugrunde liegende Modell ist das der Binomialverteilung (nicht
Poissonverteilung) und der Anteil [mm] $\hat [/mm] p=48/78=0.62$ kann als
Schaetzwert fuer den Parameter $ p $ jener Verteilung dienen. Um eine
Aussage ueber die Wahrscheinlichkeit zu machen, dass die Pille bei $ x $
Personen unter 1000 ein Problem verursacht, kannst du die Formel
$ P(X=x)={1000 [mm] \choose x}0.62^x 0.38^{1000-x}$
[/mm]
verwenden. Mit einer Sicherheitswahrscheinlichkeit von 95% kann man auch
behaupten, dass die Anzahl derjenigen unter den 1000 Personen, zwischen
504 und 715 liegt. Das ist das oben angesprochene Konfidenzintervall.
hth
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 01:47 Di 17.10.2006 | Autor: | rkeyvan |
Danke für die Ausführungen! Da ich ein solches Konfidenzintervall für weitere Datensätze berechnen muss, habe ich versucht es mir anzulesen. Wie ich es verstanden habe, muss ich Betaintervalle ausrechnen, um die untere/obere Grenze zu ermitteln. Zwei kurze Fragen hätte ich noch:
1.
Das von dir ausgerechnete Intervall ist (504;715). Mit p=0.62 würde man doch 620 von 1000 erwarten, oder? Weiß ich so also, dass 0.62 nicht der exakte Schätzwert ist, weil 620 ja nicht genau in der Mitte des Intervalls liegt?
2.
Ich bin auf eine Formel gestoßen, um in EXCEL die Betaintervalle auszurechnen:
BETAINV(Wahrscheinlichkeit,Alpha,Beta,[A],[B])
Irgendeine Ahnung welche Parameter gemeint sind? Wahrscheinlichkeit=0.95, Alfa=0.05 ??
danke
Keyvan
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 09:44 Di 17.10.2006 | Autor: | luis52 |
Hallo rkeyvan,
dass du dich ausführlicher mit Konfidenzintervallen beschäftigst, finde
ich gut. Ich weiß allerdings nicht, welche Quellen du da gefunden hast.
Eine ganz einfache Vorgensweise ist wie folgt:
a) Es $ h $ die absolute Häufigkeit des interessierenden Merkmals unter
$ n $ Beobachtungen. In deinem Fall ist $ h = 38 $ und $ n = 78 $.
b) Setze $ [mm] \tilde [/mm] p=(h+2)/(n+4)$. In deinem Fall ist
[mm] $\tilde [/mm] p=(48+2)(78+4)=50/82=0.6098$.
c) Berechne die beiden Intervallgrenzen
$ [mm] \tilde{p} \mp z_{1-\alpha/2}\sqrt{\tilde p (1-\tilde p)/(n+4)}. [/mm] Dabei ist
[mm] $z_{1-\alpha/2}$ [/mm] der [mm] $z_w$ [/mm] der [mm] $w\times [/mm] 100$%-Punkt der
Standardnormalverteilung. Deinem Beitrag im Forum entnehme ich,
dass du [mm] $\alpha=0.05$ [/mm] setzt. Dann ist [mm] $z_{0.975}=1.96$, [/mm] und es
resultiert das Intervall $0.6098 [mm] \mp 1.96\sqrt{0.2380/82}=[0.5042,0.7153]$.
[/mm]
d) Möchtest du ein Konfidenzintervall für die absolute Häufigkeit von
Personen unter $ N $ berechnen, die das Merkmal aufweisen, so sind die
Grenzen unter c) mit $ N $ zu multiplizieren. In deinem Fall ist
$ N=1000 $, und man erhält das Intervall [504,715].
Deine Frage unter 1. zielt auf den Unterschied zwischen Punkt-
und Intervallschätzern ab. Die Zahl [mm] $\hat [/mm] p$ ist ein *Punktschätzer*,
gleichsam ein Ersatzwert für den unbekannten Anteil $ [mm] p_N [/mm] $ unter $ N $
Personen, die das Merkmal tragen. Er wird so gut wie nie mit $ [mm] p_N [/mm] $
übereinstimmen. Ein *Konfidenzintervall* gleicht einer Fliegenpatsche,
mit der man $ [mm] p_N [/mm] $ treffen will. Da es sich um ein Intervall handelt, ist
es natürlich ungenauer als $ [mm] \hat [/mm] p $, jedoch kann man durch die Vorgabe
von $ [mm] \alpha [/mm] $ die Treffsicherheit steuern.
Zu Frage 2: Die Verwendung der Betaverteilung ist nur ein Ansatz unter
vielen, um Konfidenzintervalle zu berechnen. Der ist meines Erachtens
für deine Absichten zu kompliziert. Nimm ruhig das in c) angegebene:
Quadratisch, praktisch, gut Bei Bedarf nenne ich Literatur dazu.
hth
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 19:20 Di 17.10.2006 | Autor: | rkeyvan |
Mit deinen Ausführungen im Kopf habe ich ein meinen Büchern gestöbert und es weitesgehend verstanden, glaube ich. Doch mir ist nicht ganz klar, wie du auf
z(0.975)=1.96
kommst. Zufällig ergibt
[mm] \alpha/2*n=1.95 [/mm] (mit n=78).
Aber das hab ich nur durch Spielerei gesehen. Wahrscheinlich muss ich dafür die Sache mit dem
"w x 100%-Punkt der Standardnormalverteilung" verstehen? Oder wie errechnet sich [mm] z(1-\alpha/2)?
[/mm]
Ich habe gestern ein Buch bestellt: Henze, Stochastik für Einsteiger. Denn ich muss mich auch noch mit multivriaten Regressionsanalysen beschäftigen. Aber diese Binomialverteilung, die du mir erklärt hast, ist der Grundstein meiner Schlussfolgerungen.
Danke nochmal, langsam bin ich Experte
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:42 Di 17.10.2006 | Autor: | luis52 |
Hallo rkeyvan,
$ [mm] z_w [/mm] $ ist ein Prozentpunkt (oder Quantil) der Standardnormalverteilung. Ich habe hier
mal zwei Links aufgestöbert, die dir erste Einblicke bieten:
http://de.wikibooks.org/wiki/Mathematik:_Statistik:_Normalverteilung
http://www.statistik.wiso.uni-erlangen.de/download/Erlangen/GAIIFOLIEN_106_130.pdf
Das Buch von Henze kenne ich nicht, aber ich vermute, dass du auch dort
etwas finden wirst. Ob aber die multivariate Regressionsanalyse
behandelt wird, bezweifle ich.
hth
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 14:39 Mo 23.10.2006 | Autor: | rkeyvan |
Hallo hth,
deine Links haben wir bedeutend weiter geholfen, danke!
Eben erst viel mir aber auf, dass ich einen Denkfehler gemacht habe/mache. Meine Pillen haben jeweils zugeordntete Werte zwischen 1.26 und 1.85 (etwa 100 Werte). Ich habe Konfidenzintervalle für meine Daten ausgerechnet:
Zu 95%-iger Wahrscheinlichkeit erkranken 'Patienten' and den 'Pillen', deren Werte zwischen 1.62 und 1.71 liegen.
Wenn ich nun das Konfidenzintervall zu den Werten der Pillen ausrechne, die keine Erkrankung verursachen, bekomme ich ein Intervall, das sich mit dem zuvor berechneten Intervall überschneidet. Die resultierende Aussage wäre dann:
Zu 95%-iger Wahrscheinlichkeit erkranken Patienten NICHT an Pillen, deren Werte zwischen 1.59 und 1.66 liegen.
Für den Bereich 1.62 bis 1.66 gelten also beide Aussagen. Das verwirrt mich.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 14:21 So 29.10.2006 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|