www.matheraum.de
Das Matheforum.
Das Matheforum des MatheRaum.

Für Schüler, Studenten, Lehrer, Mathematik-Interessierte.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Forenbaum
^ Forenbaum
Status Mathe
  Status Schulmathe
    Status Primarstufe
    Status Mathe Klassen 5-7
    Status Mathe Klassen 8-10
    Status Oberstufenmathe
    Status Mathe-Wettbewerbe
    Status Sonstiges
  Status Hochschulmathe
    Status Uni-Analysis
    Status Uni-Lin. Algebra
    Status Algebra+Zahlentheo.
    Status Diskrete Mathematik
    Status Fachdidaktik
    Status Finanz+Versicherung
    Status Logik+Mengenlehre
    Status Numerik
    Status Uni-Stochastik
    Status Topologie+Geometrie
    Status Uni-Sonstiges
  Status Mathe-Vorkurse
    Status Organisatorisches
    Status Schule
    Status Universität
  Status Mathe-Software
    Status Derive
    Status DynaGeo
    Status FunkyPlot
    Status GeoGebra
    Status LaTeX
    Status Maple
    Status MathCad
    Status Mathematica
    Status Matlab
    Status Maxima
    Status MuPad
    Status Taschenrechner

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Mathe-Seiten:Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
StartseiteMatheForenmathematische StatistikStetigkeitsannahme
Foren für weitere Studienfächer findest Du auf www.vorhilfe.de z.B. Astronomie • Medizin • Elektrotechnik • Maschinenbau • Bauingenieurwesen • Jura • Psychologie • Geowissenschaften
Forum "mathematische Statistik" - Stetigkeitsannahme
Stetigkeitsannahme < math. Statistik < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Stetigkeitsannahme: Nichtparametrik
Status: (Frage) beantwortet Status 
Datum: 18:34 Do 19.04.2012
Autor: mikexx

Aufgabe
Hallo, es ist ja so, daß man in der Parametrik eine Verteilungsklasse annimmt und in der Nichtparametrik, daß die Stichprobe stetig verteilt ist (und jeweils auch u.i.v. sowohl in der Parametrik als auch in der Nichtsparametrik).


Meine Frage ist: Wieso macht/ braucht man in der Nichtparametrik diese Annahme, daß die Stichprobenvariablen stetig verteilt sind? Grenzt man damit nicht von vornherein die Möglichkeit aus, daß die Stichprobenvariablen diskret verteilt sind? Überall lese ich, in der Nichtparametrik würde man sich nicht vorher auf ein Modell festlegen, aber schränkt man sich nicht auf die stetigen Verteilungen ein?


Oder ist es vielmehr so zu verstehen, daß man erst eine stetige Verteilung annimmt, dann baut man eine Teststatistik, die nicht mehr von dieser stetigen Ausgangsverteilung abhängt und mit dieser Teststatistik kann man dann zum Beispiel testen, ob beispielsweise die angenommene stetige Verteilung sinnvoll ist? Aber man kann auch testen, ob nicht eigentlich eine diskrete Verteilung vorliegt und benutzt dazu trotzdem die Teststatistik, die man aus der Annahme einer stetigen Verteilung gewonnen hat?


...

        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 20:10 Do 19.04.2012
Autor: luis52

Moin,

ich kann dir nicht folgen. Die nichtparametrischen Methoden
erfordern im Gegenteil ein nur schwaches Messniveau, wie
nominal oder ordinal gemessene Daten. Ein bekannter Vertreter
ist der Chi-Quadrattest auf Unabhaengigkeit zweier Merkmale.

Die Annahme stetiger Verteilungen wird haeufig getroffen, weil dann
beispielsweise die Eigenschaften der Rangstatistiken gut genutzt werden koennen. Insbesondere ist die dann die Wahrscheinlichkeit von Bindungen
Null.

vg Luis

Bezug
                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 20:24 Do 19.04.2012
Autor: mikexx

Die einzelnen Dinge, die Du sagst, sind mir bekannt.

Aber ich verstehe nicht, wieso man einfach annehmen kann, die Stichprobe sei stetig verteilt. Mir ist klar, daß in diesem Fall dann

[mm] $P(X_i=X_j)=0, [/mm] i,j=1,...,n, [mm] i\neq [/mm] j$

gilt, aber man weiß doch gar nicht, ob die Stichprobe stetig verteilt ist.


[mm] \textit{Anders formuliert:} [/mm]

Mein Problem ist: Einerseits lese ich: Nichtparametrische Verfahren erfordern keine spezielle Verteilungsannahme.

Andererseits nehmen wir in der Vorlesung ständig an, daß die Stichprobe (bzw. die Stichprobenvariablen [mm] $X_1,...,X_n$) [/mm] stetig verteilt sind.

Wie passt das denn zusammen? Wo ist mein Denkfehler?

Bezug
                        
Bezug
Stetigkeitsannahme: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 21:04 Do 19.04.2012
Autor: mikexx

Vielleicht ist es ja so, daß es auch eine eigene Theorie nichtparametrischer Methoden gibt, wenn man davon ausgeht, daß die Stichprobenvariablen diskret verteilt sind und daß man in einer Vorlesung nur den Fall behandelt, daß die Stichprobenvariablen stetig sind?


Vielleicht ist der diskrete Fall "unschöner"?

Bezug
                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 21:26 Do 19.04.2012
Autor: luis52

Ein parametrischer Test erfordert beispielsweise die Annahme
normalverteilter Daten. Ein nichtparametrischer Test erfordert
nur, dass die Daten innerhalb eines stetigen Verteilungsmodells
erzeugt wurden, also sehr viel allgemeiner als Normalverteilung.
Das ist doch schon mal was.

vg Luis

Bezug
                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 21:33 Do 19.04.2012
Autor: mikexx

Ja, das mag ja sein, aber ich finde das trotzdem irgendwie seltsam!


Es muss doch auch den Fall geben, daß die [mm] X_i [/mm] diskret sind. Also irgendwie verwirrt mich das richtig!

Bezug
                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 21:46 Do 19.04.2012
Autor: luis52


>
> Es muss doch auch den Fall geben, daß die [mm]X_i[/mm] diskret
> sind. Also irgendwie verwirrt mich das richtig!  

Nimm an, [mm] $X_1,\dots,X_n$ [/mm] sind Bernoulli-verteilt mit [mm] $p_1$, $Y_1,\dots,Y_m$ [/mm] sind Bernoulli-verteilt mit [mm] $p_2$. [/mm] Der Test von [mm] $p_1=p_2$ [/mm] ist nichtparametrisch, die Variablen sind diskret verteilt.

vg Luis


Bezug
                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 21:55 Do 19.04.2012
Autor: mikexx

Ich kenne mich nun noch nicht gut aus, weil das Semester gerade begonnen hat, aber in dem Buch, das ich habe (Büning, Trenkler) steht bei diesem Zwei-Stichproben-Tests auch wieder als Voraussetzung, daß [mm] X_1,...,X_n,Y_1,...,Y_n [/mm] unabhängig und stetig verteilt sind.


Tut mir echt leid, aber ich checke es einfach nicht!!

Bezug
                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 22:12 Do 19.04.2012
Autor: luis52


> Ich kenne mich nun noch nicht gut aus, weil das Semester
> gerade begonnen hat, aber in dem Buch, das ich habe
> (Büning, Trenkler) steht bei diesem Zwei-Stichproben-Tests
> auch wieder als Voraussetzung, daß [mm]X_1,...,X_n,Y_1,...,Y_n[/mm]
> unabhängig und stetig verteilt sind.

Meinst du den Mann-Whitney-Test? Der basiert in der Tat auf stetigen Verteilungen. Mit dieser Annahme ist die Verteilung der Pruefgroesse unabhaengig von den Verteilungen von $X_$ von $Y_$, egal wie diese auch immer aussehen.

Diese Eigenschaften (der Rangstatistiken) lassen sich m.W. nicht ohne Weiteres herleiten, wenn die [mm]X_1,...,X_n,Y_1,...,Y_n[/mm] diskret verteilt sind.

vg Luis

Bezug
                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 22:18 Do 19.04.2012
Autor: mikexx

Also ich kenne mich einfach (noch) zu wenig aus.



Ich kenne bis jetzt nur, was eine Rangstatistik ist und eine Ordnungsstatistik. Spezielle Tests kenne ich noch gar nicht.

Ich habe mal ein bisschen diesen Smirnov-Kolmogorov Test angeguckt (Einstichprobentest) und da steht in dem genannten  Buch die Voraussetzung mit der stetigen Verteilung.

Es steht dort aber auch (ohne weitere Ausführung) etwas von diesem Test, wenn diskrete Verteilung angenommen wird.



Kann man das so sagen:

Manche Tests lassen sozusagen beide Fälle zu, andere nicht?


Welche Tests basieren eigentlich auf z.B. Rangstatistiken? Bei denen müsste es doch dann so sein, dass nur der stetige Fall geht?

Bezug
                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 08:25 Fr 20.04.2012
Autor: luis52


>  
> Ich habe mal ein bisschen diesen Smirnov-Kolmogorov Test
> angeguckt (Einstichprobentest) und da steht in dem
> genannten  Buch die Voraussetzung mit der stetigen
> Verteilung.

M.W. nach ein Zwei-Stichprobentest.

>  
> Es steht dort aber auch (ohne weitere Ausführung) etwas
> von diesem Test, wenn diskrete Verteilung angenommen wird.

Anwendbar ist der Test auch fuer diskrete Verteilungen, jedoch muessen die Prozentpunkte der Verteilung der Pruefgroesse (die ja immer gelten, sofern die Verteilungen stetig sind) unter der Nullhypothese modifiziert werden. Ich lese in einem anderen Lehrbuch, dass der KS-Test bei Verwendung der urspruenglichen kritischen Werte dazu neigt, konservativ zu sein, d.h. dass die Nullhypothese haeufiger als erwartet angenommen wird, wenn sie tatsaechlich falsch ist.

>  
>
>
> Kann man das so sagen:
>  
> Manche Tests lassen sozusagen beide Fälle zu, andere
> nicht?

Im obigen Sinn sind die Tests stets anwendbar, weisen jedoch andere, haeufig schwer zu beurteilende theoretische Eigenschaften auf, wenn die Verteilungen diskret sind.

>  
>
> Welche Tests basieren eigentlich auf z.B. Rangstatistiken?
> Bei denen müsste es doch dann so sein, dass nur der
> stetige Fall geht?

Man kann sagen, dass viele Tests, die man im Zusammenhang mit Normalverteilung kennt, in der einen oder anderen Form als Rangtest vorliegt:

Ein-Stichprobentest    ->   Wicloxon-Test
Zwei-Stichprobentest  ->   Mann-Whitney-Test
ANOVA-Test                ->   Kruskal-Wallis-Test

Bei allen Verfahren wird die starke Annahme Normalverteilung abgeschwaecht zu stetige Verteilung.

vg Luis



Bezug
                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 12:26 Fr 20.04.2012
Autor: mikexx

Okay, dann denke ich mal, da wir zuerst Rang- u. Ordnungsstatistiken behandeln, werden wohl zuerst Tests kommen, die darauf aufbauen und die deswegen wohl die Annahme einer stetigen Verteilung haben.

Welche Tests haben denn zum Beispiel nichts mit Rangstatistken zu tun, z.b. der Kolmogorov-Smirnov Test (Einstichprobentest)?

Kann ich dann also sagen:

Die Tests, die auf Rangstatistiken aufbauen werden im stetigen Fall benutzt, die Tests die nicht auf Rangstatistiken aufbauen werden im stetigen und im diskreten Fall benutzt?






Bezug
                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 12:46 Fr 20.04.2012
Autor: luis52


>
>  
> Welche Tests haben denn zum Beispiel nichts mit
> Rangstatistken zu tun, z.b. der Kolmogorov-Smirnov Test
> (Einstichprobentest)?

Ja.

>  
> Kann ich dann also sagen:
>  
> Die Tests, die auf Rangstatistiken aufbauen werden im
> stetigen Fall benutzt, die Tests die nicht auf
> Rangstatistiken aufbauen werden im stetigen und im
> diskreten Fall benutzt?
>  

Auch okay.

vg Luis

  


Bezug
                                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 12:59 Fr 20.04.2012
Autor: mikexx

Danke, dann habe ich noch eine Frage:

Und zwar setzt man ja im Zusammenhang mit Rangstatistken die Stetigkeit der Verteilung voraus, damit theoretisch leine Bindungen auftreten und man für die Verteilung der Ränge dann die Verteilungsfreiheit hat.

Macht man das aus "Bequemlichkeitsgründen"? Denn es wäre doch auch möglich, daß man eine diskrete Verteilung zulässt: Dann hat man zwar mit ziemlicher Sicherheit Bindungen, aber es gibt doch Verfahren (ich kenne vier, z.B. die Randomisierung)), um die Bindungen sozusagen zu beseitigen und eine eindeutige Rangordnung zu bekommen.


Sagt man einfach: Okay, für Rangstatistiken lassen  wir eben nur stetige Verteilungen zu, dann ist es am "bequemsten" damit zu hantieren?


(Dann kann man bei Tests, die auf Rangstatistiken aufbauen sozusagen am bequemsten vorgehen und für den Fall, daß man eine diskrete Verteilung annehmen muss, nimmt man dann halt Tests, die nicht auf Rangstatistiken aufbauen.)

Das heißt: Beschränkt man sich bei den Rangstatistken sozusagen freiwillig auf den stetigen Fall, weil der am besten ist und den diskreten Fall löst man mit anderen Statistiken, die dafür "besser"/ handhabbarer sind?

Bezug
                                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 14:07 Fr 20.04.2012
Autor: luis52


> Macht man das aus "Bequemlichkeitsgründen"? Denn es wäre
> doch auch möglich, daß man eine diskrete Verteilung
> zulässt: Dann hat man zwar mit ziemlicher Sicherheit
> Bindungen, aber es gibt doch Verfahren (ich kenne vier,
> z.B. die Randomisierung)), um die Bindungen sozusagen zu
> beseitigen und eine eindeutige Rangordnung zu bekommen.

"Bequemlichkeit" finde ich zu abwertend, die Annahme "ermoeglicht"
die Anwendbarkeit, indem Tabellen erstellt werden koennen.

Die "klassischen" Verfahren der basierend auf den Rangstatistiken
wurden zu einer Zeit entwickelt, als Rechner im statistischen Einsatz
zu teuer waren. Du hast Recht, Randomisierung ist inzwischen eine
Alternative, aber erst seit Rechenzeit immer billiger wurde.


>  
>
> Sagt man einfach: Okay, für Rangstatistiken lassen  wir
> eben nur stetige Verteilungen zu, dann ist es am
> "bequemsten" damit zu hantieren?

s.o.

>
>
> (Dann kann man bei Tests, die auf Rangstatistiken aufbauen
> sozusagen am bequemsten vorgehen und für den Fall, daß
> man eine diskrete Verteilung annehmen muss, nimmt man dann
> halt Tests, die nicht auf Rangstatistiken aufbauen.)
>  
> Das heißt: Beschränkt man sich bei den Rangstatistken
> sozusagen freiwillig auf den stetigen Fall, weil der am
> besten ist und den diskreten Fall löst man mit anderen
> Statistiken, die dafür "besser"/ handhabbarer sind?

Ja, z.B. Randomisierungs-Tests.

vg Luis

Bezug
                                                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 14:30 Fr 20.04.2012
Autor: mikexx

Bei Teststatistiken, die auf der Rangstatistik beruhen trifft man also deswegen die Stetigkeitsannahme, weil dann gesichert ist, daß die Rangstatistik (die dann in die Teststatistik eingeht) verteilungsfrei ist.

Liegen Bindungen vor, verschlechtert sich die Situation, weil man bei den verschiedenen Verfahren, die man anwenden kann, um die Bindungen "loszuwerden" entweder Informationen verliert, ein zusätzliches Zufallsexperiment braucht und wieder mehr Unsicherheit ins Spiel bringt.

Bei diskreten Verteilungen treten oft (aber doch nicht immer?) Bindungen auf, deswegen schließt man den diskreten Fall für die Rangstatistiken einfach aus und nimmt da dann andere Tests, die nicht auf den Rangstatistiken basieren und die Situation "besser" behandeln.



Es ist doch aber auch denkbar, daß bei einer diskreten Verteilung keine Bindungen vorliegen? Würde da nicht die Rangstatistik auch gut funktionieren?

Oder sagt man sich: Es ist wohl eher unwahrscheinlich, daß im diskreten Fall keine Bindungen vorkommen und deswegen sei der diskrete Fall für die Rangstatistik einfach mal bei Seite geschoben/ ausgeschlossen?

Bezug
                                                                                                                        
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 14:37 Fr 20.04.2012
Autor: mikexx

Jemand schrieb:

Rangstatistiken funktionieren nicht für diskrete Verteilungen, da bei diskreten Verteilungen ja immer Bindungen auftauchen.


Macht das Sinn?...

Funktionieren Rangstatistken wirklich nicht bei Bindungen? Warum funktionieren sie nicht bei Bindungen? In welchem Sinne "funktionieren"?
Meint man damit z.B. daß man nur im stetigen Fall z.B. sagen kann:

[mm] $E(R_i)=\frac{n+1}{2}, [/mm] i=1,...,n$, weil man da ja [mm] $P(R_i=j)=\frac{1}{n}$ [/mm] nutzt und diese Wahrscheinlichkeit kennt man ja nur, wenn alle Rangstatistken [mm] $R_i$ [/mm] ungleich sind, also im stetigen Fall? Wenn diskrete Verteilung vorläge, könnte man sich nicht sicher sein, daß keine Bindungen da sind, also schließt man diesen diskreten Fall eben aus?

(Wobei es ja auch durch Ungenauigkeit passieren kann, daß man im stetigen Fall Bindungen hat, aber das ist wieder ein anderes Thema.)

Treten bei diskreten Verteilungen immer Bindungen auf oder müsste man genauer sagen: Es ist wahrscheinlich, daß sie auftreten?


Bezug
                                                                                                                                
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 15:44 Fr 20.04.2012
Autor: luis52


> Jemand schrieb:
>  
> Rangstatistiken funktionieren nicht für diskrete
> Verteilungen, da bei diskreten Verteilungen ja immer
> Bindungen auftauchen.
>  
>
> Macht das Sinn?...
>  
> Funktionieren Rangstatistken wirklich nicht bei Bindungen?
> Warum funktionieren sie nicht bei Bindungen? In welchem
> Sinne "funktionieren"?
>  Meint man damit z.B. daß man nur im stetigen Fall z.B.
> sagen kann:
>  
> [mm]E(R_i)=\frac{n+1}{2}, i=1,...,n[/mm], weil man da ja
> [mm]P(R_i=j)=\frac{1}{n}[/mm] nutzt und diese Wahrscheinlichkeit
> kennt man ja nur, wenn alle Rangstatistken [mm]R_i[/mm] ungleich
> sind, also im stetigen Fall? Wenn diskrete Verteilung
> vorläge, könnte man sich nicht sicher sein, daß keine
> Bindungen da sind, also schließt man diesen diskreten Fall
> eben aus?
>  

Nicht ganz uninteressante Frage, die du stellt. Habe mal die
Rangstatistiken fuer Stichproben vom Umfang 10 aus einer
Poisson-Verteilung mit [mm] $\lambda=1$ [/mm] und [mm] $\lambda=10$ [/mm] simuliert.
Es zeigt sich, dass die von erwaehnte Eigenschaft der Raenge verloren geht,
insbesondere fuer [mm] $\lambda=1$, [/mm] wo ja naturgemaess viele Bindungen
auftreten. Die Situation wird dem stetigen Fall aehnlicher fuer [mm] $\lambda=10$. [/mm]

Wichtiges Fazit: Die Rangstatistiken verlieren bei diskreten Verteilungen die
schoene Eigenschaft, dass ihre Verteilung nciht abhaengt von der betrachteten
(diskreten) Verteilung.




> (Wobei es ja auch durch Ungenauigkeit passieren kann, daß
> man im stetigen Fall Bindungen hat, aber das ist wieder ein
> anderes Thema.)
>  
> Treten bei diskreten Verteilungen immer Bindungen auf oder
> müsste man genauer sagen: Es ist wahrscheinlich, daß sie
> auftreten?
>  

Die Wsk ist nicht Null, im Gegensatz bei Annahme einer stetigen verteilung.

vg Luis


Bezug
                                                                                                                                        
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 16:02 Fr 20.04.2012
Autor: mikexx

Okay, ich denke, dann habe ich es jetzt so weit erstmal verstanden, ich fasse das für mich Entscheidende nochmal zur Beendigung dieses Threads zusammen:


Nichtparametrische Verfahren setzen keine bestimmte Verteilungsannahme voraus.

Im Kontext von Rangstatistiken und Ordnungsstatistiken (und den daraus gebildeten Teststatistiken) befasst man sich aber "nur" mit den stetigen Verteilungen; d.h. in einem gewissen Sinne schränkt man die möglichen Verteilungen schon ein, und zwar auf die stetigen, weil da die Eigenschaften besonders gut sind. Man setzt also in diesem Kontext keine spezielle stetige Verteilung voraus.

Und für die diskreten Verteilungen gibt es dann andere, besser geeignete Statistiken und darauf aufbauende Tests.

--------------

Mein DENKFEHLER bestand darin, daß ich dachte, daß man durch die Stetigkeitsannahme die diskreten Verteilungen ausschließt; das tut man ja aber nur im Kontext der Rang- und Ordnungsstatistiken (und den darauf beruhenden Tests), weil dann gut gerechnet werden kann bzw. weil dann günstige Eigenschaften bestehen (z.B. die daß die Rangstatistik verteilungsfrei ist für jede stetige Verteilung): Für diskrete Verteilungen gibts dann ja aber andere nicht-parametrische Verfahren.

Das heißt man hat spezielle Vorgehensweisen für stetige und diskrete Verteilungen und alle zusammen rechtfertigen dann die allgemeine Feststellung: Die nichtparametrischen Verfahren benötigen keine spezielle Verteilungsannahme.





Kann man dazu sagen: Okay?



Bezug
                                                                                                                                                
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 16:06 Fr 20.04.2012
Autor: luis52


>
> Kann man dazu sagen: Okay?
>  

[ok]

vg Luis

Bezug
                                                                                                                                                        
Bezug
Stetigkeitsannahme: Vielen lieben Dank!
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:33 Fr 20.04.2012
Autor: mikexx

Ich danke Dir sehr (!), luis52, Du hast mir extrem weitergeholfen, endlich durchblicke ich das.

Nun freue ich mich darauf, die einzelnen Tests konkret zu lernen.


Ein schönes Wochenende für Dich!

mikexx

Bezug
                                                                                                                                                                
Bezug
Stetigkeitsannahme: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:42 Fr 20.04.2012
Autor: luis52

Danke, das wuensche ich dir auch, mikexx.

vg Luis [hand]

Bezug
                                                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 15:47 Fr 20.04.2012
Autor: luis52


>
>
> Es ist doch aber auch denkbar, daß bei einer diskreten
> Verteilung keine Bindungen vorliegen? Würde da nicht die
> Rangstatistik auch gut funktionieren?
>

Leider nicht, da man dann die aus dem stetigen Fall
bekannten Verteilungseigenschaften nicht ohne Weiteres
uebertragen kann.

vg Luis

Bezug
                                                                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 17:00 Fr 20.04.2012
Autor: mikexx

Eine Frage hat sich mir doch noch gestellt, nämlich die, wieso denn die Rangstatistik eigentlich für diskrete Verteilungen nicht funktioniert (Du hast darauf schon die Antwort gegeben, daß dann nicht von der Verteilungsfreiheit ausgegangen werden kann und das versuche ich gerade zu verstehen, daher diese Frage). Außerdem hast Du geantwortet:

> Leider nicht, da man dann die aus dem stetigen Fall
>  bekannten Verteilungseigenschaften nicht ohne Weiteres
>  uebertragen kann.
>  

Ich verstehe Deine beiden Antworten so:

Das heißt: Wenn man diskrete Verteilung hat und die Rangstatistik nimmt, ist diese nicht mit Sicherheit verteilungsfrei, weil je nach Art der diskreten Verteilung verschieden wahrscheinlich Bindungen vorkommen können und sich daraus nicht allgemein sicher (wie im stetigen Fall) schließen lässt, daß der Rangvektor einer bestimmten Permutation entspricht.

Man hätte unschönere Formeln für Erwartungswert usw. und diese wären zudem noch abhängig davon, welche diskrete Verteilung man vorliegen hat? Zum Beispiel sähe eine Formel den Erwartungswert der Rangstatistik bei Poissonverteilung mit [mm] $\lambda=1$ [/mm] anders aus als eine für die Poissonverteilung mit [mm] $\lambda=10$, [/mm] weil per se Bindungen wahrscheinlicher sind für [mm] $\lambda=1$ [/mm] und es sozusagen somit nicht egal ist, welche diskrete Verteilung man annimmt.

Mit anderen Worten: Die Verteilung der Rangstatistik hängt davon ab, welche diskrete Verteilung vorläge und man kann für die Rangstatistik keine "allgemeinen" Formeln" (soll heißen: Formeln, die für jede diskrete Verteilung gelten) z.B. für den Erwartungswert angeben?

Wohingegen bei jeder stetigen Verteilung eben der Rangvektor immer genau einer Permutation entspricht (denn Bindungen gibt's keine) und somit die Rangstatistik verteilungsfrei ist und man zu allgemeinen Formeln kommt.

-----------

Wieso ist es was Anderes, wenn man von einer stetigen Verteilung ausgeht und dann Bindungen aufgrund von Meßungenaiugkeiten hat? Weil man THEORETISCH davon ausgehen kann, daß es keine Bindungen gibt und die vorhandenen mit einem Verfahren wegbekommt und dabei zwar z.B. Informationsverlust hat aber weiterhin ja weiß, daß die Verteilungseigenschaften der rangstatistik nicht von der speziellen stetigen Verteilung abhängen (weil es THEORETISCH keine Bindungen gibt!)?

Bezug
                                                                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 19:34 Fr 20.04.2012
Autor: luis52


> Eine Frage hat sich mir doch noch gestellt, nämlich die,
> wieso denn die Rangstatistik eigentlich für diskrete
> Verteilungen nicht funktioniert (Du hast darauf schon die
> Antwort gegeben, daß dann nicht von der
> Verteilungsfreiheit ausgegangen werden kann und das
> versuche ich gerade zu verstehen, daher diese Frage).
> Außerdem hast Du geantwortet:
>
> > Leider nicht, da man dann die aus dem stetigen Fall
>  >  bekannten Verteilungseigenschaften nicht ohne Weiteres
>  >  uebertragen kann.
>  >  
>
> Ich verstehe Deine beiden Antworten so:
>  
> Das heißt: Wenn man diskrete Verteilung hat und die
> Rangstatistik nimmt, ist diese nicht mit Sicherheit
> verteilungsfrei, weil je nach Art der diskreten Verteilung
> verschieden wahrscheinlich Bindungen vorkommen können und
> sich daraus nicht allgemein sicher (wie im stetigen Fall)
> schließen lässt, daß der Rangvektor einer bestimmten
> Permutation entspricht.
>  
> Man hätte unschönere Formeln für Erwartungswert usw. und
> diese wären zudem noch abhängig davon, welche diskrete
> Verteilung man vorliegen hat? Zum Beispiel sähe eine
> Formel den Erwartungswert der Rangstatistik bei
> Poissonverteilung mit [mm]\lambda=1[/mm] anders aus als eine für
> die Poissonverteilung mit [mm]\lambda=10[/mm], weil per se Bindungen
> wahrscheinlicher sind für [mm]\lambda=1[/mm] und es sozusagen somit
> nicht egal ist, welche stetige Verteilung man annimmt.
>  
> Mit anderen Worten: Die Verteilung der Rangstatistik hängt
> davon ab, welche diskrete Verteilung vorläge und man kann
> für die Rangstatistik keine "allgemeinen" Formeln" (soll
> heißen: Formeln, die für jede diskrete Verteilung gelten)
> z.B. für den Erwartungswert angeben?
>  
> Wohingegen bei jeder stetigen Verteilung eben der
> Rangvektor immer genau einer Permutation entspricht (denn
> Bindungen gibt's keine) und somit die Rangstatistik
> verteilungsfrei ist und man zu allgemeinen Formeln kommt.
>  

Das hast du sehr schoen zusammengefasst.

> -----------
>  
> Wieso ist es was Anderes, wenn man von einer stetigen
> Verteilung ausgeht und dann Bindungen aufgrund von
> Meßungenaiugkeiten hat? Weil man THEORETISCH davon
> ausgehen kann, daß es keine Bindungen gibt und die
> vorhandenen mit einem Verfahren wegbekommt und dabei zwar
> z.B. Informationsverlust hat aber weiterhin ja weiß, daß
> die Verteilungseigenschaften der rangstatistik nicht von
> der speziellen stetigen Verteilung abhängen (weil es
> THEORETISCH keine Bindungen gibt!)?

Hier verstehe ich dich nicht.

vg Luis


Bezug
                                                                                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 19:52 Fr 20.04.2012
Autor: mikexx


> Das hast du sehr schoen zusammengefasst.

Danke, da freue ich mich, denn ich scheine es verstanden zu haben. :-)

Das bedeutet doch aber auch (das meintest Du glaube ich in einer Deiner Antworten): Es ist zwar möglich, daß bei einer diskreten Verteilung keine Bindungen vorliegen, dennoch kann man hier nicht die "Resultate" aus dem stetigen Fall übernehmen (man kann ja nicht plötzlich vom diskreten in den stetigen Fall überwechseln), sondern weiterhin gilt, daß die Rangstatistik nicht verteilungsfrei ist und daß man also leider keinen Profit daraus schlagen kann, wenn im diskreten Fall keine Bindungen auftreten?

>  
> > -----------
>  >  
> > Wieso ist es was Anderes, wenn man von einer stetigen
> > Verteilung ausgeht und dann Bindungen aufgrund von
> > Meßungenaiugkeiten hat? Weil man THEORETISCH davon
> > ausgehen kann, daß es keine Bindungen gibt und die
> > vorhandenen mit einem Verfahren wegbekommt und dabei zwar
> > z.B. Informationsverlust hat aber weiterhin ja weiß, daß
> > die Verteilungseigenschaften der rangstatistik nicht von
> > der speziellen stetigen Verteilung abhängen (weil es
> > THEORETISCH keine Bindungen gibt!)?
>
> Hier verstehe ich dich nicht.

Also wir hatten in der Vorlesung, daß auch bei Annahme einer stetigen Verteilung es aufgrund z.B. von Meßungenauigkeit zu Bindungen kommen kann. In diesem Zusammenhang wurden dann vier Methoden präsentiert, wie man die Bindungen sozusagen loswird (z.B. durch die Bildung von Durchschnittsrängen).
Ich meinte mit meiner Frage, wieso die Bindundungen hier nicht (wie diejenigen, die nicht bei diskreten Verteilungen ausgeschlossen werden können) dazu führen, daß die Rangstatistik nicht verteilungsfrei ist.

In meiner letzten Frage bzw. meiner Zusammenfassung hatte ich ja geschrieben, daß bei diskreter Verteilung Bindungen auftreten können und daß dies zur Folge hat, daß die Rangstatistik nicht verteilungsfrei ist. Wenn im stetigen Fall Bindungen auftreten, hat das nicht diese Wirkungen und daher dachte ich, daß das damit zusammenhängen könnte, daß die Bindungen ja sozusagen dann nur in den Daten liegen (soll heißen: aufgrund von Meßungenauigkeit) und nicht in der Verteilung selbst wurzeln. Daher - so meine Erklärung - kann man die Bindungen nach einer der Methoden entfernen und hat dann eben wieder die Situation, daß die Rangstatistik verteilungsfrei ist. Allerdings hat man z.B. Informationsverlust durch das Beseitigen der Bindungen.


Offenbar sind also Bindungen und Bindungen nicht das Gleiche, je nachdem, ob man von einer diskreten oder einer stetigen Verteilung ausgeht.


Bezug
                                                                                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 22:22 Fr 20.04.2012
Autor: luis52


> > Das hast du sehr schoen zusammengefasst.
>  
> Danke, da freue ich mich, denn ich scheine es verstanden zu
> haben. :-)
>  
> Das bedeutet doch aber auch (das meintest Du glaube ich in
> einer Deiner Antworten): Es ist zwar möglich, daß bei
> einer diskreten Verteilung keine Bindungen vorliegen,
> dennoch kann man hier nicht die "Resultate" aus dem
> stetigen Fall übernehmen (man kann ja nicht plötzlich vom
> diskreten in den stetigen Fall überwechseln), sondern
> weiterhin gilt, daß die Rangstatistik nicht
> verteilungsfrei ist und daß man also leider keinen Profit
> daraus schlagen kann, wenn im diskreten Fall keine
> Bindungen auftreten?

Auch das ist korrekt.

>  >  
> > > -----------
>  >  >  
> > > Wieso ist es was Anderes, wenn man von einer stetigen
> > > Verteilung ausgeht und dann Bindungen aufgrund von
> > > Meßungenaiugkeiten hat? Weil man THEORETISCH davon
> > > ausgehen kann, daß es keine Bindungen gibt und die
> > > vorhandenen mit einem Verfahren wegbekommt und dabei zwar
> > > z.B. Informationsverlust hat aber weiterhin ja weiß, daß
> > > die Verteilungseigenschaften der rangstatistik nicht von
> > > der speziellen stetigen Verteilung abhängen (weil es
> > > THEORETISCH keine Bindungen gibt!)?
> >
> > Hier verstehe ich dich nicht.
>
> Also wir hatten in der Vorlesung, daß auch bei Annahme
> einer stetigen Verteilung es aufgrund z.B. von
> Meßungenauigkeit zu Bindungen kommen kann. In diesem
> Zusammenhang wurden dann vier Methoden präsentiert, wie
> man die Bindungen sozusagen loswird (z.B. durch die Bildung
> von Durchschnittsrängen).
>  Ich meinte mit meiner Frage, wieso die Bindundungen hier
> nicht (wie diejenigen, die nicht bei diskreten Verteilungen
> ausgeschlossen werden können) dazu führen, daß die
> Rangstatistik nicht verteilungsfrei ist.
>  
> In meiner letzten Frage bzw. meiner Zusammenfassung hatte
> ich ja geschrieben, daß bei diskreter Verteilung Bindungen
> auftreten können und daß dies zur Folge hat, daß die
> Rangstatistik nicht verteilungsfrei ist. Wenn im stetigen
> Fall Bindungen auftreten, hat das nicht diese Wirkungen und
> daher dachte ich, daß das damit zusammenhängen könnte,
> daß die Bindungen ja sozusagen dann nur in den Daten
> liegen (soll heißen: aufgrund von Meßungenauigkeit) und
> nicht in der Verteilung selbst wurzeln. Daher - so meine
> Erklärung - kann man die Bindungen nach einer der Methoden
> entfernen und hat dann eben wieder die Situation, daß die
> Rangstatistik verteilungsfrei ist. Allerdings hat man z.B.
> Informationsverlust durch das Beseitigen der Bindungen.
>  

Man kann im stetigen Fall von theoretischen Raengen und von empirischen
Raengen sprechen. Im ersten Fall treten keine Bindungen  auf, im letzteren wohl. Die Frage ist, wie inwieweit die  bekannten theoretischen Ergebnisse mit theoretischen Raengen uebertragbar sind, wenn man die empirischen Raenge verwendet. Und da zeigt sich, dass der Fehler in vielen Faellen tolerabel ist, z.B. dadurch, dass das (theoretische) Signifikanzniveau dem sehr aehnlich ist, was sich bei Verwendung der empirischen Raenge ergibt.

Ein Beispiel: Wenn im Fall $n=5_$ die Zahlen $(2.1,5.4,5.1,2.3,3.7)_$ beobachtet werden, so  kann man man mit der Gleichverteilung fuer  die theoretischen Raenge $(2,5,4,1,3)_$ arbeiten. Fuer die  Zahlen
$(2,5,5,2,3)_$  kann man die (empirischen )Durchschnittsrange $(1.5,4.5,4.5,1.5,3)_$ bilden, woraus die Verteilung $P(R=1.5)=2/5=P(R=4.5)_$, $P(R=3)=1/5)$  folgt. Die bekannte erste (theroretische) Verteilung dient dann als Approximation  der i.a. unbekannten (empirischen) Verteilung.

vg Luis



Bezug
                                                                                                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 22:43 Fr 20.04.2012
Autor: mikexx


> Ein Beispiel: Wenn im Fall [mm]n=5_[/mm] die Zahlen
> [mm](2.1,5.4,5.1,2.3,3.7)_[/mm] beobachtet werden, so  kann man man
> mit der Gleichverteilung fuer  die theoretischen Raenge
> [mm](2,5,4,1,3)_[/mm] arbeiten.

Hier meinst Du (1,5,4,2,3) - oder?


Okay, anstatt also z.B. $P(R=2)$ zu berechnen, berechnet man dann $P(R=1,5)$?

-----------------------

Okay, auch hier eine Zusammenfassung:

Diskrete Verteilungen: Bindungen können auftreten (die W.keit, daß sie auftreten, ist nicht Null); daher Rangstatistik nicht verteilungsfrei, da es von der diskreten Verteilung abhängt, wie wahrscheinlich Bindungen sind; treten keine Bindungen auf, ändert das leider auch nichts an der Tatsache, daß die Rangstatistik nicht verteilungsfrei ist.

Stetige Verteilungen: Bindungen treten nicht auf --> theoretische Ränge; empirisch kann es aber zu Bindungen kommen ---> Rangstatistik dennoch weiterhin verteilungsfrei; Fehler meist tolerabel und theoretische Ränge können als Approximation der empirischen Ränge dienen


Bezug
                                                                                                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 23:25 Fr 20.04.2012
Autor: luis52


> > Ein Beispiel: Wenn im Fall [mm]n=5_[/mm] die Zahlen
> > [mm](2.1,5.4,5.1,2.3,3.7)_[/mm] beobachtet werden, so  kann man man
> > mit der Gleichverteilung fuer  die theoretischen Raenge
> > [mm](2,5,4,1,3)_[/mm] arbeiten.
>  
> Hier meinst Du (1,5,4,2,3) - oder?

Stimmt.

>
>
> Okay, anstatt also z.B. [mm]P(R=2)[/mm] zu berechnen, berechnet man
> dann [mm]P(R=1,5)[/mm]?
>  
> -----------------------
>  
> Okay, auch hier eine Zusammenfassung:
>  
> Diskrete Verteilungen: Bindungen können auftreten (die
> W.keit, daß sie auftreten, ist nicht Null); daher
> Rangstatistik nicht verteilungsfrei, da es von der
> diskreten Verteilung abhängt, wie wahrscheinlich Bindungen
> sind; treten keine Bindungen auf, ändert das leider auch
> nichts an der Tatsache, daß die Rangstatistik nicht
> verteilungsfrei ist.

Ja.

>  
> Stetige Verteilungen: Bindungen treten nicht auf -->
> theoretische Ränge; empirisch kann es aber zu Bindungen
> kommen ---> Rangstatistik dennoch weiterhin
> verteilungsfrei; Fehler meist tolerabel und theoretische
> Ränge können als Approximation der empirischen Ränge
> dienen
>  

Im Prinzip ist es so, dass man mit *Funktionen* [mm] $T=T(R_1,\dots,R_n)$ [/mm] von Rangstatistiken arbeitet, deren Verteilung beispielsweise auf der Gleichverteilung der theoretischen Raenge $(1,2,3,4,5)_$ beruht und vielfach tabelliert sind. Treten Bindungen auf, so veraendern sich die Werte von $T_$ ensprechend, und man muss man deren Verteilung mit der Verteilung von $(1.5,1.5,3,4.5,4.5)_$ bestimmen. Weil es viel zu viele Moeglichkeiten gibt, wie Durschschnittsraenge entstehen koennen, ist es unmoeglich, fuer alle Tabellen zu erstellen. Deswegen fungiert die theoretische Rangverteilung als Approximation fuer die empirische. (Ein Randomisierungstest ist natuerlich auch moeglich).

vg Luis


Bezug
                                                                                                                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 00:58 Sa 21.04.2012
Autor: mikexx

Und was macht man, wenn man die theoretischen Ränge nicht kennt, also nur z.B. die Daten (2,2,3,4,5) vorliegen hat, und sich jetzt durch Durchschnittsrangbildung die Ränge bildet, hier (1.5,1.5, 3,4,5)?


Man weiß jetzt also nicht, daß die Daten genau genommen z.B. (2.1,2.4,3.1,4,5.2) sind und die theoretischen Ränge also (1,2,3,4,5). Wie kann man sich dann an der theoretischen Rangverteilung orientieren bzw. mit dieser approximieren?

Ist es so, daß man dann so vorgeht, daß man die Teststatistiken modifiziert (wohl so, daß man irgendwie auf ein akzeptables Ergebnis kommt, das wohl wieder mit einer theoretischen Rangverteilung zu tun hat; vielleich mit einer Art theoretischer Rangverteilung, die für alle möglichen Bindungen irgendwie ganz passabel approximiert)? Ich weiß darüber noch nichts Genaueres, nur das würde mir einfallen bzw. ich meine es andeutungsweise gelesen zu haben.

Bezug
                                                                                                                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 10:09 Sa 21.04.2012
Autor: luis52

Ich weiss nicht, ob dir der Mann-Whitney-Test fuer zwei Stichproben schon gelaeufig ist.  Angenommen, der Vektor $(2.1,2.4,3.1,4.0,5.2)_$ kann den beiden Stichproben gemaess $(x,y,x,y,y)_$ zugeordnet werden.  Die Pruefgroesse $S_$ des MW-Test ist (z.B.) die Summe der x-Raenge, hier also $1+3=4_$.  Es gibt [mm] $\binom{5}{2}=10$ [/mm] Moeglichkeiten, wie sich $S_$ realisieren kann, und die folgende Tabelle zeigt alle Moeglichkeiten:

1: 3 4 5 6 7 8 9
2: 1 1 2 2 2 1 1


Im vorliegenden Fall ist also $P(S=5)=2/10_$, und insbesondere ist [mm] $P(S\le [/mm] 4)=2/10=0.2$.  Das ist die theoretische Verteilung, die man tabellieren kann.

Werden statt der Originalwerte die Werte $(2,2,3,4,5)_$ beobachtet und die Durchschnittsraenge $(1.5,1.5,3.0,4.0,5.0)_$ gebildet, so ergibt sich $S=4.5$.  Die folgende Tabelle informiert ueber die zugehoerige (empirische) Verteilung:

1: 3.0 4.5 5.5 6.5 7.0 8.0 9.0
2: 1   2   2   2   1   1   1



Insbesondere ist nun [mm] $P(S\le [/mm] 4.5)=3/10=0.3$.

Sie wird nicht tabelliert, da $(1.5,1.5,3.0,4.0,5.0)_$ nur eine der vielen Moeglichkeiten ist, wie Durchschnittsraenge hier entstehen koennen.  Aber die theoretische Verteilung (die vielleicht tabelliert ist oder die in Statistikpaketen implementiert sind) dient der Approximation der emprischen Verteilung.

vg Luis
            

Bezug
                                                                                                                                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 11:06 Sa 21.04.2012
Autor: mikexx

Leider ist mir der M.W.-Test noch nicht geläufig.

Ich denke aber, daß ich grundsätzlich jetzt verstanden habe, daß man die theoretische Verteilung benutzt, um die empirische zu approximieren.

-----------

In meiner Mitschrift steht  zu den Durchschnittsrängen dazu:

[mm] \textit{(i) beeinflusst die Verteilung von Teststatistiken, die auf Rängen beruhen}: [/mm] Bei dem Beispiel von Dir sieht man das ja gut: Die Verteilung von S sieht bei den Durchschnittsrängen ja anders aus als bei den Originaldaten.

Okay, das verstehe ich also schonmal.

Weiter heißt es dort: [mm] \textit{(ii) Ränge nicht mehr ganzzahlig} [/mm] - das ist mir auch klar

Schließlich steht dort:

[mm] \textit{wegen (i) und (ii) Modifikationen der Teststatistiken i.A. erforderlich} [/mm]


Wie ist das gemeint?

Bezug
                                                                                                                                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 13:11 Sa 21.04.2012
Autor: luis52


> Schließlich steht dort:
>  
> [mm]\textit{wegen (i) und (ii) Modifikationen der Teststatistiken i.A. erforderlich}[/mm]
>  
>
> Wie ist das gemeint?  

Hm, da muesstest du deinen DonzentIn mal fragen. Ich kann mir vorstellen, dass die Modifikation von der theoretischen hin zur empirischen Verteilung gemeint ist.

vg Luis


Bezug
                                                                                                                                                                                                                
Bezug
Stetigkeitsannahme: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 13:41 Sa 21.04.2012
Autor: mikexx

Ich habe mal in dem Buch von Büning und Trenkler geblättert und ohne jetzt genau verstehen zu können, was die Hintergründe sind, so meine ich dort ein Beispiel dafür gefunden zu haben (beim Wilcoxon-Rangsummentest), was man unter "Modifikation der Teststatistik" meinen könnte:

Also als Teststatistik ist dort angegeben:

[mm] $W_N=\sum_{i=1}^{m}R(X_i)$ [/mm]

Dort steht dann:

[mm] $\operatorname{Var}(W_N)=\frac{mn(N+1)}{12}$. [/mm]

Wobei hier gilt:

(1) Die Stichprobenvariablen [mm] $X_1,...,X_m,Y_1,...,Y_n$ [/mm] sind unabhängig.

(2) [mm] $X_1,...,X_m$ [/mm] und [mm] $Y_1,...,Y_n$ [/mm] haben stetige Verteilungsfunktionen F und G.


Im Falle von Bindungen wird nun obige Formel für die Varianz umgeändert in

[mm] $\operatorname{Var}(W_N')=\frac{mn}{12}\left[N+1-\frac{1}{N(N-1)}\sum_{j=1}^{r}(b_j^3-b_j)\right]$, [/mm] wobei r die Anzahl der Gruppen von Bindungen ist und [mm] $b_j$ [/mm] die Anzahl der Bindungen in der j-ten Gruppe, [mm] $1\leq j\leq [/mm] r$, ist. Eine ungebundene Beobachtung ist eine Gruppe vom Umfang 1. [mm] ($W_N'$ [/mm] soll hier m.E. ausdrücken, daß man mit Durchschnittsrängen rechnet - im Gegensatz zu [mm] $W_N$.) [/mm]

Das heißt, man hat die Teststatistik hier "irgendwie" verändert (in dem Buch steht nur die Formel für die geänderte Varianz, nicht, wie die Teststatistik [mm] $W_N$ [/mm] selbst geändert wurde und warum) ansonsten käme man ja nicht auf eine andere Formel für die Varianz. WIE diese Veränderung aussieht, vermag ich im Moment nicht zu verstehen, ist wohl auch jetzt noch nicht so entscheidend.


In diesem Sinne stimmt wohl Deine Vermutung, daß man mit Modifikation der Teststatistik meint, daß man sie im Hinblick auf die Bindungen an die empirische Situation anpasst. Wie gesagt, ich kann jetzt nicht sagen, inwiefern diese Formeln zustande kommen, aber man erkennt hier glaube ich ganz gut, daß man im Fall von Bindungen "irgendwie" eine Veränderung an den theoretischen Formeln vornimmt.

Es folgt dann dort ein Beispiel:

Dabei stellt sich mit der oben beschrieben Änderung der Formel dann heraus, daß sich die Varianz bei Bindungen sehr wenig von der "originalen" Varianz unterscheidet.





Man verändert also beim Auftreten von Bindungen die Teststatistiken und kommt dann auf "neue" Formeln: Die Veränderungen der Teststatistik führen natürlich zu neuen Formeln z.B. für die Varianz. Dabei werden diese Veränderungen wohl so gemacht werden, daß die Abweichung bei der Rechnung z.B. mit Durchschnittsrängen möglichst gering sind.

Ich denke mal, daß sich die Veränderungen der Teststatistiken sicher irgendwie historisch hergeleitet haben: In der Vorlesung werde ich sicher erfahren, wieso man bestimmte Teststatistiken gerade SO und nicht anders modifiziert, wieso bestimmte Veränderungen der Teststatistik dafür sorgen, daß die Abweichungen minimal werden.





Bezug
                                                                                                                                                                                                                        
Bezug
Stetigkeitsannahme: Antwort
Status: (Antwort) fertig Status 
Datum: 14:49 Sa 21.04.2012
Autor: luis52


> Ich denke mal, daß sich die Veränderungen der
> Teststatistiken sicher irgendwie historisch hergeleitet
> haben: In der Vorlesung werde ich sicher erfahren, wieso
> man bestimmte Teststatistiken gerade SO und nicht anders
> modifiziert, wieso bestimmte Veränderungen der
> Teststatistik dafür sorgen, daß die Abweichungen minimal
> werden.
>
>

Kann sein, muss aber nicht. Die Herleitung der Modifikationen
ist i.a. tricky. Lernst du bei Mathematikern, dann vielleicht ja, lernst du bei anderen "Fussgaengern", dann eher nein.

vg Luis



Bezug
                                                                                                                                                                                                                                
Bezug
Stetigkeitsannahme: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 15:14 Sa 21.04.2012
Autor: mikexx

Da ich Mathematik studiere, hege ich mal die Hoffnung, daß ich die eine oder andere Herleitung der Modifikationen sehe.


Wenn Du mir ansonsten bei meinem letzten Beitrag zustimmst (und das scheint der Fall zu sein, da Du keine Widerworte eingelegt hast), so bin ich nun vorerst zufrieden.

[mm] \textbf{Ich bedanke mich nochmals für Deine großartige Hilfe.} [/mm]
[mm] \textit{Nun habe ich Deine Hilfe erstmal genug in Anspruch genommen.} [/mm] :-)

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "mathematische Statistik"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.matheforum.net
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]