Korrelation/nicht Normalvertei < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Ich habe eine große Datenmenge und möchte nun Stichproben daraus miteinander korrelieren, die beiden Variablen sind aber nicht normalverteilt.
Daher frage ich mich, kann ich einfach den korrelationskoeffizienten nach Pearson berechnen, bzw. eine Regression. Oder müßte ich es eher mit dem Rangkorrelationskoeffizienten probieren.
Wäre toll wenn mir einer eine Antwort geben könnte
ch habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Hallo,
den Rangkorrelationskoeffizienten nimmst du immer dann, wenn du keine Information über die Verteilung hast. Sind sie nicht normalverteilt, kann der Pearson-KK nicht genommen werden, bleibt Spearman und Kendall Tau.
VLG, bellybutton.
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 10:43 Mo 02.07.2007 | Autor: | luis52 |
Moin schnepfi,
zunaechst einmal .
Ich moechte die Antwort von bellybutton etwas ergaenzen. Natuerlich
kannst du den Pearsonkoeffizienten berechnen, musst dich nur fragen,
ob das sinnvoll ist. Bitte bedenke, dass du ein staerkeres Messniveau
benoetigst als eine ordinale Skala. Ist das nicht der Fall, so ist
Spearman oder Kendall erste Wahl.
Hast du ein staerkeres Messniveau, so kann die Berechnung nach Pearson
angebracht sein, wenn du ein deskriptives Mass verwenden willst.
lg Luis
|
|
|
|
|
Hallo luis,
was meinst du den mit einem stärkeren Meßniveau? Ich habe ja metrische Daten, also mit definierten Abständen und mit definiertem Nullpunkt, nur eben nicht normalverteilt.
Und ich wollte die generelle Abhängigkeit der einzelnen Werte von einander berechnen.
Lg Ani
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 22:05 Mo 02.07.2007 | Autor: | luis52 |
> Hallo luis,
>
> was meinst du den mit einem stärkeren Meßniveau? Ich habe
> ja metrische Daten, also mit definierten Abständen und mit
> definiertem Nullpunkt, nur eben nicht normalverteilt.
Staerker als nominal oder ordinal skaliert. Wie du deine Daten
beschreibst, kannst du den Pearson-Koeffizienten $r$ "ruhigen Gewissens"
berechnen.
>
> Und ich wollte die generelle Abhängigkeit der einzelnen
> Werte von einander berechnen.
Gut, mit $r$ kannst du das tun. lg Luis
|
|
|
|
|
Hallo nochmal,
ich wollte bei meiner Auswertung ja nur ganz sicher gehen, welche Verfahren mathematisch korrekt sind da ich statistisch nicht so versiert bin.
Ist für parametrische Methoden wie der Korrelation die Normalverteilung nicht absolute Bedingung?
Eine Transformation durch Logarithmierung ist nicht möglich da im Datensatz auch sehr viele Nullen vorkommen.
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 21:34 Di 03.07.2007 | Autor: | luis52 |
> Ist für parametrische Methoden wie der Korrelation die
> Normalverteilung nicht absolute Bedingung?
Nein.
>
> Eine Transformation durch Logarithmierung ist nicht möglich
> da im Datensatz auch sehr viele Nullen vorkommen.
Warum willst du transformieren?
lg
|
|
|
|
|
Hallo Luis,
> > Ist für parametrische Methoden wie der Korrelation die
> > Normalverteilung nicht absolute Bedingung?
> Nein.
Auch nicht für Pearson?! Warum steht es den dann in etlichen Quellen?
> >
> > Eine Transformation durch Logarithmierung ist nicht möglich
> > da im Datensatz auch sehr viele Nullen vorkommen.
>
> Warum willst du transformieren?
>
Ich hatte gelesen das man nichtnormalverteilte Werte transformieren könnte damit diese Normalverteilt werden.
Danke für deine schnellen Antworten und liebe Grüße
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 09:54 Mi 04.07.2007 | Autor: | luis52 |
Hallo lilagurke,
unsere Diskussion krankt etwas daran, dass du nicht sagst, was du
bezweckst. Willst du einen Zusammenhang zwischen zwei Merkmalen
"nachweisen", so kannst du das innerhalb eines statistischen Modells tun, indem du einen Test bezueglich der Korrelation durchfuehrst. In der Tat, die Durchfuehrung des Tests basierend auf dem Pearson-Koeffizient setzt das Modell der (bivariaten) Normalverteilung voraus.
Willst du deinen Daten nur in einer deskriptiven Weise "zu Leibe ruecken", so kannst du den Pearson-Koeffizient als informelle Masszahl benutzen, jedoch ist es dann im allgemeinen schwierig, damit eine "Signifikanz" zu verknuepfen.
lg
Luis
|
|
|
|
|
Hallo Luis,
damit wir vieleicht nicht mehr aneinander vorbei reden. Hier die Intention meiner Datenanalyse.
Ich hatte die Hypothese das eine Variable von einer anderen Abhängig ist und dieses wollte ich mit einer Korrelation belegen und dementsprechend das richtige Verfahren wählen.
So wie ich dich verstehe wäre für erstere wahrscheinlich doch Spearman besser
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 10:37 Mi 04.07.2007 | Autor: | luis52 |
> Hallo Luis,
>
>
>
> Ich hatte die Hypothese das eine Variable von einer anderen
> Abhängig ist und dieses wollte ich mit einer Korrelation
> belegen und dementsprechend das richtige Verfahren wählen.
>
> So wie ich dich verstehe wäre für erstere wahrscheinlich
> doch Spearman besser
Ja.
lg
Luis
|
|
|
|