Pearson vs. Spearman < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hallo Forum,
ich bin mir immer noch nicht sicher, ob ich meine Auswertung richtig mache.
Meine Daten sind intervallskaliert und positiv schief verteilt (keine NV). Ich bin mir immer noch nicht sicher ob ich den Pearson Korrelationskoeffizienten nehmen kann, da ja keine Normalverteilung vorliegt.
Ich habe bei einer Stichprobe meines datensatzes aus Interesse mal Pearson und Spearman angewandt. Der Spearman gab mir ein Rs von -0,644 und bei Pearson hat ich ein r von 0.544.
Ich frage mich als Mathelaie wie das angehen kann. Das ein Test mir eine neagtive und der andere mir eine positive Korrelation anzeigt.
lg
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 10:44 Mi 04.07.2007 | Autor: | luis52 |
>
> Ich habe bei einer Stichprobe meines datensatzes aus
> Interesse mal Pearson und Spearman angewandt. Der Spearman
> gab mir ein Rs von -0,644 und bei Pearson hat ich ein r von
> 0.544.
>
> Ich frage mich als Mathelaie wie das angehen kann. Das ein
> Test mir eine neagtive und der andere mir eine positive
> Korrelation anzeigt.
>
Das kann nicht sein. Ich vermute, dass du dich verrechnet hast. Womit
berechnest du die Werte? Zu Fuss, oder mit einem Programm? Hast du
mal ein (nicht zu grosses) Datenbeispiel?
lg
Luis
|
|
|
|
|
Hallo Luis,
ich berechne die Daten mit einer Erweiterung für Exel, die sich Winstat nennt. Ich habe jetzt mal einen teil meiner beiden Variablen unten angefügt.
Eisen
2,01000000000
1,77000000000
0,83000000000
0,51000000000
0,34000000000
0,55000000000
0,54000000000
0,42000000000
0,33000000000
0,83000000000
0,66000000000
0,42000000000
0,86000000000
0,32000000000
0,39000000000
3,50000000000
3,77000000000
3,60000000000
3,43000000000
3,32000000000
2,76000000000
2,52000000000
53600,00000000000
58100,00000000000
40000,00000000000
24600,00000000000
44600,00000000000
22100,00000000000
21700,00000000000
33600,00000000000
36600,00000000000
25000,00000000000
27600,00000000000
60900,00000000000
46200,00000000000
43500,00000000000
37900,00000000000
55100,00000000000
54300,00000000000
57800,00000000000
19200,00000000000
39800,00000000000
23100,00000000000
50000,00000000000
42300,00000000000
0,00000000000
0,00000000000
0,00000000000
0,00000000000
0,00000000000
Arsen
9,00000000000
6,00000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
2,50000000000
6,00000000000
10,00000000000
13,00000000000
13,00000000000
9,00000000000
5,00000000000
6,00000000000
4,00000000000
61,68000000000
99,82000000000
428,89000000000
290,48000000000
162,03000000000
7,69000000000
8,06000000000
12,32000000000
18,61000000000
5,83000000000
6,94000000000
160,18000000000
462,79000000000
30,61000000000
424,99000000000
126,85000000000
147,22000000000
195,37000000000
3,78000000000
41,67000000000
8,34000000000
64,51000000000
56,48000000000
6,00000000000
26,00000000000
6,00000000000
8,00000000000
110,00000000000
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:00 Mi 04.07.2007 | Autor: | luis52 |
> Hallo Luis,
>
> ich berechne die Daten mit einer Erweiterung für Exel, die
> sich Winstat nennt. Ich habe jetzt mal einen teil meiner
> beiden Variablen unten angefügt.
>
Wie ich schon vermutet habe: Ein Bedienungsfehler. Mit R erhalte *ich*:
1: |
| 2: | > cor(Eisen,Arsen,method="spearman")
| 3: | [1] 0.7170065
| 4: | > cor(Eisen,Arsen,method="kendall")
| 5: | [1] 0.5578453
| 6: | > cor(Eisen,Arsen,method="pearson")
| 7: | [1] 0.5535135
|
Informationen zu R findest du hier:
http://cran.r-project.org/
lg
P.S. Hast du dir mal ein Streudiagramm gezeichnet? Was kannst du zu den auffaelligen Arsenwerten sagen? Warum sind so viele Eisenwerte 0? Sind das fehlende Werte?
Luis
|
|
|
|
|
> > Hallo Luis,
> >
> > ich berechne die Daten mit einer Erweiterung für Exel, die
> > sich Winstat nennt. Ich habe jetzt mal einen teil meiner
> > beiden Variablen unten angefügt.
> >
>
> Wie ich schon vermutet habe: Ein Bedienungsfehler. Mit R
> erhalte *ich*:
>
> 1: |
| 2: | > > cor(Eisen,Arsen,method="spearman")
| 3: | > [1] 0.7170065
| 4: | > > cor(Eisen,Arsen,method="kendall")
| 5: | > [1] 0.5578453
| 6: | > > cor(Eisen,Arsen,method="pearson")
| 7: | > [1] 0.5535135
| 8: | > |
>
> Informationen zu R findest du hier:
>
> http://cran.r-project.org/
>
> lg
danke für deine Berechnung! Ich habe jetzt auch nochmal die Korrelation von dieser Stichprobe berechnet, da komme ich auch auf die Ergebnisse von dir.
Mein Datensatz umfasst aber im wesentlichensehr viele Nullen, bei der Variablen von Eisen. Insgesamt sind es annäherd 14 Tausend datensätze.
Die Stichprobe derren Korrelation ich berechnen wil umfasst 1800 Datensätze in etwa.
Kann es sein das die Nullen das Ergebnis stark beeinflussen?!
>
> P.S. Hast du dir mal ein Streudiagramm gezeichnet? Was
> kannst du zu den auffaelligen Arsenwerten sagen? Warum sind
> so viele Eisenwerte 0? Sind das fehlende Werte?
>
> Luis
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 14:24 Mi 04.07.2007 | Autor: | luis52 |
> Insgesamt sind es
> annäherd 14 Tausend datensätze.
>
> Die Stichprobe derren Korrelation ich berechnen wil umfasst
> 1800 Datensätze in etwa.
Verstehe ich recht: Du hast einen Datensatz mit
1800 Datenpaaren? Und das ist einer von den 14000 Datensaetzen?
>
> Kann es sein das die Nullen das Ergebnis stark
> beeinflussen?!
Ja.
lg Luis
|
|
|
|
|
>
> > Insgesamt sind es
> > annäherd 14 Tausend datensätze.
> >
> > Die Stichprobe derren Korrelation ich berechnen wil umfasst
> > 1800 Datensätze in etwa.
>
> Verstehe ich recht: Du hast einen Datensatz mit
> 1800 Datenpaaren? Und das ist einer von den 14000
> Datensaetzen?
> >
Es sind 14000 Datenpaare und nicht Sätze.
> > Kann es sein das die Nullen das Ergebnis stark
> > beeinflussen?!
>
> Ja.
>
Bei dem Datensatz mit den 1800 Datenpaaren sind etwa 1000 Datenpaare davon betroffen, das bei einer Variablen Null steht.
>
> lg Luis
>
>
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 17:20 Sa 07.07.2007 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|