normales Lineares Mode < Stochastik < Hochschule < Mathe < Vorhilfe
|
Hallo zusammen,
zu zeigen ist, daß im normalverteilten linearen Modell
[mm]Y=X\beta+\epsilon[/mm] mit [mm]\epsilon\sim
N_n(0,\sigma^2I_n)[/mm] [mm]\hat{\beta}[/mm] (das ist der
Minimum-Quadrat-Schätzer (MQS) für [mm]\beta[/mm]) und
[mm]\hat{\sigma}^2:=\bruch{RSS}{n}[/mm], mit
[mm]RSS:=\|\hat{\epsilon}\|^2=\|Y-X\hat{\beta}\|^2[/mm] die
Maximum-Likelihood-Schätzer für [mm]\beta[/mm] und
[mm]\sigma^2[/mm] sind, d.h.
[mm](\hat{\beta},\hat{\sigma}^2)=argmax\{f_Y(Y):\beta\in
\IR^p,\sigma^2>0\}[/mm],
wobei [mm]f_Y[/mm] die Dichte des Beobachtungsvektors [mm]Y\sim
N_n(X\beta,\sigma^2I_n)[/mm] ist.
Hierzu weiß ich, daß [mm]Y[/mm] wie oben verteilt die Dichte
[mm]f_Y(x)=\{(2\pi)^ndet(\sigma^2I_n)\}^{-1/2}exp\{-\bruch{1}{2}(x-X\beta)^T(\sigma^2I_n)^{-1}(x-X\beta)\}
=
\bruch{1}{(2\pi)^{n/2}\sqrt{\sigma^2}}e^{-\bruch{1}{2\sigma^2}(x-X\beta)^T(x-X\beta)}
=
\bruch{1}{(2\pi)^{n/2}\sqrt{\sigma^2}}e^{-\bruch{\|x-X\beta\|^2}{2\sigma^2}},
x\in R^n [/mm]
hat. Also gilt
[mm]f_Y(Y)=\bruch{1}{(2\pi)^{n/2}\sqrt{\sigma^2}}e^{-\bruch{\|Y-X\beta\|^2}{2\sigma^2}}
=
\bruch{1}{(2\pi)^{n/2}\sqrt{\sigma^2}}e^{-\bruch{\|\epsilon\|^2}{2\sigma^2}}
[/mm].
Soweit so gut. Nun geht es darum [mm]f_Y(Y)[/mm] über [mm]\beta
\in \IR^n, \sigma^2>0[/mm] zu maximieren. Ich weiß auf jeden Fall (Theorie zum MQS), daß [mm]\hat{\beta}[/mm] eindeutig [mm]\|Y-X\beta\|[/mm]
minimiert, also auch [mm]\|Y-X\beta\|^2[/mm]. Damit folgt ja
wegen dem Minus im Exponenten, [mm]\hat{\beta}[/mm]
maximiert [mm]f_Y(Y)[/mm].
Und nun kommt mein Problem: Es geht nun darum
[mm]g(\sigma^2):=\bruch{1}{(2\pi)^{n/2}\sqrt{\sigma^2}}e^{-\bruch{\|Y-X\hat{\beta}\|^2}{2\sigma^2}}
=
\bruch{1}{(2\pi)^{n/2}\sqrt{\sigma^2}}e^{-\bruch{\|\hat{\epsilon}\|^2}{2\sigma^2}}
=
\bruch{1}{(2\pi)^{n/2}\sqrt{\sigma^2}}e^{-\bruch{RSS}{2\sigma^2}}
[/mm] zu maximieren. Nun dachte ich mir in meinem jugendlichen
Leichtsinn es wie so üblich zu tun (ableiten, Null setzen,
umstellen, fertig). Dann passiert folgendes (ich fasse
[mm]\sigma^2>0[/mm] als reelle Veränderliche auf, sozusagen als
"Symbol"):
[mm]\bruch{df_Y(Y)}{d\sigma^2}=-\bruch{1}{2}\bruch{1}{(2\pi)^{n/2}(\sigma^2)^{3/2}}e^{-\bruch{RSS}{2\sigma^2}}
+
\bruch{1}{2}\bruch{RSS}{(2\pi)^{n/2}(\sigma^2)^{5/2}}e^{-\bruch{RSS}{2\sigma^2}}
\stackrel{!}{=}0 [/mm].
Die e-Terme sind >0, also teile ich durch sie, multipliziere mit 2
durch und schaufel den ersten Term auf die rechte Seite, dann
ergibt sich
[mm]\bruch{1}{(2\pi)^{n/2}(\sigma^2)^{3/2}} =
\bruch{RSS}{(2\pi)^{n/2}(\sigma^2)^{5/2}}[/mm].
Und wenn ich das jetzt nach [mm]\sigma^2[/mm] auflöse, kriege ich
[mm]\sigma^2=RSS[/mm].
Nun hätte ich fast einen Grund zu jubeln, nur leider ist mir
irgendwo das [mm]n[/mm] abhanden gekommen, bzw. es hat sich nicht
ergeben, denn lt. Aufgabenstellung, soll ja
[mm]\hat{\sigma}^2=\bruch{RSS}{n}[/mm] zusammen mit
[mm]\hat{\beta}[/mm] [mm]f_Y(Y)[/mm] maximieren. Kann mir mal
bitte jemand helfen und mir sagen, wo ich dieses [mm]n[/mm]
herkriege, oder ob und wo ich evtl. einen Fehler gemacht habe?
Vielen Dank schonmal!!!
|
|
|
|
Hallo twentyeight!
(Witzig, bin auch 28, wenn es damit was zu tun hat.)
> [mm][mm] f_Y(x)=\{(2\pi)^ndet(\sigma^2I_n)\}^{-1/2}exp\{-\bruch{1}{2}(x-X\beta)^T(\sigma^2I_n)^{-1}(x-X\beta)\}
[/mm]
=
[mm] \bruch{1}{(2\pi)^{n/2}\sqrt{\sigma^2}}e^{-\bruch{1}{2\sigma^2}(x-X\beta)^T(x-X\beta)}
[/mm]
>
Das Problem liegt hier, da wegen [mm] $det(c\cdot I_n)=\mathbf{\red{c^n}} [/mm] det(I)$ die Determinante von [mm] $\sigma^2 I_n$ [/mm] auch [mm] $\sigma^{2n}$ [/mm] lauten sollte. Damit solltest Du auf das richtige Ergebnis kommen.
Viele Grüße
Brigitte
|
|
|
|