Matrizen umformung < Matrizen < Lineare Algebra < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 12:29 Mi 17.09.2014 | Autor: | welt |
Hallo,
ich habe ein Problem bei dieser Aufgabe
$b [mm] \in \mathbb{R}^p$ [/mm]
$y [mm] \in \mathbb{R}^n$
[/mm]
$x [mm] \in \mathbb{R}^{nxp}$
[/mm]
diese Gleichheit soll gelten: $-y^tXb-b^TX^Ty=-2y^TXb$
ich komm einfach nicht auf die Umformungen um diese Gleichheit zu zeigen,
links ist der eine Teil das transponierte vom anderen, aber wieso darf man das einfach so zusammenfassen?
mfG
|
|
|
|
Hallo,
> Hallo,
>
> ich habe ein Problem bei dieser Aufgabe
> [mm]b \in \mathbb{R}^p[/mm]
> [mm]y \in \mathbb{R}^n[/mm]
> [mm]x \in \mathbb{R}^{nxp}[/mm]
>
> diese Gleichheit soll gelten: [mm]-y^tXb-b^TX^Ty=-2y^TXb[/mm]
> ich komm einfach nicht auf die Umformungen um diese
> Gleichheit zu zeigen,
>
> links ist der eine Teil das transponierte vom anderen, aber
> wieso darf man das einfach so zusammenfassen?
geh mal deine Unterlagen durch, was das Produkt transponierter Matrizen angeht. Dort solltest du die Rechenregel
[mm] \left(A*B\right)^T=B^T*A^T
[/mm]
finden, und genau um die (zweifache) Anwendung dieser Regel geht es hier.
PS: eine konsistente Groß- und Kleinschreibung wäre hier sehr hilfreich...
Gruß, Diophant
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 12:54 Mi 17.09.2014 | Autor: | welt |
Hallo,
ich stehe einfach komplett auf dem schlauch
es müsste dann ja gelten $y^TXb=b^TX^Ty$
aber es gilt ja [mm] $(y^TXb)^T=b^TX^Ty$
[/mm]
es müsste also das transponierte das selbe sein wie das nicht transponierte, hier kommen ja beides mal zahlen raus und ich denke mit normaler Matrixmultiplikation könnte ich das auch beweisen, aber ich sehe einfach nicht den "einfachen" rechenschritt der mir fehlt.
und ich wüsste auch nicht wo ich die Rechenregel hier sinnvoll 2 mal anweden könnte
|
|
|
|
|
Hallo,
> Hallo,
>
> ich stehe einfach komplett auf dem schlauch
>
> es müsste dann ja gelten [mm]y^TXb=b^TX^Ty[/mm]
Ja, das tut es auch ...
Die Produkte auf beiden Seiten sind doch reelle Zahlen (oder [mm]1\times 1[/mm]-Matrizen ...)
> aber es gilt ja [mm](y^TXb)^T=b^TX^Ty[/mm]
> es müsste also das transponierte das selbe sein wie das
> nicht transponierte, hier kommen ja beides mal zahlen raus
> und ich denke mit normaler Matrixmultiplikation könnte ich
> das auch beweisen, aber ich sehe einfach nicht den
> "einfachen" rechenschritt der mir fehlt.
Naja, eine Zahl transponiert ist doch wieder die Zahl ...
> und ich wüsste auch nicht wo ich die Rechenregel hier
> sinnvoll 2 mal anweden könnte
Nun, es ist [mm]\red{b^TX^T}y \ = \ \red{(b^TX^T)}y \ = \ \red{(Xb)^T}y \ = \ \left[\underbrace{y^T(Xb)}_{\in\IR}\right]^T \ = \ y^TXb[/mm]
Gruß
schachuzipus
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:57 Mi 17.09.2014 | Autor: | Marcel |
Hallo,
> Hallo,
>
> > Hallo,
> >
> > ich stehe einfach komplett auf dem schlauch
> >
> > es müsste dann ja gelten [mm]y^TXb=b^TX^Ty[/mm]
>
> Ja, das tut es auch ...
>
> Die Produkte auf beiden Seiten sind doch reelle Zahlen
> (oder [mm]1\times 1[/mm]-Matrizen ...)
>
> > aber es gilt ja [mm](y^TXb)^T=b^TX^Ty[/mm]
> > es müsste also das transponierte das selbe sein wie
> das
> > nicht transponierte, hier kommen ja beides mal zahlen
> raus
> > und ich denke mit normaler Matrixmultiplikation könnte
> ich
> > das auch beweisen, aber ich sehe einfach nicht den
> > "einfachen" rechenschritt der mir fehlt.
>
> Naja, eine Zahl transponiert ist doch wieder die Zahl ...
>
>
> > und ich wüsste auch nicht wo ich die Rechenregel hier
> > sinnvoll 2 mal anweden könnte
>
> Nun, es ist [mm]\red{b^TX^T}y \ = \ \red{(b^TX^T)}y \ = \ \red{(Xb)^T}y \ = \ \left[\underbrace{y^T(Xb)}_{\in\IR}\right]^T \ = \ y^TXb[/mm]
damit das alles ganz vollständig ist:
Es sei auch an
[mm] ${(R^T)}^T=R$
[/mm]
erinnert (oben etwa [mm] ${(y^T)}^T=y$).
[/mm]
Gruß,
Marcel
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 12:48 Mi 17.09.2014 | Autor: | Marcel |
Hallo Welt,
> Hallo,
>
> ich habe ein Problem bei dieser Aufgabe
> [mm]b \in \mathbb{R}^p[/mm]
> [mm]y \in \mathbb{R}^n[/mm]
> [mm]x \in \mathbb{R}^{nxp}[/mm]
das [mm] $x\,$ [/mm] ist wohl [mm] $X\,.$
[/mm]
> diese Gleichheit soll gelten: [mm]-y^tXb-b^TX^Ty=-2y^TXb[/mm]
> ich komm einfach nicht auf die Umformungen um diese
> Gleichheit zu zeigen,
Diophant hat Dir die entsprechende Regel genannt. Manchmal sieht man
aber dennoch dann den Wald vor lauter Bäumen nicht (das "hoch t" ist wohl
auch das Gleiche wie das "hoch T", also "transponiert"):
Es ist (beachte [mm] $y^T \in \IR^{1 \times n}$)
[/mm]
$y^TX [mm] \in \IR^{1 \times p}$ [/mm]
und damit (beachte $b [mm] \in \IR^{p \times 1}$)
[/mm]
[mm] $y^T [/mm] X b [mm] \in \IR^{1 \times 1}\,.$
[/mm]
Du schreibst natürlich
[mm] $r\,$ [/mm] anstatt $(r) [mm] \in \IR^{1 \times 1}\,.$
[/mm]
Und in [mm] $\IR^{1\times 1}$ [/mm] (bzw. [mm] $\IR$) [/mm] gilt
[mm] $(r)^T=(r)$ ($=r\,$).
[/mm]
Also:
Wegen
$y^TXb [mm] \in \IR \cong \IR^{1 \times 1}$
[/mm]
folgt mit der Rechenregel von Diophant
[mm] $y^TXb=(y^TXb)^T=b^T(y^TX)^T=...$
[/mm]
und damit...
Gruß,
Marcel
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:10 Mi 17.09.2014 | Autor: | welt |
ja stimmt natürlich, dass das Ergebnis in R lag war mir sogar klar, aber hab vergessen das erste mal einfach schon zu transponieren
dann gilt natürlich $c [mm] \in \mathbb{R} [/mm] c:= y^TXb [mm] \; \:c^T=c$
[/mm]
außerdem [mm] $c^T=(y^TXb)^T=b^TX^Ty$
[/mm]
daraus folgt behauptung
danke für die Hilfe
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 13:52 Mi 17.09.2014 | Autor: | Marcel |
Hello world,
> ja stimmt natürlich, dass das Ergebnis in R lag war mir
> sogar klar, aber hab vergessen das erste mal einfach schon
> zu transponieren
>
> dann gilt natürlich [mm]c \in \mathbb{R} c:= y^TXb \; \:c^T=c[/mm]
eben. Und wie gesagt: Strenggenommen müßte man auch [mm] $\IR \cong \IR^{1 \times 1}$
[/mm]
identifizieren. Aber das ist etwas selbstverständliches. Das ist genauso
selbstverständlich, wie jeder *weiß*, dass man für [mm] $n\,$ [/mm] Vektoren [mm] $v_1,...,v_n$ ($v_k=(v_{1,k},...,v_{m,k})^T$) [/mm] des
[mm] $\IR^m,$ [/mm] wenn man von der Matrix
[mm] $A=(v_1,...,v_n)$
[/mm]
spricht, eben die Matrix
$A [mm] \in \IR^{m \times n}=\pmat{v_{1,1}, & v_{1,2}, & ..., &v_{1,n}\\ ., & ., & ., & .\\ ., & ., & ., & .\\ ., & ., & ., & .\\v_{m,1}, & v_{m,2}, & ..., &v_{m,n} }$
[/mm]
meint, und nicht die geordnete Familie
[mm] $(\vektor{v_{1,1} \\ .\\.\\.\\v_{m,1}},\vektor{v_{1,2} \\ .\\.\\.\\v_{m,2}}, [/mm] ..., [mm] \vektor{v_{1,n} \\ .\\.\\.\\v_{m,n}}) \in (\IR^{m})^n\,,$
[/mm]
wenngleich das eigentlich auch egal wäre, da man [mm] $\IR^{m \times n}$ [/mm] auch
mit [mm] $(\IR^m)^n$ [/mm] identifizieren kann (Du siehst oben quasi, wie das geht).
Eigentlich passt die Notation
[mm] $A=(v_1,...,v_n)$
[/mm]
allerdings zu dem [mm] $(\IR^m)^n$-Objekt. [/mm]
> außerdem [mm]c^T=(y^TXb)^T=b^TX^Ty[/mm]
> daraus folgt behauptung
>
> danke für die Hilfe
Gerne.
Gruß,
Marcel
|
|
|
|