Statistische Modellbildung < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) überfällig | Datum: | 22:35 Di 16.04.2013 | Autor: | oli_k |
Hallo,
ich arbeite zur Zeit an der statischen Modellierung von Verkehrsunfällen. Ich habe verschiedene Modelle gegeben, die aus verschiedenen Eingangsgrößen (Wochentag, Tageszeit Anzahl der Fahrstreifen, Kurvigkeit, ...) die Anzahl der Verkehrsunfälle (je nach Modell pro Fahrzeugkilometer, pro Streckenkilometer o.ä.) vorhersagen.
So weit, so gut. Mein Datensatz ist nun allerdings eine bloße Auflistung aller Verkehrsunfälle in einem bestimmten Zeitabschnitt, und zwar für eine gesamte Region.
Sprich:
Unfallort | Wochentag | Uhrzeit | Fahrstreifen | Kurvigkeit | ...
Dass ich die Daten nun zuerst binomialisieren muss (sprich aus "Wochentag" wird "Montag=1", "Dienstag=0" usw.), ist mir klar. Doch ab hier stehe ich auf dem Schlauch: Irgendwo muss ich die Anzahl hernehmen.
Meine einzige pragmatisch und statistisch womöglich völlig falsche Idee wäre die folgende: Ich aggregiere die Daten nach Autobahnen bzw. gleich langen Streckenabschnitten auf diesen und zähle die jeweiligen Unfälle. Nun muss ich die einzelnen Variablen noch jeweils zusammenfassen und hier wird es vermutlich statistisch falsch: Ich würde die Mittelwerte der Binomialvariablen bilden. Dem Modell macht das nichts, wenn man statt 0 oder 1 ne 0,8 rein gibt und logisch wäre es für mich auch - aber darf man das?
Sicherlich gibt es für solche Fälle doch eine viel sauberere Herangehensweise. Beispielsweise in der Medizin müsste es doch ähnliche Problemstellungen geben.
Ich freue mich über jede Hilfe. Vielen Dank!
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 23:20 Fr 19.04.2013 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|