Brauche dringend Hilfe - Auswahl geeignetes Testverfahren

Fragen, die sich auf kein spezielles Verfahren beziehen.

Brauche dringend Hilfe - Auswahl geeignetes Testverfahren

Beitragvon rocmalibu » Di 6. Nov 2012, 18:28

Hallo,

ich habe eine, für Statistik-Cracks sicher sehr einfache Frage.

Folgende Situation:

Ich habe zum einen Werte, die als Proxy(Näherungs)variable für Kennzahlen verschiedener Unternehmen aus einer Datenbank (diese enthält Bilanzdaten) gezogen werden. Z.b. Marketingausgaben - diese sind in der Datenbank aus den Bilanzdaten nicht verfügbar, weshalb ein anderer Bilanzposten als Näherungsvariable verwendet wird. Dem ggü. habe ich die "richtigen" Werte bzw. Werte die sich aus einer Einzelermittlung aus den Jahresabschlüssen der Unternehmen ergeben - z.B. sind dort die Marketingausgaben häufig dezidierter dargestellt.

Gibt es nun ein statistisches Verfahren, welches ich nutzen könnte um zu ermitteln, wie gut die Näherungsvariablen aus der Datenbank die tatsächlichen Marketingausgaben abbildet?

Vorschläge für geeignete Verfahren würden mir reichen. Ich lese mich in die Materie ein. Ich suche schon eine Weile, trete aber auf der Stelle.

Vielen Dank für Eure Hilfe.
rocmalibu
Mitglied
Mitglied
 
Beiträge: 26
Registriert: Di 6. Nov 2012, 18:18
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon PonderStibbons » Mi 7. Nov 2012, 12:03

Was schwebt Dir denn so vor? An sich brauchst Du doch nur
die Differenzen zwischen Schätzung und Realwert zu
berechenen, diese Differenzen lassen sich dann beschreiben
(Miittelwert, Standardabweichung, ggfls. Median und
Spannweite). Ergänzend vielleicht noch die Korrelation
zwischen Schätzung und Real.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11372
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
rocmalibu

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon rocmalibu » Do 8. Nov 2012, 09:28

Könnte ich nicht ggf. einen paarweisen t-Test durchführen, in dem ich die Hypothese teste, dass die Werte aus der Datenbank kein guter Näherungswert für die tatsächlichen Werte ist.

Sollte doch hinhauen, oder? Ich nehme ca. 100 Firmen und stelle die Werte ggü...

Vielen Dank
rocmalibu
Mitglied
Mitglied
 
Beiträge: 26
Registriert: Di 6. Nov 2012, 18:18
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon PonderStibbons » Do 8. Nov 2012, 11:58

Ein t-Test kann nicht testen, "dass die Werte aus der Datenbank kein guter Näherungswert
für die tatsächlichen Werte ist". Die getestete Nullhypothese lautet, dass die durchschnittliche
Differenz zwischen den Schätzungen und den Realwerten = 0,000000000... beträgt. Wie groß oder
relevant diese durchschnittliche Abweichung von 0.00000000... ist, darüber sagt der Test nichts.
Und mit der Streuung der Differenzen (also, wie groß sind typischerweise die Abweichungen, egal
ob sie sich am Ende zu durchschnittlich 0 gegenseitig ausgleichen oder nicht) befasst der Test sich
schon überhaupt nicht.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11372
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
rocmalibu

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon rocmalibu » Do 8. Nov 2012, 13:50

Gibt es in der Statistik ggf einen Test, der dies Leisten könnte? Also einer, der die "Qualität" der Näherungswerte ggü. der tatsächlichen Werte bewertet?

Vielen Dank für Ihre Hilfe.
rocmalibu
Mitglied
Mitglied
 
Beiträge: 26
Registriert: Di 6. Nov 2012, 18:18
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon bele » Do 8. Nov 2012, 14:10

Hallo,

ich glaube, Du brauchst keinen Test sondern beschreibende Statistik. Eine Aussage wie "Die aus den Proxyvariablen geschätzten Werte weichen in 95% der Fälle nicht mehr als 11,3% von den korrekten Werten ab." oder "Die aus den Proxyvariablen geschätzten Werte lagen im Durchschnitt 5,3% über den korrekten Werte." oder "Die durchschnittliche quadratische Abweichung der aus Proxys geschätzten Werte von den echten Werten war....".

Waren das genug Anregungen?

LG,
Bernhard

Nachzuschlagen wären "Durchschnitt", "Konfidenzintervall", "Vorhersagefehler", "Residuum", im fortgeschrittenen Fall: "Prüfung auf Normalverteilung" und "Bootstrapping".
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5944
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1405 mal in 1391 Posts

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon rocmalibu » Do 8. Nov 2012, 18:07

Vielen vielen Dank für die Hilfe - Ich weiss es sehr zu schätzen.

Ich werde auch die deskriptive Statistik einsetzen. Interessant wäre allerdings für mich auch allgemeingültigere Aussagen auf Basis von n=100 Unternehmen zu treffen, wie z.B. "Die Proxyvariable welche der Datenbank entnommen werden kann, stellt eine gute Näherung an den tatsächlichen Wert dar. In zukünfitgen Studien kann daher auf die Datenbank zurückgegriffen werden". Desweiteren möchte ich Einflussfaktoren auf die Beziehung der exakten Werte und der Proxyvariable beleuchten.

Vielen Dank. Ich wünsche einen schönen Abend.

VG
rocmalibu
Mitglied
Mitglied
 
Beiträge: 26
Registriert: Di 6. Nov 2012, 18:18
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon bele » Fr 9. Nov 2012, 13:48

Nun, Du müsstest zunächst einmal definieren, was für Dich oder in Deinem Tätigkeitsfeld eine "gute Näherung" ist. Also wo Du in der deskriptiven Statistik die Grenze von gut und schlecht ziehen würdest. Um das etwas zu verallgemeinern könntest Du das sog. "Bootstrapping" verwenden. Du kannst anhang von Bootstrapping-Samples Deiner Unternehmen Schlussfolgerungen ziehen, in wieviel Prozent der Boostrapping-Samples deine Grenzwerte eingehalten werden oder auch nicht eingehalten werden und kannst so Konfidenzintervall der "Güte" erstellen.
Die Frage, was Du in Deinem Feld als "gute Näherung" empfindest, kann Dir kein statistischer Test abnehmen. In der Astronomie sind ein paar hundert Millionen Kilometer schon mal ein vernachlässbarer Fehler, in der Landschaftsgärtnerei eher nicht.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5944
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1405 mal in 1391 Posts

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon rocmalibu » So 18. Nov 2012, 18:34

Hallo,

ich muss meine ursprüngliche Frage noch einmal aufgreifen. Ich habe mich nun weiter eingelesen. Analog zu dem Vorgehen in einem Artikel im Journal of Marketing könnte ich einmal die Korrelation zwischen den werten die sich aus den SG&A kosten ergeben und den tatsächlichen Werten ermitteln. Da ich keine Normalverteilung annehme, würde ich die Rangkorrelation ermitteln.

Darüber hinaus habe ich daran gedacht, ein nicht-parametrischen Test durchzuführen. In meinem Fall abhängiger Stichproben wäre das der Wilcoxon-Vorzeichenrangtest.
Dies würde mir Auskunft darüber geben, ob beide Verfahren ein signifikant gleiches Ergebnis liefern.

Es ergeben sich folgende Fragen für mich:

1.) Grundsätzliche Frage - für Statistiker wird es komisch klingen -, welchen mehrwert schafft ein solcher hypothesentest für mich? größere allgemeingültigkeit bei ausreichend großer stichprobe?

2.) Gibt es ggf. auch einen Test, bei dem ich einen Toleranzbereich der Abweichung berücksichtige? Der Wilcoxon-Vorzeichenrangtest liefert ja lediglich eine Aussage darüber, ob die Verteilungen der beiden Grundgesamtheiten annähernd GLEICH sind.

Würde eine Normalverteilung vorliegen, könnte ich einen hypothesentest über die differenzen der Erwartungswerte durchführen, oder? gibt es sowas auch für meßreihen, die nicht der normalverteilung ähneln?

vielen dank für die hilfe. ich wünsche euch einen schönen sonntag abend. ich verzweifel nochmal eine kurze runde.
christoph
rocmalibu
Mitglied
Mitglied
 
Beiträge: 26
Registriert: Di 6. Nov 2012, 18:18
Danke gegeben: 4
Danke bekommen: 0 mal in 0 Post

Re: Brauche dringend Hilfe - Auswahl geeignetes Testverfahre

Beitragvon bele » So 18. Nov 2012, 20:38

Hallo rocmalibu,

das mit der Korrelationsrechnung ist nicht ganz schlecht, aber wenn die Abschätzung immer um 1 Million zu niedrige Werte liefert oder immer nur die Hälfte des richtigen Wertes ergibt ist die Korrelation trotzdem hoch.

rocmalibu hat geschrieben:Darüber hinaus habe ich daran gedacht, ein nicht-parametrischen Test durchzuführen. In meinem Fall abhängiger Stichproben wäre das der Wilcoxon-Vorzeichenrangtest.
Dies würde mir Auskunft darüber geben, ob beide Verfahren ein signifikant gleiches Ergebnis liefern.


Ein signifikant gleiches Ergebnis gibt es nicht. Du kannst höchstens zeigen, dass Ergebnisse signifikant unterschiedlich sind. Oder es gelingt Dir eben nicht, irgendetwas zu zeigen. Wenn die Abschätzung in der Hälfte der Fälle grandios zu niedrige Schätzwerte liefert und in der anderen Hälfte der Fälle grandios zu hohe Schätzwerte liefert, dann ergibt der Vorzeichenrangtest ein genauso unsignifikantes Ergebnis wie wenn die Schätzwerte immer genau zutreffen.

Du kannst das alles machen, aber an echten Abweichungsmaßen wie der durchschnittlichen quadrierten Abweichung kommst Du nicht vorbei.

1.) Grundsätzliche Frage - für Statistiker wird es komisch klingen -, welchen mehrwert schafft ein solcher hypothesentest für mich? größere allgemeingültigkeit bei ausreichend großer stichprobe?

Hypothesentests sagen im signifikanten Fall aus, dass man die Nullhypothese nicht nur in der Stichprobe sondern auch in der Grundgesamtheit ablehnen kann.

2.) Gibt es ggf. auch einen Test, bei dem ich einen Toleranzbereich der Abweichung berücksichtige? Der Wilcoxon-Vorzeichenrangtest liefert ja lediglich eine Aussage darüber, ob die Verteilungen der beiden Grundgesamtheiten annähernd GLEICH sind.

Nein, der Vorzeichenrangtest sagt etwas darüber aus, ob die Differenzen der Werte häufiger positiv oder negativ sind. Gleichheit von Verteilungen testet er nicht.

LG,
Bernhard
----
`Oh, you can't help that,' said the Cat: `we're all mad here. I'm mad. You're mad.'
`How do you know I'm mad?' said Alice.
`You must be,' said the Cat, `or you wouldn't have come here.'
(Lewis Carol, Alice in Wonderland)
bele
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 5944
Registriert: Do 2. Jun 2011, 23:16
Danke gegeben: 16
Danke bekommen: 1405 mal in 1391 Posts


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 5 Gäste

cron