Diskriminanzanalyse für Masterarbeit

Fragen zur Planung einer Untersuchung oder eines Projekts.

Diskriminanzanalyse für Masterarbeit

Beitragvon TonSa » Mo 7. Mär 2016, 12:42

Hallo Leute. Ich bin neu hier ;)
Ich schreibe gerade an meiner Masterarbeit, deren Thema die Früherkennung von Unternehmensinsolvenzen ist. Dafür habe ich die Jahresabschlüsse von jeweils knapp 20 solventen und insolventen Unternehmen besorgt.
Weiters habe ich mit einen Kennzahlenkatalog erstellt (gut 30 Kennzahlen), die dabei helfen sollen, die Gruppe der solventen Unternehmen möglichst präzise von der Gruppe der insolventen zu trennen. Dafür möchte ich jede einzelne Kennzahl auf ihre Trennschärfe prüfen, nicht trennscharfe Kennzahlen werden dann eliminiert. Als nächstes möchte ich unter den verbleibenden Kennzahlen die Bestimmtheit prüfen und bei solchen mit hoher Korrelation die trennschärfsten behalten und die anderen eliminieren.
Aus den hieraus verbleibenden Kennzahlen möchte ich gern eine Diskriminanzfunktion bilden, die sozusagen die beste Trennung beider Gruppen darstellt. Diese DIskriminanzfunktion möchte ich abschließend mit Untersuchungen von anderen Autoren vergleichen.

Nochmal kurz:
1. Erstellung der Kennzahlen für beide Gruppen (solvente und insolvente Unternehmen - erledigt)
2. Prüfung der Verteilung.
3. Prüfung der Trennschärfe.
4. Prüfung auf Korrelation.
5. Erstellen einer Diskrimanzfunktion

Da ich im Studium nur 2 Semester Statistik hatte, habe ich zwar ein gutes Verständnis für die Methoden, aber mit fehlt das "Handwerkszeug", d.h. ich weiß nicht, welche Tests am besten zu welcher Fragestellung unter den genannten Voraussetzungen passen. Ich denke, dass das größte Problem die kleine Stichprobe sein wird. Meine Frage ist also: Welche Tests sind am geeignetsten für meine Stichprobe und die Ergebnisse, die ich erhalten möchte?

In der Literatur fanden sich schon einige Ansätze. Bei 2. würde ich den Chi² nehmen. Für 3. wurde in der Literatur der U-Test (Wilcoxon-Mann-Whitney-Test), den ich aber noch nie vorher gehört habe. Sind diese Tests zu empfehlen? Reicht ein Test jeweils oder sollte mit mehreren Tests geprüft werden?

Vielen Dank und liebe Grüße,
Carsten
TonSa
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mo 7. Mär 2016, 12:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Diskriminanzanalyse für Masterarbeit

Beitragvon PonderStibbons » Mo 7. Mär 2016, 12:55

Ich schreibe gerade an meiner Masterarbeit, deren Thema die Früherkennung von Unternehmensinsolvenzen ist. Dafür habe ich die Jahresabschlüsse von jeweils knapp 20 solventen und insolventen Unternehmen besorgt.
Weiters habe ich mit einen Kennzahlenkatalog erstellt (gut 30 Kennzahlen),

30 Variablen, um ganze 40 Fälle zu charakterisieren? Da ist ein nicht generaliserbares
Ergebnis fast garantiert (Eliminierung von Variablen anhand von Daten aus derselben
Stichprobe löst das Problem des overfitting dabei übrigens nicht, es würde es lediglich
verschleiern). Du müsstest die eine Zahl im vorhinein senken und die andere
möglichst steigern.

Diese DIskriminanzfunktion möchte ich abschließend mit Untersuchungen von anderen Autoren vergleichen.

Ist das das einzige Ziel?

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Diskriminanzanalyse für Masterarbeit

Beitragvon TonSa » Mo 7. Mär 2016, 14:03

Hallo.
Die 30 Variablen werden für jedes Unternehmen (nur Unternehmen aus der Maschinenbaubranche) für 4 Jahre erstellt. Natürlich ist die Stichprobe sehr klein und ich erwarte auch kein Modell, das eine 100%-ige Allgemeingültigkeit besitzt. Ich möchte mit der Arbeit zeigen, dass ich in der Lage bin, im Rahmen von wissenschaftlichen Arbeiten Daten zu einem bestimmten Problem zu erheben und auszuwerten und diese dann auch kritisch zu bewerten und mit Ergebnissen vorhandener Literatur zu vergleichen. Da es ja eine Masterarbeit ist, steht eher die Methodik im Vordergrund, weniger das Ergebnis.

Warum löst die Eliminierung von Kennzahlen das Problem denn nicht? Wenn ich aus bsp. 5 Kennzahlen, die sich sehr ähnlich sind (weil sie zB. die Größe "Umsatz" im Zähler haben) nur die trennschärfste auswähle, inwiefern würde es dann noch Overfitting begünstigen? In der Literatur, die ich zu diesem Thema lese, sind von den anfangs sehr zahlreichen Kennzahlen nur noch 3-6 übrig und deshalb gehe ich davon aus, dass auch ich in diesem Bereich landen werde.

DIe Diskriminanzfunktion ist nicht das einzige Ziel, aber die Quintessenz aus allen vorigen Berechnungen und Tests. Mit dieser Funktion kann ich dann prüfen, wieviele Unternehmen meiner Stichprobe in den Jahren richtig klassifiziert wurden oder nicht. Sollte sich die DIskriminanzfunktion als unbrauchbar erweisen, habe ich immer noch die "Hauptindikatoren" für eine Früherkennung von Insolvenzen, also die Früherkennung von Insolvenzen auf univariater Basis.

Viele Grüße
TonSa
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mo 7. Mär 2016, 12:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Diskriminanzanalyse für Masterarbeit

Beitragvon PonderStibbons » Mo 7. Mär 2016, 14:44

Die 30 Variablen werden für jedes Unternehmen (nur Unternehmen aus der Maschinenbaubranche) für 4 Jahre erstellt.

Was heißt das, womöglich 4 Modelle für 4 Jahre?

Natürlich ist die Stichprobe sehr klein und ich erwarte auch kein Modell, das eine 100%-ige Allgemeingültigkeit besitzt.

Auch 99% werden bei weitem nicht erreicht. Die Analyse hat hohe Aussicht,
unbrauchbar zu sein, weil man nicht sagen kann, wo das Ergebnis ein Artefakt ist
und wo es auf empirischen Regelmäßigkeiten beruht.

Ich möchte mit der Arbeit zeigen, dass ich in der Lage bin, im Rahmen von wissenschaftlichen Arbeiten Daten zu einem bestimmten Problem zu erheben und auszuwerten und diese dann auch kritisch zu bewerten und mit Ergebnissen vorhandener Literatur zu vergleichen. Da es ja eine Masterarbeit ist, steht eher die Methodik im Vordergrund, weniger das Ergebnis.

Wenn die Methodik den Daten und der Fragestellung nicht angepasst ist, dann
erreichst Du Dein Ziel nicht. Und eine Diskriminanzanalyse als Verfahren ist
dazu auch noch eine recht anspruchsvolle Materie.

Warum löst die Eliminierung von Kennzahlen das Problem denn nicht?

Weil Du 30 Variablen mit einem (wegen n=40) großen Standardschätzfehler hast, und Deine
Auswahl bei jeder Entscheidung eine hohe Unsicherheit hat. Über 30 Variablen hinweg werden
brauchbare Variablen ausgeschlossen, die in der Stichprobe zufällig verringerte
Vorhersagekraft im Vergleich zu ihrem "wahren" (Populations-)wert haben. Und unbrauchbare
werden eingeschlossen, die in der Stichprobe zufälligerweise von ihrem eigentlich geringen
(Populations-)wert nach oben abweichen. Über 30 Variablen hinweg ist das Ergebnis
an den vorhandenen Datensatz (n=40) zwar gut angepasst, aber die Übertragbarkeit
sehr fraglich.

Wenn ich aus bsp. 5 Kennzahlen, die sich sehr ähnlich sind (weil sie zB. die Größe "Umsatz" im Zähler haben) nur die trennschärfste auswähle, inwiefern würde es dann noch Overfitting begünstigen? In der Literatur, die ich zu diesem Thema lese, sind von den anfangs sehr zahlreichen Kennzahlen nur noch 3-6 übrig und deshalb gehe ich davon aus, dass auch ich in diesem Bereich landen werde.

Ich kenne Deine Literatur nicht - deren Stichprobengrößen, Verfahrensauswahlen,
Prädiktorenzahlen. Vielleicht machen sie auch alle ähnliche Fehler.

Falls es in der Literatur bereits anerkannte Vorhersagemodelle gibt, warum
nimmst Du die dann nicht einfach her, fütterst entsprechend Deine Daten
hinein und überprüfst, ob sie auch bei Deinen Daten valide Vorhersagen
ermöglichen?
Sollte sich die DIskriminanzfunktion als unbrauchbar erweisen, habe ich immer noch die "Hauptindikatoren" für eine Früherkennung von Insolvenzen, also die Früherkennung von Insolvenzen auf univariater Basis.

Oder eine Mischung aus Artefakten und tatsächlich brauchbaren Indikatoren.

Mit freundlichen Grüßen

P.
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: Diskriminanzanalyse für Masterarbeit

Beitragvon TonSa » Mo 7. Mär 2016, 15:54

In der Literatur (Die Aussagefähigkeit von Kriterien zur Bonitätsbeurteilung im Kreditgeschäft der Banken von Weibel) werden die in seiner Untersuchung (n=72) alle von ihm für potentiell geeigneten Kennzahlen für die letzten 5 Jahre erstellt. Nach den erwähnten Eliminationen waren es noch 6 Kennzahlen. Diese hat er, um es zu visualiesieren, in ein Koordinatensystem eingetragen (mit den Werten der Kennzahl auf der Ordinate, die Jahre vor Insolvenz auf der Abszisse). Dabei wurde von den solventen sowie von den insolventen Unternehmen jeweils das 1. und 9. Dezil eingetragen (was dann über die Jahre eine Gerade ergibt). Dadurch ergibt sich jeweils ein Intervall für die solventen und ein Intervall für die insolventen Unternehmen. Je kleiner der Überschneidungsbereich der beiden Intervalle ist, desto trennschärfer sei eine Kennzahl.

Die Entscheidung darüber, ob ein Unternehmen nun "gesund" oder "insolventgefährdet" sei, hänge davon ab, in wievielen der sechs Kennzahlen das Unternehmen sich im guten bzw. schlechten Intervall befindet.
Eigentlich wollte ich das gleiche mit meinem Datenmaterial machen, bin dann aber auf weitere Literatur (Situm, Baethge/Huß/Niehaus) auf die Diskriminanzanalyse gestoßen.

Wenn diese natürlich auf Grund der kleinen Stichprobe und der Tatsache, dass die Werte der Kennzahlen mit ziemlicher Sicherheit nicht normalverteilt sind, dann sehe ich natürlich davon ab. Ich möchte mit Hilfe meines Datenmaterials so gut wie möglich ein Entscheidungskriterium schaffen, ob ein Unternehmen in die eine oder in die andere Gruppe sortiert werden muss.

Gibt es dafür denn geeignetere Methoden? Ich werde die bestehenden D-Funktionen trotzdem mit meinem Zahlenmaterial füttern und das auswerten, aber das allein ist für eine MA zu dünn.

Vielen Dank und viele Grüße
TonSa
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mo 7. Mär 2016, 12:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post

Re: Diskriminanzanalyse für Masterarbeit

Beitragvon TonSa » Mo 6. Jun 2016, 11:56

Hallo liebe Statistik Community.
Nach einigen Gesprächen, ausgeprägterer Literaturrecherche und einigen In-mich-gehens möchte ich mein Vorgehen im oben geschilderten Fall verändern.
Die Prüfung auf Normalverteilung habe ich bereits mit dem Shapiro-Wilk Test durchgeführt, wobei nur bei wenigen die Normalverteilung angenommen werden kann (was sich nach Aussagen in der Literatur aber als nicht so negativ für die resultierenden Ergebnisse auswirkt).
Im nächsten Schritt steht also die Diskriminanzanalyse. Anfangs wollte ich aus allen Kennzahlen eine Diskriminanzfunktion erstellen, habe diesen Gedanken aber mittlerweile begraben.
In der von mir verwendeten Literatur finden sich zwei Untersuchungen, die schon "trennscharfe" Kennzahlen für die Früherkennung von Insolvenzen definiert haben, davon ein Autor auf univariater Basis (mit 6 verbleibenden Kennzahlen) und ein Autor auf multivariater Basis (mittels MDA, die 3 Kennzahlen beinhaltet). Jetzt möchte ich für beide separat je eine Diskriminanzfunktion erstellen um zu schauen, ob die Ergebnisse dieser Autoren immer noch zutreffend sind (bzw. ob diese Kennzahlen immernoch zur Insolvenzfrüherkennung taugen).
Danach möchte ich die verbleibenden Kennzahlen aus meinem Kennzahlenkatalog univariat untersuchen, um darzustellen, welche Kennzahlen sich vielleicht in einer größeren Stichprobe einmal nützlich erweisen könnten.
Bei der MDA habe ich noch eine Frage: Da ich ja 5 Jahre betrachte, muss ich dann für jedes Jahr eine Diskriminanzfunktion erstellen oder erstelle ich nur eine Diskriminanzfunktion und prüfe dann anhand dieser, wie viele Unternehmen anhand dieser Funktion auch in den anderen Jahren richtig klassifiziert werden?

Viele Grüße,
Carsten
TonSa
Grünschnabel
Grünschnabel
 
Beiträge: 7
Registriert: Mo 7. Mär 2016, 12:17
Danke gegeben: 0
Danke bekommen: 0 mal in 0 Post


Zurück zu Versuchsplanung

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 10 Gäste

cron