Hallo zusammen,
ich hoffe ihr könnt mir helfen, es ist (hoffe ich) eine ganz einfache Frage. Leider bin ich in Sachen Statistik aber auch nicht besonderes bewandert.
Folgende Ausgangssituation:
Ich habe verschiedene Größenvariablen für rund 1.300 Unternehmen, bspw. die Marktkapitalisierung in USD.
Zum anderen habe ich die Zahl bestimmter Worthäufungen auf den Internetpräsenzen dieser Unternehmen (Werte zwischen 0 und 25).
Nun würde ich gerne den Zusammenhang zwischen diesen Variablen quantifizieren. Eine Vorerwartung habe ich nicht, es könnte sowohl kein Zusammenhang bestehen, als auch ein positiver oder negativer.
Wenn ich in Excel einfach nur die Korrelation berechne (=KORR), erhalte ich einen Wert von -0,0007[...]. Allerdings habe ich auch sehr große Ausreißer bei den Größvenvariablen, die jedoch nicht entfernt werden sollen.
Nun habe ich mich am Spearman-Korrelationskoeffizienten versucht(!). Dazu habe ich zunächst jedem Wert einen Rang zugeordnet (=RANG.MITTELW). Bei den Größenvariablen des Unternehmens hat so fast jeder Wert einen eigenen Rang, während es bei den Worthäufungen natürlich zahlreiche Ränge gibt die mehrfach vergeben wurden.
Von diesen Rängen habe ich dann wieder die Korrelation (=KORR) berechnet und einen Wert von 0,31[...] erhalten, also einen leicht positiven Zusammenhang.
Andererseits habe ich es über eine Logarithmierung des Wertes der Unternehmensgröße versucht (die Worthäufungen habe ich unverändert gelassen). Mit diesen Werten erhalte ich mit =KORR eine Korrelation von 0,201[...]. Wieder leicht positiv, aber schwächer als mit meinem Spearman Verfahren.
Meine Hauptfrage ist: Darf ich das überhaupt so machen?
Ich möchte das ungern als Teil meiner Arbeit abgeben und dann hören müssen, dass ich da kompletten Unsinn verzapft habe. Soweit ich das recherchiert habe benötige ich für diese Varianten keine normalverteilten Daten.
Meine zweite Frage wäre: Wenn beides zulässig ist, kann man pauschal sagen, welches Verfahren angebrachter wäre?
Ich würde ja tendenziell zu der Logarithmierung tendieren, weil ich Spearman nicht über eine direkte Formel, sondern über ein ggf. unsinniges Verfahren ermöglicht habe.
Vielen Dank für jegliche Hilfe und ein schönes Wochenende!
Shak