zugegeben ich bin nicht so gut in Statistik. Aber ich muss mit meiner Bachelor Arbeit ein paar Tests machen. Ich untersuche Crowdfunding initiativen und ihre Wirkungsweise. Hierfür habe ich ein Sample von ca. 250 Crowdfunding Kampagnen. Ich möchte folgende Hypothesen untersuchen:
- Ich untersuche, ob bspw. erfolgreiche Crowdfunding Anzeigen vermehrt social media Kanäle verwenden. Erfolgreich = Finanziert. Nicht erfolgreich = Nicht finanziert. Die verschiedenen Social Media Kanäle sind: Youtube, FB, Twitter, Blog. Die Daten sind folgendermaßen codiert:
1) Youtube: (0=Nein, 1=Ja)
2) Twitter: (0=Nein, 1=Ja)
3) FB: (0=Nein, 1=Ja)
4) Blog: (0=Nein, 1=Ja)
Erfolgreich: (0=Nicht finanziert, 1=Finanziert)
Kann ich 1)-4) in einer neuen Variablen zusammenaddieren, die dann von 0-4 geht und entsprechend sagen 0= Geringe Social Media Aktivität 4= Hohe Social Media Aktivität. Klar, geht hier die Information verloren, welcher Kanal wichtig ist aber das wäre auch nicht Teil der Hypothese. Wäre das dann im Anschluss ein unabhängiger T-Test?
Als nächstes möchte ich den Anteil bestimmter Wörter untersuchen. Bsp.: Habe ich errechnet, wie viel Fachwörter in den Anzeigen verwendet werden. Meine Hyptothese hier ist, dass erfolgreich finanzierte Kampagnen deutlich weniger Fachwörter verwenden als nicht erfolgreiche. Dies Daten sind folgendermaßen codiert:
- 1) Fachwörter (Prozentualer Wert von 0-100). 0= Keine Fachwörter. Der prozentualer Wert bezieht sich auf die Gesamtwörter der Anzeige. Meistens ist der Anteil jedoch sehr gering. So dass sich die Werte im 0-10% Bereich befinden.
Erfolgreich: (0=Nicht finanziert, 1=Finanziert)
Wie kann ich das hier testen? Ich bin mir unsicher, ob das dann eine metrische Variable ist, um dann im Anschluss einen unabhängigen T-Test durchlaufen zu lassen.
Wäre dankbar für jeden Tipp.
Eure Julia