Einen schönen guten Abend
Ich habe ein kleines Problem in Bezug auf eine Statistische Auswertung für ein Veröffentlichung.
Kurz zur Prämisse meiner Untersuchung:
Ich untersuche das Vorkommen einer bestimmten Krankheit bei einer Tierart.
Hierfür nehme ich aus Institut 1 bestimmte Hunderassen, welche im Zeitraum 2019-2021 diese Ausprägung zeigten (n = 179 | mein "Fälle") und vergleiche sie mit dem Vorkommen von denselben Hunderassen in einem anderen Institut (n = 689 | meine "Kontrollgruppe").
Untersucht werden: Rassen, Geschlecht, Kopfform
All diese drei Untersuchungspunkte werden in Kategorien eingeteilt (1 = Beagle, 2 = Labrador, etc., | 1 = männlich 2 = weiblich | 1 = Form a 2 = Form b, etc.) dementsprechend habe ich ja nur nominale Daten.
Fragestellung ist nun: Haben die Untersuchungspunkte eine Signifikanz in Bezug auf die Krankheit (also auch diesbezüglich auch nominal 1 = ausgeprägt, 2 = nicht ausgeprägt).
Als Auswertungstool hätte ich einen Chi-Quadrat/Fisher's exact test gemacht und bei einem P-Value von > 0,05 einen Post-Hoc-Test nachgezogen.
Wie man oben schon lesen kann, ist die Kontrollgruppe aber wesentlich größer als meine Fallgruppe. Ziemlich genau 3,849x größer.
Nun frage ich mich, wie ich damit umgehen soll um eine wissenschaftlich korrekte, statistische Aussagekraft zur Signifikanz zu bekommen.
1) Die Größe so lassen? -> Hier habe ich die Sorge, dass durch die starke Kontrollgruppe eine "falsche Signifikanz" entsteht.
2) Den Zeitraum der Kontrollgruppe minimieren. Sprich anstatt ebenso 3 Jahre eventuell nur 1 Jahr an Daten zu verwenden.
3) Die Daten aus der Kontrollgruppe durch den Faktor 3,849 zu teilen um im Endeffekt eine kleinere Kontrollgruppe mit einer ähnlichen Verteilung zu bekommen.
Nummer 1 macht mir Sorge, Nummer 2 und 3 fühlt sich etwas nach Zahlenschieberei an und das möchte ich vermeiden.
Von daher meine Frage: Wie gehe ich mein Problem wissenschaftlich korrekt an? Oder gibt es eine andere Möglichkeit diese verschiedengroßen Kontrollgruppen zu vergleichen?
Ich bedanke mich im Vorhinein für euren Input