Hallo PonderStibbons,
ich finde die Idee eines Tests von ICC so abwegig nicht. Wenn ich die Sprachentwicklung von Kindern in der einen Studie von Müttern beurteilen lasse und in der anderen Studie von Pädagogen, dann kann man doch die Frage stellen, ob Mütter (als Grundgesamtheit) mit einer höheren Übereinstimmung beurteilen als Pädagogen (als Grundgesamtheit).
Der Anleitung zu einem Zusatzpaket zu R entnehme ich folgendes Zitat:
The results for the Lower and Upper Bounds for ICC(2,k) do not match those of SPSS 9 or 10, but do match the definitions of Shrout and Fleiss. SPSS seems to have been using the formula in McGraw and Wong, but not the errata on p 390. They seem to have fixed it in more recent releases (15).
Starting with psych 1.4.2, the confidence intervals are based upon (1-alpha)% at both tails of the confidence interval. This is in agreement with Shrout and Fleiss. Prior to 1.4.2 the confidence intervals were (1-alpha/2)%
http://personality-project.org/r/html/ICC.htmlDemnach halten schlaue Leute die Idee von 95%-Konfidenzintervallen für ICC für sinnvoll und damit gehen sie wohl davon aus, dass ICC nicht nur einzelne Studien beschreiben, sondern auch Stichproben aus Grundgesamtheiten darstellen.
Liege ich da falsch?
An Hannibal wäre dann die Frage zu richten, ob die anderen Studien den zu vergleichenden ICC nur als Punktschätzung oder mit Unsicherheitsangaben berichten.
LG,
Bernhard