auch wenn ich Zahlenjonglieren und Mathe eigentlich sehr mag, bin ich im Bereich Statistik noch recht wenig bewandert. Deshalb habe ich eine etwas größeren Frage zu folgendem Projekt.
Ich schreibe zurzeit meine Abschlussarbeit, bei der es um NOx Messungen geht.
Ich habe 5 „Low Cost“ Sensorsysteme, die zum gleichen Zeitpunkt NOx Werte messen. Jedes Sensorsystem hat 4 einzelne Sensormodule. Die 4 Messwerte werden jeweils durch eine Software des Herstellers in einen Wert pro Sensorsystem zusammengefasst. Dieser ähnelt dem Mittelwert ist aber nicht immer identisch. Der zugrundeliegende Algorithmus ist unbekannt. Bisher habe ich der einfachheitshalber die 5 berechneten Werte verwendet und nicht die 20 „Rohwerte“. Während ich das schreibe, stell ich aber fest das die 20 Rohwerte vielleicht besser wären.
Eine Woche lang habe ich die Sensoren nebeneinander aufgestellt und die Messwerte aufgenommen. Das heißt ich habe jetzt ca. 6000 Messreihen mit jeweils 5 bzw. 20 Messwerten. Über die Zeit hat sich die Umgebungskonzentration natürlich geändert, da die Sensoren aber zusammenstanden, sollten die Sensoren in jeder Messreihe der gleichen Konzentration ausgesetzt sen.
Ziel ist es mit diesen Daten die Messgenauigkeit der Sensoren untereinander beurteilen zu können.
Dies ist aus meiner Sicht relevant, da für das Projekt die Sensoren in unterschiedlichen Umgebungen aufgestellt werden sollen, und anschließend miteinander verglichen werden sollen.
Was ich bisher gemacht habe:
- Pearson Koeffizient aller Sensor Kombinationen bestimmt: Ist bei allen über 0,98
- Mittelwert, Standardabweichung und Range jeder Messreihe bestimmt.
- Geniale Hauke Idee: Für jeden Messwert die Different zum Mittelwert gebildet. Anschließend gezählt, wie häufig jede einzelne „Abweichung“ vorkommt und dies grafisch dargestellt. Daraus zeigt sich, dass diese Abweichungen normalverteilt sind und z.B. mit 95% Wahrscheinlichkeit ein einzelner Messwert nicht mehr als 1,3 vom Mittelwert abweicht. Die Grafik ist zwar ganz nett, aber ich bin nicht so ganz zufrieden und vermute auch, dass es deutlich bessere und aussagekräftigere statistische Werkzeuge gibt.
Schön wäre es zum Beispiel einen einzelnen Wert zu haben, der Auskunft darüber gibt wie gut die Messergebnisse der Sensoren zueinander passen. Könnte ich hierfür die Standardabweichungen der einzelnen Messreihe einfach mitteln? Das fühlt sich irgendwie verboten an.

Nächste Woche werde ich außerdem alle 5 Sensoren neben ein geeichtes Messgerät stellen, um zu gucken wie genau die „Low Cost“ Sensoren tatsächlich sind. Dazu hätte ich nun den Mittelwert der Low Cost Sensoren mit den Werten des Referenzmessgerätes verglichen. Würdet ihr das auch so machen? Oder gibt’s da eine bessere Möglichkeit?
Vielen Dank fürs durchlesen dieses Aufsatzes… Ich habe probiert Alles so anschaulich wie möglich zu beschreiben. Wenn nötig beantworte ich aber noch gerne weitere Fragen zu dem Projekt.
Vielen Dank für eure Hilfe!!
Gruß Hauke
ps: Ich hoffe das ist in der Richtigen Kategorie, Bei "Versuchsplanung" fand ich gehörts eher nicht hin, weil die Daten ja bereits vorliegen.