„Signifikanz“ von Abweichungen bei Governance-Indikatoren

Fragen, die sich auf kein spezielles Verfahren beziehen.

„Signifikanz“ von Abweichungen bei Governance-Indikatoren

Beitragvon Avornion » Di 1. Jun 2021, 13:48

Hallo,

da ich noch völlig gespannt bin in welche Richtung meine Problemlösung laufen könnte, poste ich mal hier im allgemeinen Bereich.


Allgemeine Problemdarstellung: Ich habe einen Datensatz mit Störfällen bedingt durch Umwelt oder soziale Ursachen zwischen 2013 und 2018 im Bergbausektor erstellt, um damit die Aussagekraft verschiedener Governance-Indikatoren hinsichtlich ihres Einsatzes in der Rohstoffkritikalitätsbewertung* zu untersuchen. Rohstoffkritikalität ganz platt erklärt bewertet die Wahrscheinlichkeit eines Versorgungsausfalls (Supply Risk) eines Rohstoffes und die, meist nur ökonomische, Bedeutung des Rohstoffes (Vulnerability) also den potentiellen Schaden für das betrachtete Land oder die Firma. Beides kombiniert ergibt dann Kritikalität des Rohstoffes. Sozial- und Umweltrisiken werden bisher nur selten betrachtet, deswegen die angestrebte Untersuchung der Indikatoren im Hinblick ihrer Aussagekraft auf diese Fragestellung.

Für die weitere Datenanalyse habe ich die Störfälle nach Land, Jahr, Ursache etc. kategorisiert und auch Kriterien für die Einteilung des Schweregrads in die drei Kategorien Minor, Moderate und Major vorgenommen. Die Schwereeinteilung ist dabei eher semi-quantitativ aus meinen Fingern gesogen, weil die Datenlage diesbezüglich doch viele Lücken hat. ich nehme an, dass die genauen Kriterien für die Einteilung für die Fragestellung nicht relevant sind. Falls doch einfach Bescheid sagen, dann kann ich die gerne nachliefern.

Anschließend habe ich jedem Störfall noch dem für das jeweilige Land und Jahr gültigen Indikatorwert zugeordnet und jeweils für die Gesamtzahl der Störfälle sowie für die als Minor, Moderate und Major bewerteten einzelne Boxplots erstellt. Diese habe ich dann den globalen Durchschnitt des jeweiligen Indikators sowie auch den nach dem Anteil der Wertschöpfung der einzelnen Länder gewichteten Durchschnitt gegenübergestellt.

Beispielhaft habe ich das in der angefügten Abbildung für die aggregierten sechs World Governance Indikatoren (WGI) und alle Störfälle unabhängig von der Ursache dargestellt. Das Kreuz im Boxplot ist der Mittelwert der Strich der Median. Für die globalen Durchschnitte ist der Median in der Darstellung natürlich witzlos, weil da nur ein Wert drinsteckt… aber ich hab den nicht wegbekommen.

Beispiel: https://c.gmx.net/@324509307536146536/7O2c08hOTIWtdDBGOXCqmQ/ROOT/ROOT

Die Gesamtstichprobe ist ca. 250. Wenn man spezifischere Kombinationen von Ursache und Schweregrad betrachtet, was ich äußerst gerne tun möchte, fällt diese aber zum Teil bis auf 15. Die WGI aus dem Beispiel sind von -2,5 bis 2,5 skalliert, die anderen Indikatoren haben zwar andere Skalen sind aber alle nummerisch.

Wie man sehen kann kommen die Störfälle im Durchschnitt mit besseren Werten raus, der Median also die Masse der Störfälle liegt aber unterm Durchschnitt. Das der Durchschnitt besser ausfällt mag intuitiv nicht schlüssig sein, wenn man die globalen Strukturen des Rohstoffsektors und meine Quellen kennt, ist es aber nicht mehr ganz so überraschend. Vergleiche dazu auch den gewichteten globalen Durchschnitt. Weiterhin gibt es noch einen Abfall der Werte von Minor nach Major. Das wiederum ist intuitiv ja recht schlüssig.


Spezifische Fragestellung: Mein statisches Problem fängt hier an, dass die rein deskriptive Beschreibung der Verteilungen in den einzelnen Schweregrad-Kategorien, in Bezug auf den globalen Durchschnitt der Indikatoren zwar schön und gut ist, aber keine wirklich belegbaren Rückschlüsse ermöglicht, ob die Indikatoren geeignet sind (oder wenigstens zu sein scheinen) das Eintrittsrisiko eines solchen Störfalls zu beschreiben.

Deswegen würde ich gerne die „Signifikanz“ der Abweichungen meiner Daten vom globalen Mittel überprüfen, allerdings weiß ich nicht wie oder ob das statistisch überhaupt möglich ist bei meinen Daten… Kollegen haben mir gesagt ich müsste eine Rangkorrelationsanalyse machen, dass das Quatsch ist in meinen Fall glaube ich inzwischen schon selbst herausgefunden zu haben. Ich als Statistik-Laie hätte mein Glück mit einem Konfindenz- oder 2-Sigma-Intervall der globalen Indikatorwert versucht und geschaut, ob die Abweichungen in dem Intervall liegen, also (nach meinem Verständnis…)sich quasi im Rahmen der „Ungenauigkeit“ des Indikators bewegen. Leider konnte ich trotz intensiver Lektüre keine hinreichende Gewissheit erlangen, ob das ein statistisch legales Vorgehen wäre oder nicht…

Ein weiterer Punkt ist, dass Mittelwert und Median meiner Daten sich oft diametral zueinander verhalten, ich für den Median aber gar keine Idee habe ob und noch weniger wie ich diesen im Vergleich zum globalen Mittelwert analysieren darf. Für den ungewichteten Durchschnitt könnte ich auch einen Median ermitteln und diese vergleichen, den Median der Indikatoren zu betrachten erscheint mir aber ein wenig blödsinnig, da das in der Praxis niemand macht. Für den gewichteten globalen Wert könnte ich auch gar keinen Median erstellen.


So ich hoffe meine Ausführungen haben annähernd die genau richtige Länge bekommen. Wenn doch noch Informationen fehlen einfach melden.

Vielen Dank schon mal, dass ihr euch Zeit für mein Problem genommen und bis hierher gelesen habt! :)

Viele Grüße,

Konstantin

*ACHTUNG: Für richtige Statistiker könnte die Gefahr bestehen Puls zu bekommen, wenn sie sich im Detail anschauen was in dem Bereich so alles gemacht wird. Das konnte ich auch als Laie bereits eruieren…
Avornion
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 1. Jun 2021, 13:12
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: „Signifikanz“ von Abweichungen bei Governance-Indikatore

Beitragvon PonderStibbons » Di 1. Jun 2021, 17:51

Falls es nur darum geht zu prüfen, ob überhaupt ein Zusammenhang zwischen Schweregrad und Indikator besteht,
dann kommt Spearman in Frage, alternativ einfaktorielle Varianzanalyse (Mittelwertvergleich zwischen den drei
Schweregraden) bzw. der Median-Test (Vergleich der Mediane zwischen den drei Gruppen).

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

folgende User möchten sich bei PonderStibbons bedanken:
Avornion

Re: „Signifikanz“ von Abweichungen bei Governance-Indikatore

Beitragvon Avornion » Fr 4. Jun 2021, 17:50

Danke für die schnelle Antwort! :)

PonderStibbons hat geschrieben:Falls es nur darum geht zu prüfen, ob überhaupt ein Zusammenhang zwischen Schweregrad und Indikator besteht, [...]


Auch deswegen sind deine Vorschläge schon mal sehr nützlich, aber nicht nur. Ich würde aber auch gerne prüfen (oder wenigstens indizieren...), ob ein Zusammenhang zwischen dem generellen Auftreten eines Störfalls und dem Indikator besteht. Da ich aber nur weiß wann was passiert ist und nicht wann nichts passiert ist wird das vermutlich nicht gehen? Oder gibt es da Ansätze die vlt. erfolgversprechend sein könnten?


Zum Spearman, die Methode hatte ich so verstanden, dass man jedem Datensatz einen individuellen Rang zuordnen können muss, ich habe aber nur die drei Ränge Minor, Moderate und Major. Die Einteilung soweit zu verfeinern, dass ich bis zu 250 Ränge komme würde gibt meine Datenlagen bei weitem nicht her. Also kann ich die Methode ja nicht anwenden, oder habe ich da irgendwas falsch verstanden?

Einfaktorielle Varianzanalyse und Median-Test habe ich mir angeschaut, bilde mir ein zu verstehen was sie machen und das erscheint mir hilfreich zu sein. Ich denke zu verstehen wie man es genau macht wird mir auch noch gelingen, ansonsten würde ich nochmal nachfragen kommen.

Viele Grüße,
Konstantin
Avornion
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 1. Jun 2021, 13:12
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: „Signifikanz“ von Abweichungen bei Governance-Indikatore

Beitragvon PonderStibbons » Fr 4. Jun 2021, 18:34

Ich würde aber auch gerne prüfen (oder wenigstens indizieren...), ob ein Zusammenhang zwischen dem generellen Auftreten eines Störfalls und dem Indikator besteht. Da ich aber nur weiß wann was passiert ist und nicht wann nichts passiert ist wird das vermutlich nicht gehen? Oder gibt es da Ansätze die vlt. erfolgversprechend sein könnten?

Wenn der Beobachtungszeitraum für alle n betrachteten Länder gleich ist, kannst Du
die Zahl der Störfälle eines Landes mit dessen Indexwert korrelieren.
Bei ungleichen Beobachtungszeiträumen Zahl Störfälle pro Jahr (oder pro Monat, oder was
immer sinnvoll erscheint).

Zum Spearman, die Methode hatte ich so verstanden, dass man jedem Datensatz einen individuellen Rang zuordnen können muss, ich habe aber nur die drei Ränge Minor, Moderate und Major. Die Einteilung soweit zu verfeinern, dass ich bis zu 250 Ränge komme würde gibt meine Datenlagen bei weitem nicht her.

Dann haben eben immer viele Elemente denselben Rang, das ist kein Problem.

Mit freundlichen Grüßen

PonderStibbons
PonderStibbons
Foren-Unterstützer
Foren-Unterstützer
 
Beiträge: 11368
Registriert: Sa 4. Jun 2011, 15:04
Wohnort: Ruhrgebiet
Danke gegeben: 51
Danke bekommen: 2504 mal in 2488 Posts

Re: „Signifikanz“ von Abweichungen bei Governance-Indikatore

Beitragvon Avornion » Mo 7. Jun 2021, 16:01

PonderStibbons hat geschrieben:Wenn der Beobachtungszeitraum für alle n betrachteten Länder gleich ist, kannst Du
die Zahl der Störfälle eines Landes mit dessen Indexwert korrelieren.
Bei ungleichen Beobachtungszeiträumen Zahl Störfälle pro Jahr (oder pro Monat, oder was
immer sinnvoll erscheint).


Bei der bloßen Anzahl sehe ich ein potentielles Problem, bei dem ich nicht weiß wie problematisch es tatsächlich ist und das ich vlt. schon hätte eingangs erwähnen sollen... Nämlich, dass die einzelnen Länder unabhängig vom Indikator nicht die gleichen Vorraussetzung in der "Intensität" des Bergbaus haben. Quasi: Mehr Bergbau macht potentiell auch mehr Mist. Ich hatte das schon mal Beispielhaft für Kupfer als Rohstoff in eigentlichen Abbauphase dargestellt:

https://c.gmx.net/@324509307536146536/76LU-FuQQguxBw9Y7TBebw/ROOT/ROOT

Der erste Punkt gibt den absoluten Anteil der Störfälle an (zur Einordnung Chile 23; Zambia 2; Insgesamt 42). Der zweite Punkt gibt dann an wie viele Störfälle relativ zur Anzahl der im Betrieb befindlichen Kupferbergwerk im Land gab. Die Anzahl an Bergwerken ist dabei nicht ganz genau, da in der Datenbank die mir zur Verfügung steht nur die aktuellsten Information zum Betrieb enthalten sind und nicht wie es im Betrachtungszeitraum war. Aber die Annahme, dass es von der Größenordnung hinkommt kann ruhigen Gewissens hinnehmen. Der letzte Punkt stellt dar wie viele Störfälle es pro einer Millarde US$ Wert des produzierten Kupfers gegeben hat. Chile hat absolut zwar die meisten Störfälle, schneidet relativ zur "Masse" des Bergbaus im Land betrachtet aber deutlich besser ab.

Die Anzahl der aktiven Bergwerke global für alle Rohstoffe zu bestimmen wird nicht venünftig gehen fürchte ich, und würde dann ja auch nur für die Phase des Abbaus selbst taugen. Die Wertschöpfung als Proxy für die Intensität des Bergbaus 8und Verhüttung / Raffination als Folgeschritte) in einem Land könnte ich aber mit betrachten. Habe ich ja für den gewichteten globalen Indikatorwert schon gemacht. Da könnte man höchstens dikutieren, ob dann auch Störfälle in der Exploration oder Konstruktionsphase mit betrachtet werden dürfen. Da findet ja noch keine Wertschöpfung statt... aber einen besseren allgemeinen Proxy krieg ich nicht hin fürchte ich.

PonderStibbons hat geschrieben:Dann haben eben immer viele Elemente denselben Rang, das ist kein Problem.


Ok. In dem Fall habe ich Spearman einfach nicht richtig verstanden... :roll:

Viele Grüße,
Konstantin
Avornion
Grünschnabel
Grünschnabel
 
Beiträge: 3
Registriert: Di 1. Jun 2021, 13:12
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 7 Gäste