Beitrag von Einflussgrößen zur Gesamtstreuung

Fragen, die sich auf kein spezielles Verfahren beziehen.

Beitrag von Einflussgrößen zur Gesamtstreuung

Beitragvon FloLa » Di 27. Dez 2016, 23:49

Hallo zusammen,

im Rahmen meiner Abschlussarbeit benötige „statistischen Rat“.
Im Folgenden werde ich daher kurz auf die Aufgabenstellung und mein bisheriges Vorgehen eingehen.

I. Aufgabenstellung:
Es geht um einen Prüfprozess, bei dem zwei Fügepartner verklebt und anschließend in einem Winkelschälversuch getrennt werden. Die Trenngeschwindigkeit und die Kraft werden bei dem Versuch aufgezeichnet. Es geht dabei um die fertigungsbegleitende Prüfung des Klebstoffes. Erhält man bei diesem Versuch schlechte Werte, geht man davon aus, dass die Klebung am Serienteil auch nicht optimal ist und leitet weitere Maßnahmen ein.
Im momentanen Zustand weisen die Trennkräfte, welche im Endeffekt die Klebungen charakterisieren sollen, eine relativ hohe Streuung auf. Eine meiner Aufgaben ist es herauszufinden, wodurch diese Streuung verursacht wird.

II. Bisheriges Vorgehen:
Zu Beginn habe ich die Literatur gewälzt und potentielle Einflussfaktoren auf die Trennkraft ausfindig gemacht. Anschließend habe ich einzelne der Faktoren nacheinander untersucht. Dabei bin ich wie folgt vorgegangen:

1. Aufbereitung der bestehenden Datensätze.
Einige der potentiellen Einflüsse habe ich (mit Hilfe dokumentierter Informationen) mit der jeweiligen Trennkraft eines Prüfvorgangs in Verbindung bringen können. Nun stehen mir zu jedem Prüfergebnis (=Trennkraft) Informationen (=Einflussfaktoren) wie Arbeitsschicht, Raumtemperatur, Klebercharge des Lieferanten, etc. zur Verfügung.

2. Vergleich der Faktorstufen eines Einflussfaktors.
Anschließend habe ich nacheinander für die einzelnen Faktoren überprüft, ob zwischen den einzelnen Faktorstufen eines Faktors ein statistisch signifikanter Unterschied auf die Zielgröße (=Trennkraft) bemerkbar ist. (z.B. t-Test ob sich die Mittelwerte der Trennkraft bei den beiden verwendeten Chargen unterscheidet)

III. Knackpunkt:
Nun soll ich den Beitrag der einzelnen Einflussfaktoren auf die Gesamtstreuung der Messwerte für die Trennkraft grob/näherungsweise quantifizieren. Anschließend soll ich ermitteln welche Einflussfaktoren gesteuert werden sollten, um die gesamte Streuung auf ein gewisses Maß zu reduzieren.
Und genau hier liegt mein Knackpunkt (ich hoffe zumindest, dass ich diesen nicht schon vorher irgendwo habe :? ).

Ich bin nun zur Vereinfachung von einem additiven Verhalten und paarweiser Unabhängigkeit der einzelnen Einflussfaktoren ausgegangen (was natürlich real nicht zutreffend ist). Folglich bin ich davon ausgegangen, dass sich die Streuung der Trennkraft (=Gesamtstreuung) wie folgt zusammensetzt:

Sgesamt = Wurzel( (S1)^2 + … (Sn)^2 )

Dabei ist S1 z.B. die Streuung der Trennkraft in Abhängigkeit der Temperatur.
Anschließend wollte ich die Gesamtstreuung (Sgesamt) und Streuungen aufgrund einzelner Einflussgrößen (S1...Sn) ermitteln. Diesen einzelnen Wert S1 wollte gemäß oben genannter Formel rauszurechnen, um anschließend grob die Reststreuung aufgrund der verbleibenden Einflussgrößen (S2…Sn) quantifizieren zu können.

Die Gesamtstreuung (Sgesamt) habe ich mit Hilfe der Standardabweichung der Trennkraft über alle Datensätze ermittelt.
Bei den Beiträgen der einzelnen Einflussgrößen zur Streuung (Sn) sieht das schon wieder schwieriger aus. Beispielsweise bei der Lieferantencharge habe ich genau zwei Chargen, deren Trennkraftmittelwerte sich im t-Test signifikant unterschieden. Als Schätzer für die Streuung habe ich hier die Standardabweichung aus diesen 2 Werten (jeweils Mittelwert einer Charge) berechnet. Natürlich ein sehr schlechter Schätzer…

Meinem Prof gefiel das Ganze nicht so gut. Sowohl das oben genannte Modell mit der paarweisen Unabhängigkeit, als auch die Ermittlung von den einzelnen Schätzern für die Standardabweichung. Er konnte mir jedoch aus dem Stegreif auch keine andere Vorgehensweise nennen, mit der ich den Streuungsbeitrag einzelner Einflussgrößen anhand der bestehenden Datensätze quantifizieren könnte. Er wollte mir im neuen Jahr Rückmeldung dazu geben.
Gerne würde ich ihm dabei zuvor kommen und ihm ein anderes Modell vorschlagen, welches ihn zufriedenstellen könnte. Meine eigene Recherche blieb jedoch erfolglos.

Daher hoffe ich auf die Unterstützung eurer Community.
Hat jemand einen Vorschlag für mich, mit welchem statistischen Verfahren ich die genannte Problemstellung lösen könnte?

Bei dem Verfassen des Textes habe ich mir Mühe gegeben, die Problemstellung verständlich zu verfassen. Auch habe ich die Forenregeln und ältere Beiträge durchgelesen und daher darauf verzichtet, meine Problemstellung in einem anderen Beispiel zu verpacken.
Bitte seid bezüglich begrifflicher Unschärfen hinsichtlich statistischer Fachbegriffe nachsichtig mit mir. Meine gesamte statistische Vorbildung beruht auf einem Semester Pflichtvorlesung.

Ich freue mich über jeden Hinweis und schärfe bei Unklarheit meine Fragestellung gerne noch einmal etwas nach.

Vielen Dank im Voraus!
FloLa
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 27. Dez 2016, 23:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Beitrag von Einflussgrößen zur Gesamtstreuung

Beitragvon strukturmarionette » Mi 28. Dez 2016, 05:42

Hi,

Die Trenngeschwindigkeit und die Kraft werden bei dem Versuch aufgezeichnet.

- Wie groß ist Deine Stichprobe?
- Welche der zwei oben genannten abhängigen Variablen (Kriterien) ist für Deine Fragestellung von Interesse?
- Kann bei Deiner Abhängigen Varialen von einem Intervallskalenniveau der Variablen ausgegangen werden?

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

Re: Beitrag von Einflussgrößen zur Gesamtstreuung

Beitragvon FloLa » Mi 28. Dez 2016, 09:39

Hallo Strukturmarionette,

danke, dass du dich meinem Problem annimmst!

strukturmarionette hat geschrieben:Hi,

Die Trenngeschwindigkeit und die Kraft werden bei dem Versuch aufgezeichnet.

- Wie groß ist Deine Stichprobe?
- Welche der zwei oben genannten abhängigen Variablen (Kriterien) ist für Deine Fragestellung von Interesse?
- Kann bei Deiner Abhängigen Varialen von einem Intervallskalenniveau der Variablen ausgegangen werden?

Gruß
S.


- zur Stichprobengröße: ich habe ca 1000 Messwerte für die Trennkraft (Zielgröße, abhängige Variable). Allerdings ist nicht zu jedem Trennkraftmesswert jede Einflussgröße (unabhängige Variable) dokumentiert. Somit habe ich unterschiedliche Stichprobengrößen zu den jeweiligen Einflussgrößen (minimal ca. 50, maximal ca. 1000). Ich habe also ein nicht balanciertes Design (falls ich das richtig recherchiert habe).

- Für meine Fragestellung ist ausschließlich die Trennkraft von Interesse. Ich habe somit eine Zielgröße und mehrere (sowohl diskrete, als auch stetige) Einflussgrößen.

- den Begriff Intervallskalenniveau höre ich gerade das erste mal. Nach Recherche würde ich eher sagen nein, da es einen natürlichen Nullpunkt gibt (weniger als 0 Newton Trennkraft kann nicht gemessen werden)

Viele Grüße
FloLa
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 27. Dez 2016, 23:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Beitrag von Einflussgrößen zur Gesamtstreuung

Beitragvon strukturmarionette » Mi 28. Dez 2016, 10:29

Hi,

- Dann würde sich eine Multiple Lineare Regression mit N =50 anbieten.
- Deine UVs wäre ich im Einzelen noch zu inspizieren hinsichtlich ihrer Skalenniveaus und was damit statistisch impliziert ist.

Gruß
S.
strukturmarionette
Schlaflos in Seattle
Schlaflos in Seattle
 
Beiträge: 4353
Registriert: Fr 17. Jun 2011, 22:15
Danke gegeben: 32
Danke bekommen: 586 mal in 583 Posts

folgende User möchten sich bei strukturmarionette bedanken:
FloLa

Re: Beitrag von Einflussgrößen zur Gesamtstreuung

Beitragvon FloLa » Do 29. Dez 2016, 10:14

Hallo,

vielen Dank für den Hinweis. Ich bin gerade dabei mich in die Regressionsanalyse einzulesen und bin schon zu Beginn auf ein potentielles Problem gestoßen.

J. Frost: A Tribute to Regression Analysis, Zugriff am 29.12.2016 unter http://blog.minitab.com/blog/adventures ... n-analysis hat geschrieben:"You Must Control Everything! (Or at least the important variables) ... Take note, this study also illustrates how not including an important variable (leaving it uncontrolled) can completely mess up your results."


Beim Lesen dieses Absatzes kam mir ein wichtiges Detail, welches ich in meiner Fragestellung vermutlich hätte nennen müssen (ich bitte um Entschuldigung):
Die Zielgröße (Trennkraft) ist durch die dokumentierten Einflussgrößen aus den bestehenden Datensätzen keinesfalls vollständig beschrieben. Hier existieren noch viele weitere Einflussgrößen, welche in der Vergangenheit nicht erfasst wurden.
Ich hatte also folgendes Vorgehen geplant:
1. Auswertung der bestehenden Datensätze auf Beitrag der einzelnen Einflussgrößen zur Gesamtstreuung der Zielgröße
2. In der Vergangenheit nicht erfasste Einflussgrößen mit Hilfe von Versuchsdurchführungen auf deren Beitrag zur Gesamtstreuung der Zielgröße untersuchen

Ist die multiple lineare Regression in diesem Fall trotzdem noch das Verfahren, welches am geeignetsten ist?
FloLa
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 27. Dez 2016, 23:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post

Re: Beitrag von Einflussgrößen zur Gesamtstreuung

Beitragvon FloLa » Fr 6. Jan 2017, 12:58

Hallo zusammen,

nachdem ich mich in den letzten Tagen intensiv mit dem Thema befasst habe, melde ich mich zurück und hoffe ihr könnt die übrigen Fragezeichen in meinem Kopf beantworten.

Grundsätzlich habe ich herausgefunden, dass sich sowohl die (schrittweise) Multiple Lineare Regression, als auch die Einfaktorielle Multivariate Varianzanalyse zur Beantwortung meiner Fragestellung (Quantifizierung von Streuungsbeiträgen) eignet.
Bei der Simulation mit Minitab bekomme ich jedoch schon bei der Analyse eines Teils der Einflussfaktoren (zur Vereinfachung) unterschiedliche Ergebnisse, je nach Analysewerkzeug. Daher möchte ich im Folgenden kurz meine Situation darstellen und hoffe ihr könnt mir sagen wo der Wurm drin ist und auf welches Analysetool ich letztendlich setzen soll.

unabhängige Variablen:
ich habe eine abhängige Variable (Trennkraft). Dabei handelt es sich um eine quantitative Merkmalsart die verhältnisskaliert und stetig ist. Stichprobenumfang ist 1176, wobei immer 4 Werte für die Trennkraft in einem Prüfvorgang erhoben werden. Diese 4 Werte sind dann hinsichtlich der meisten der folgenden Einflussfaktoren nicht unabhängig. Somit gehe ich von einem Stichprobenumfang von 294 aus.

abhängige Variablen:
- 7 qualitative Faktoren die nominalskaliert sind (Stichprobenumfänge: 1x 1176, 5x 294 und 1x 73). 2-5 Merkmalsausprägungen.
- 2 qualitative Faktoren die ordinalskaliert sind (Stichprobenumfänge: 1x 188 und 1x 47). 4 bzw. 3 Merkmalsausprägungen.
- 3 quantitative Faktoren die verhältnisskaliert und stetig sind (Stichprobenumfänge: 3x 294)
- 2 quantitative Faktoren die intervallskaliert und stetig sind (Stichprobenumfänge: 2x 294)

Jetzt habe ich bei meiner Recherche herausgefunden, dass man grundsätzlich die Multiple Lineare Regression bei quantitativen Faktoren und die Varianzanalyse bei qualitativen Faktoren einsetzt.
Bei der Multiplen Linearen Regression habe ich jedoch gelesen, dass man sie auch qualitative Faktoren verwenden kann. Bei 2 Merkmalsausprägungen ohne Probleme und bei mehreren Merkmalsausprägungen mit Hilfe einer Dummykodierung.
Bei der Varianzanalyse habe ich mir ähnlich beholfen. Ich habe die qualitativen Faktoren in Klassen eingeteilt und somit auf eine reduzierte Anzahl von Merkmalsausprägungen reduziert. Ist dies bei der Varianzanalyse zulässig?

Zuletzt erhoffe ich mir auch noch auf meine oben gestellte Frage eine Antwort. Die aufgezählten Einflussfaktoren beschreiben die abhängige Variable nur zu einem geringen Anteil. Es existieren noch viele weitere Einflussfaktoren, welche ich in weiteren Experimenten prüfen muss. Trotzdem möchte ich aber diese große Anzahl an bestehenden Datensätzen nutzen, um schon etwas über die Streuungsanteile herauszufinden. Dürfen in diesem Fall trotzdem die Ergebnisse der Multiple Linearen Regression bzw. der Varianzanalyse interpretiert werden?

Ich würde mich sehr über eine Antwort und der (hoffentlichen) Verschaffung von etwas mehr Klarheit freuen.

Viele Grüße
Flo
FloLa
Grünschnabel
Grünschnabel
 
Beiträge: 6
Registriert: Di 27. Dez 2016, 23:18
Danke gegeben: 1
Danke bekommen: 0 mal in 0 Post


Zurück zu Allgemeine Fragen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 19 Gäste

cron