Griffe Fälle, in denen Datenqualität variiert Eine der gemeinsamen Annahmen, die den meisten Methoden der Prozessmodellierung zugrunde liegen. Einschließlich linearer und nichtlinearer Kleinste-Quadrate-Regression, ist, dass jeder Datenpunkt genauso präzise Informationen über den deterministischen Teil der gesamten Prozessvariation bereitstellt. Mit anderen Worten, die Standardabweichung des Fehlerterms ist über alle Werte des Prädiktors oder der erläuternden Variablen konstant. Diese Annahme bleibt jedoch in jeder Modellierungsanwendung eindeutig nicht aus. Beispielsweise scheint es bei den nachstehend gezeigten Halbleiter-Photomasken-Zeilenabstandsdaten, daß die Genauigkeit der Zeilenabstand-Messungen mit zunehmendem Zeilenabstand abnimmt. In Situationen wie diesem, wenn es nicht vernünftig sein kann anzunehmen, dass jede Beobachtung gleich behandelt werden sollte, können oft gewichtete kleinste Quadrate verwendet werden, um die Effizienz der Parameterschätzung zu maximieren. Dies geschieht, indem versucht wird, jedem Datenpunkt seine richtige Grße des Einflusses auf die Parameterschätzwerte zu geben. Eine Prozedur, die alle Daten gleichermaßen behandelt, würde weniger präzise gemessene Punkte mehr Einfluss ergeben, als sie haben würden und würden hochpräzise Punkte zu wenig beeinflussen. Linespacing-Messfehler-Datenmodelltypen und gewichtete kleinste Quadrate Im Gegensatz zur linearen und nichtlinearen Regression der kleinsten Quadrate ist die gewichtete Kleinste-Quadrate-Regression nicht mit einer bestimmten Art von Funktion assoziiert, die verwendet wird, um die Beziehung zwischen den Prozessvariablen zu beschreiben. Stattdessen spiegeln gewichtete kleinste Quadrate das Verhalten der Zufallsfehler im Modell und können mit Funktionen verwendet werden, die entweder linear oder nichtlinear in den Parametern sind. Sie arbeitet, indem zusätzliche nichtnegative Konstanten oder Gewichte, die mit jedem Datenpunkt verbunden sind, in das Anpassungskriterium einbezogen werden. Die Größe des Gewichts zeigt die Genauigkeit der in der zugehörigen Beobachtung enthaltenen Informationen an. Die Optimierung des gewichteten Anpassungskriteriums, um die Parameterschätzwerte zu finden, ermöglicht es den Gewichten, den Beitrag jeder Beobachtung zu den endgültigen Parameterschätzungen zu bestimmen. Es ist wichtig zu beachten, daß das Gewicht für jede Beobachtung relativ zu den Gewichten der anderen Beobachtungen gegeben ist, so daß verschiedene Mengen von Absolutgewichten identische Wirkungen haben können. Vorteile von gewichteten kleinsten Quadraten Wie alle bisher diskutierten Methoden der kleinsten Quadrate sind gewichtete kleinste Quadrate eine effiziente Methode, die kleine Datensätze gut nutzt. Es teilt auch die Fähigkeit, verschiedene Arten von leicht interpretierbare statistische Intervalle für die Schätzung, Vorhersage, Kalibrierung und Optimierung. Zusätzlich ist, wie oben diskutiert, der Hauptvorteil, daß die gewichteten kleinsten Quadrate gegenüber anderen Verfahren genügen, die Fähigkeit, Regressionssituationen zu behandeln, in denen die Datenpunkte von unterschiedlicher Qualität sind. Wenn die Standardabweichung der Zufallsfehler in den Daten nicht über alle Ebenen der erläuternden Variablen konstant ist, liefert die Verwendung von gewichteten kleinsten Quadraten mit Gewichten, die umgekehrt proportional zu der Varianz bei jedem Niveau der erklärenden Variablen sind, die genauesten Parameterschätzungen. Nachteile von gewichteten kleinsten Quadraten Der größte Nachteil der gewichteten kleinsten Quadrate, die viele Menschen nicht kennen, ist wahrscheinlich die Tatsache, dass die Theorie hinter dieser Methode auf der Annahme basiert, dass die Gewichte genau bekannt sind. Dies ist fast nie der Fall in realen Anwendungen, natürlich, so geschätzt Gewichte müssen stattdessen verwendet werden. Die Wirkung der Verwendung von geschätzten Gewichten ist schwer zu beurteilen, aber die Erfahrung zeigt, dass kleine Variationen in den Gewichten aufgrund der Schätzung nicht oft eine Regressionsanalyse oder ihre Interpretation beeinflussen. Wenn jedoch die Gewichte aus kleinen Zahlen von replizierten Beobachtungen geschätzt werden, können die Ergebnisse einer Analyse sehr schlecht und unvorhersehbar beeinflusst werden. Dies ist besonders wahrscheinlich, wenn die Gewichte für Extremwerte des Prädiktors oder der erläuternden Variablen mit nur wenigen Beobachtungen geschätzt werden. Es ist wichtig, sich dieses potentiellen Problems bewusst zu sein und nur gewichtete kleinste Quadrate zu verwenden, wenn die Gewichte genau zueinander geschätzt werden können. Carroll und Ruppert (1988). Ryan (1997). Die gewichtete Regression der kleinsten Quadrate ist ebenso wie die anderen Methoden der kleinsten Quadrate empfindlich gegenüber den Auswirkungen von Ausreißern. Wenn potenzielle Ausreißer nicht untersucht und angemessen behandelt werden, werden sie voraussichtlich negative Auswirkungen auf die Parameterschätzung und andere Aspekte einer gewichteten Analyse der kleinsten Fehlerquadrate haben. Wenn eine gewichtete Regression der kleinsten Quadrate tatsächlich den Einfluss eines Ausreißers erhöht, können die Ergebnisse der Analyse weit hinter einer nicht gewichteten Analyse der kleinsten Quadrate zurückbleiben. Weitere Informationen zum gewichteten Mindestanpassungskriterium finden Sie in Abschnitt 4.3. Diskussion von Methoden zur Gewichtsabschätzung finden Sie im Abschnitt 4.5.Least Squares Fitting Eine mathematische Prozedur, um die am besten passende Kurve zu einem vorgegebenen Satz von Punkten zu finden, indem die Summe der Quadrate der Offsets (quothhe residualsquot) der Punkte von minimiert wird die Kurve. Die Summe der Quadrate der Offsets wird anstelle der Offset-Absolutwerte verwendet, da damit die Residuen als kontinuierliche differenzierbare Größe behandelt werden können. Da jedoch Quadrate der Offsets verwendet werden, können äußere Punkte einen unverhältnismßigen Effekt auf die Passung haben, eine Eigenschaft, die je nach dem vorliegenden Problem wünschenswert oder nicht wünschenswert ist. In der Praxis werden die vertikalen Offsets aus einer Linie (Polynom, Oberfläche, Hyperplane usw.) anstelle der senkrechten Versätze fast immer minimiert. Dies stellt eine passende Funktion für die unabhängige Variable zur Verfügung, die Schätzungen für eine gegebene (am häufigsten, was ein Experimentator will) ermöglicht, dass Unsicherheiten der Datenpunkte entlang der - und - Achsen einfach aufgenommen werden können und bietet auch eine viel einfachere analytische Form für die Anpassungsparametern, als sie unter Verwendung einer Passung erhalten würden, die auf senkrechten Versätzen basiert. Darüber hinaus kann die Anpassungstechnik leicht von einer Best-Fit-Linie zu einem Best-Fit-Polynom verallgemeinert werden, wenn Summen von vertikalen Abständen verwendet werden. In jedem Fall ist für eine vernünftige Anzahl von verrauschten Datenpunkten die Differenz zwischen vertikalen und senkrechten Sitzen ziemlich klein. Die lineare Methode der kleinsten Fehlerquadrate ist die einfachste und am häufigsten angewandte Form der linearen Regression und liefert eine Lösung für das Problem, die beste passende gerade Linie durch einen Satz von Punkten zu finden. Tatsächlich ist es allgemein üblich, die Daten so zu transformieren, daß die resultierende Zeile eine gerade Linie ist, z. B. durch Plotten vs. anstatt, wenn die funktionelle Beziehung zwischen den beiden zu gruppierenden Mengen innerhalb von additiven oder multiplikativen Konstanten bekannt ist Vs. im Falle der Analyse der Periodendauer eines Pendels als Funktion seiner Länge. Aus diesem Grund sind Standardformen für exponentiell. logarithmisch. Und Machtgesetze werden oft explizit berechnet. Die Formeln für die Anpassung der kleinsten Fehlerquadrate wurden unabhängig voneinander von Gauss und Legendre abgeleitet. Bei nichtlinearen kleinsten Quadraten, die auf eine Anzahl unbekannter Parameter passen, kann die lineare Kleinste-Quadrate-Anpassung iterativ auf eine linearisierte Form der Funktion angewendet werden, bis die Konvergenz erreicht ist. Es ist jedoch oft auch möglich, eine nichtlineare Funktion am Anfang linear zu linearisieren und weiterhin lineare Verfahren zur Bestimmung von Paßparametern ohne Rückgriff auf iterative Prozeduren zu verwenden. Dieser Ansatz verstößt allgemein gegen die implizite Annahme, dass die Verteilung der Fehler normal ist. Aber oft immer noch akzeptable Ergebnisse mit normalen Gleichungen, eine Pseudoinverse. Usw. Abhängig von der gewählten Paßform und den anfänglichen Parametern kann die nichtlineare Passung gute oder schlechte Konvergenzeigenschaften aufweisen. Wenn Unsicherheiten (im allgemeinsten Fall Fehlerelipsen) für die Punkte gegeben werden, können Punkte unterschiedlich gewichtet werden, um den höherwertigen Punkten mehr Gewicht zu verleihen. Die vertikale Anpassung der kleinsten Quadrate erfolgt durch Ermitteln der Summe der Quadrate der vertikalen Abweichungen eines Satzes von Datenpunkten von einer Funktion. Beachten Sie, dass dieses Verfahren nicht die tatsächlichen Abweichungen von der Linie minimiert (die senkrecht zu der gegebenen Funktion gemessen werden). Obwohl die ungeteilte Summe von Abständen eine geeignetere Menge zur Minimierung scheinen mag, führt die Verwendung des Absolutwerts zu diskontinuierlichen Derivaten, die nicht analytisch behandelt werden können. Die Quadratabweichungen von jedem Punkt werden daher summiert und der resultierende Rest wird dann minimiert, um die beste Anpassungslinie zu finden. Dieses Verfahren führt dazu, dass Außenpunkte überproportional groß gewichtet werden. Die Bedingung für ein Minimum ist, dass Chatterjee, S. Hadi, A. und Price, B. quotSimple Lineare Regression. quot Ch. 2 in der Regressionsanalyse durch Beispiel, 3. Aufl. New York: Wiley, S. 21-50, 2000. Edwards, A. L. Die Regressionsgerade auf. quot Ch. 3 in einer Einführung in die lineare Regression und Korrelation. San Francisco, CA: W. H. Freeman, S. 20-32, 1976. Gauss, C. F. Die Theorie Kombinationen obsevationum erroribus minimis obnoxiae. quot Werke, Bd. 4. Goumlttingen, Deutschland: p. 1, 1823. Kenney, J. F. und Keeping, E. S., lineare Regression, Simple Correlation und Contingency. quot Ch. 8 in Mathematik der Statistik, Pt. 2, 2. Aufl. Princeton, NJ: Van Nostrand, pp. 199-237, 1951. Kenney, J. F. und Halten, E. S. quotLineare Regression und Korrelation. quot Ch. 15 in Mathematik der Statistik, Pkt. 1, 3. Aufl. Princeton, NJ: Van Nostrand, S. 252-285, 1962. Laplace, P. S. quotDes meacutethodes analytiques du Calcul des Probabiliteacutes. quot Ch. 4 in Theacuteorie analytique des probabiliteacutes, Livre 2, 3. Aufl. Paris: Courcier, 1820. Lawson, C. und Hanson, R. Lösen least Squares Probleme. Englewood Cliffs, NJ: Prentice-Halle, 1974. Ledvij, M. quotCurve Anpassung gemacht Easy. quot Industrial Physicist 9. 24-27, Apr. May 2003. Press, WH Flannery, BP Teukolsky, SA und Vetterling, WT quotFitting Daten zu einem Straight Linequot quotStraight-Line-Daten mit Fehlern in beiden Koordinaten, quot und quotGeneral Linear Least Squares. quot sect15.2, 15.3 und 15.4 in Numerischen Rezepten in FORTRAN: The Art of Scientific Computing, 2. Aufl. Cambridge, England: Cambridge University Press, pp. 655-675, 1992. York, D. "Least-Square-Anpassung einer geraden Linie. quot Canad. J. Phys. 44. 1079-1086, 1966. Wolfram Web ResourcesFitting Kurven, um Ihre Daten mit Hilfe der wenigen Quadrate Einführung Wenn Sie ein Ingenieur (wie ich früher in einem früheren Leben), haben Sie wahrscheinlich Ihr bisschen experimentieren getan. Normalerweise benötigen Sie dann eine Möglichkeit, Ihre Messergebnisse mit einer Kurve passen. Wenn Sie ein geeigneter Ingenieur, Sie haben auch eine Idee, welche Art von Gleichung sollte theoretisch passen Sie Ihre Daten. Vielleicht haben Sie einige Messungen mit Ergebnissen wie folgt: Anpassen von Daten mit einer Gleichung. Ein wohlbekannter Weg, um Daten an eine Gleichung anzupassen, ist die Verwendung der Methode der kleinsten Fehlerquadrate (LS). Ich will39t wiederholen die Theorie hinter der Methode hier, nur lesen Sie auf die Sache, indem Sie auf diesen Link zu Wikipedia. Anpassung einfacher linearer Gleichungen Excel liefert uns ein paar Werkzeuge, um Least Squares Berechnungen durchzuführen, aber sie sind alle um die einfacheren Funktionen zentriert: einfache lineare Funktionen der Form ya. xb, ya. exp (bx), ya. xb und etcetera . Mit einigen Tricks können Sie auch LS auf Polynomen mit Excel ausführen. Regressionstools im Analysis Toolpak-Add-In Aktivieren Sie das Analysis Toolpak in der Liste der Add-Ins (Datei-Schaltfläche oder Office-Schaltfläche, Excel-Optionen, Registerkarte Add-Ins, klicken Sie auf Go): Die Add-Ins-Liste von Excel mit dem Analysis-Toolpak Aktiviert Diese Schaltfläche fügt die Schaltfläche "Analysisquot" für Ihre Multifunktionsleiste hinzu, auf der Registerkarte "Daten", "Analyse" (dies ist auch der Speicherort, in dem Sie die Schaltfläche "Solver" weiter unten finden können): Multifunktionsleiste mit Datenanalyse Klicken Sie auf diese Schaltfläche, um zu ermitteln, erhältlich. Arbeitsblattfunktionen Es gibt eine Reihe von Arbeitsblattfunktionen, mit denen Sie auch Regressionsanalysen durchführen können. Um schnell darauf zuzugreifen, wählen Sie eine leere Zelle aus und klicken Sie auf shiftF3, um den Funktionsassistenten zu öffnen. Geben Sie im Suchfeld quotRegressionquot (ohne Anführungszeichen natürlich) ein. Excel listet die relevanten Funktionen auf: Funktionsassistent, der Regressionsfunktionen anzeigt Wählen Sie einen aus und klicken Sie auf die Funktion "Hilfe" in diesem Funktionsquot-Link am unteren Rand des Funktionsassistenten, um mehr darüber zu erfahren. Anpassung komplexerer Funktionen Was passiert, wenn Sie eine komplexere Funktion, wie yexp (a. x).sin (x) b passt. Wie dies mit Hilfe von Excel I getan werden kann, hat eine Möglichkeit dazu, die folgenden Schritte auszuführen: Erstellen einer Tabelle mit x - und y-Werten Hinzufügen einer Spalte mit der Modellfunktionsformel, die auf Ihre x-es und auf einige Zellen für die Konstante (n) Haben Sie eine Spalte, die die Summe der Quadrate berechnet Verwenden Sie Solver, um die Konstanten zu finden, die die niedrigste Summe der Quadrate ergeben. Erläuterung der Beispieldatei Ich habe eine Beispieldatei erstellt, die Sie direkt verwenden können. Unten finden Sie einen Link zu der Datei und eine Erklärung, wie die Datei zusammengestellt wird. Diese Datei herunterladen: Funktionsweise der Datei Die Berechnungen und die Daten konzentrieren sich auf Sheet1 der Datei. Der wichtigste Bereich ist die Tabelle, die in Zelle A1 beginnt: Datentabelle in LS-Datei Spalte A hält Ihre x-Werte und Spalte B enthält die y-Werte. Die dritte Spalte enthält die Formel, die das Ergebnis der angepassten Gleichung unter Verwendung der Konstanten und der x-Werte berechnet. Die Beispieldatei hat diese Formel in Spalte C: Die vierte Spalte der Tabelle wird verwendet, um die Summe der Quadrate zu berechnen. Formel: Wie Sie wahrscheinlich schon erwähnt haben, habe ich ein paar Range-Namen. Ich erkläre die unten. Bereichsnamen Um die Arbeit mit der Datei zu erleichtern, habe ich einige Bereichsnamen erstellt. Anstatt die Tabellenverweise zu verwenden, die Excel 2007, 2010 und 2013 anbieten, enthielt ich einige Dynamikbereichsnamen, die auf die Daten verweisen. Dies bedeutet, dass die Arbeitsmappe auch in Excel 2003 und vorher funktioniert. Konstanten der Gleichung Die const Bereichsnamen zeigen auf eine zweite Tabelle in der Datei: In dieser Tabelle geben Sie Ihre ersten initialen Vermutungen für die resultierenden Konstanten ein und wo das Solver-Add-In auch die Ergebnisse zurückgibt. Wie Sie sehen können, wird unterhalb dieser Tabelle die restliche Summe der Quadrate angezeigt. Formel: Es ist diese Zelle G11, dass wir versuchen, mit dem Solver Add-In zu minimieren. Verwenden von Solver Zuerst müssen Sie das Solver-Add-In installieren. Verwenden Sie das Add-Ins-Dialogfeld, das ich am Anfang dieses Artikels gezeigt habe, und aktivieren Sie das Kontrollkästchen neben dem Add-In-Add-In. Dies fügt die Solver-Schaltfläche an der gleichen Stelle auf dem Band wie die quotData Analysisquot-Schaltfläche Ich zeigte vor. Nachdem Sie sichergestellt haben, dass die Modellformel korrekt in Spalte C eingetragen ist und die Berechnungen funktionieren, klicken Sie auf die Schaltfläche Solver. Das folgende Dialogfeld wird angezeigt: Der Dialog Solver Stellen Sie sicher, dass das Feld quotSet Objectivequot auf die Zelle zeigt, die die Summe der Quadrate enthält. Wählen Sie quotMinquot neben quotToquot. Das Feld "Ändern von Zellenvariablen" muss NUR auf die Zellen verweisen, die von Ihrem Modell verwendet werden, da sonst die Freiheitsgradeberechnung (auf dem ANOVA-Blatt) falsch ist. Stellen Sie außerdem sicher, dass alle nicht verwendeten Konstantzellen leer sind, indem Sie sie auswählen und auf die Taste del drücken. Beachten Sie, dass je nach Modelltyp die Lösereinstellungen geändert werden müssen. Ein wenig Experimentieren kann für beste Ergebnisse erforderlich sein. Solver-Einstellungen können mit der entsprechenden Taste gespeichert und geladen werden. Seien Sie also vorsichtig und kritisch, ob Sie tatsächlich eine bestmögliche Lösung erreicht haben oder nicht. Je nach Modellgleichung und Solver-Einstellungen kann der Solver mit nicht optimalen Ergebnissen arbeiten. Wenn Sie mit den aktuellen Solver-Einstellungen zufrieden sind, klicken Sie auf "Lösen". Nach einiger Zeit öffnet sich das Dialogfenster "QuoteSolver Resultsquot", mit dem Sie einige Optionen zum Fortfahren erhalten. Beachten Sie, dass es Ihnen auch ermöglicht, für ein paar Berichte zu fragen. Die Beispieldatei zeigt das Endergebnis: Varianzanalyse Auf der Registerkarte ANOVA finden Sie die Tabelle ANALYSE OF VAriance, die wie folgt aussieht: Die ANOVA-Tabelle Die wichtigste Zelle hier ist die Zelle F2. Wenn der Wert in dieser Zelle kleiner als 0,05 ist, gibt es eine Wahrscheinlichkeit, dass Ihr Modell die Daten korrekt passt. So weniger ist mehr für diese Zelle, Sie wollen, dass es unter 0,05 bleiben. Die Zelle wird für Werte über 0,05 rot. Überprüfen Sie, ob der Wert in Zelle B2 genau kleiner als die Anzahl der Konstanten ist, die Sie für das Modell verwendet haben. Wenn nicht, gehen Sie zurück zu Sheet1 und leeren die Zellen, die nicht von Ihrem Modell verwendet werden. Also, wenn Sie consta und constb verwendet, dann der Wert von B2 (Modell Freiheitsgrade) sollte 1. Fazit Wie Sie gesehen haben, passende komplexe Funktionen auf Ihre Daten ist nicht sehr schwer zu tun. Eine Kombination aus einigen relativ einfachen Formeln und dem Solver Add-In kommt hier zur Rettung. Einige Ratschläge als ein Ingenieur zu einem anderen Seien Sie kritisch bitte. Denken Sie nicht alles, was Excel sagt Sie sorgfältig analysieren die Ergebnisse, die es zurückgibt, da Solver möglicherweise Dinge falsch und nicht geben Ihnen das bestmögliche Ergebnis Anzeigen der letzten 8 Kommentare von 68 insgesamt (Alle Kommentare anzeigen): Kommentar von: GB (4202016 5:51 : 03 AM) Das ist genial. Vielen Dank Kommentar: Boris (12132016 7:10:57 PM) Sir, ich m versuchen, dünne Schicht trocknen Modelle mit nicht lineare Regressionen Methode passen, aber ich bin nicht in der Lage, die Werte der konstanten Parameter zu finden. Ich brauche die Werte der Konstanten. Pliz help Ein Beispiel für die Gleichung MR aexp (-kt) c, wobei MR-FEUCHTIGKEIT RATIO, t - timea, k, c-Konstanten Anmerkung von: Jan Karel Pieterse (12192016 10:18:40 AM) Leider ohne richtige Vermutungen Für die Parameter, ist Excel manchmal nicht in der Lage, die Parameter zu lösen. Kommentar von: Boris (12262016 3:44:42 PM) Vielen Dank Herr für ur Lektion. Aber eine Sache, die ich von Ihnen wissen möchte, ist, dass es eine andere Option, um herauszufinden, die Werte der Konstanten ohne Annahme zunächst (bedeutet, die Bereiche u haben) Boris Huirem Kommentar von: Jan Karel Pieterse (12302016 3:12:26 PM) Im Angst, dass der harte Teil sein kann. Abhängig von der genauen Modell-und Daten ab einem guten Satz von ersten Vermutungen kann sehr wichtig sein. Ich habe keine anderen Vorschläge als Versuch und Irrtum Im Angst. Kommentar von: Steven (142017 6:00:41 PM) Gibt es eigentlich eine Möglichkeit, Std-Fehler für den eingebauten consta und constb zu berechnen. Ive hatte nie die Chance zu versuchen, herauszufinden, die Mathematik hinter der Bestimmung der Genauigkeit (die Zuverlässigkeit) der eingebauten Konstanten, sorry Kommentar # 11 von: Steven (162017 11:32: 59 am) Ich fand tatsächlich ein Makro (SolvStat) online, die dies tun kann Im nicht ein Mathematiker, so konnte ich nicht folgen alle Berechnungen in ihm, aber es scheint zu funktionieren OK (nach Vergleich mit den Ergebnissen von einem anderen Programm). Haben Sie eine Frage, einen Kommentar oder einen Vorschlag? Dann nutzen Sie bitte dieses Formular. Wenn Ihre Frage nicht direkt mit dieser Web-Seite, sondern eher eine allgemeinere quotHow tun, tun ich thisquot Excel Frage, dann rate ich Ihnen, Ihre Frage hier zu stellen: eileenslounge. Jan Karel Pieterse infojkp-ads Copyright 2017, Alle Rechte vorbehalten.
Comments
Post a Comment