Mit der Methode der kleinsten Quadrate wird die Summe ermittelt. Methode der kleinsten Quadrate in Excel – mit der Trendfunktion. Es gibt zwei Klassen nichtlinearer Regressionen

Die Essenz der Methode der kleinsten Quadrate ist beim Finden der Parameter eines Trendmodells, das die Entwicklungstendenz eines zufälligen Phänomens in Zeit oder Raum am besten beschreibt (ein Trend ist eine Linie, die die Tendenz dieser Entwicklung charakterisiert). Die Aufgabe der Methode der kleinsten Quadrate (LSM) besteht darin, nicht nur ein Trendmodell zu finden, sondern das beste oder optimale Modell zu finden. Dieses Modell ist optimal, wenn die Summe der quadratischen Abweichungen zwischen den beobachteten Istwerten und den entsprechenden berechneten Trendwerten minimal (am kleinsten) ist:

wobei die quadratische Abweichung zwischen dem beobachteten Istwert ist

und der entsprechende berechnete Trendwert,

Der tatsächliche (beobachtete) Wert des untersuchten Phänomens,

Der berechnete Wert des Trendmodells,

Anzahl der Beobachtungen des untersuchten Phänomens.

MNC wird recht selten allein verwendet. In der Regel wird es in Korrelationsstudien meist nur als notwendige technische Technik eingesetzt. Es ist zu beachten, dass die Informationsbasis von OLS nur eine zuverlässige statistische Reihe sein kann und die Anzahl der Beobachtungen nicht weniger als 4 betragen sollte, da sonst die Glättungsverfahren von OLS möglicherweise den gesunden Menschenverstand verlieren.

Das MNC-Toolkit lässt sich auf die folgenden Verfahren reduzieren:

Erstes Verfahren. Es stellt sich heraus, ob überhaupt eine Tendenz besteht, das resultierende Attribut zu ändern, wenn sich das ausgewählte Faktor-Argument ändert, oder mit anderen Worten: Gibt es einen Zusammenhang zwischen „ bei " Und " X ».

Zweites Verfahren. Es wird ermittelt, welche Linie (Trajektorie) diesen Trend am besten beschreiben bzw. charakterisieren kann.

Drittes Verfahren.

Beispiel. Nehmen wir an, wir haben Informationen über den durchschnittlichen Sonnenblumenertrag für den untersuchten Betrieb (Tabelle 9.1).

Tabelle 9.1

Beobachtungsnummer

Produktivität, c/ha

Da der Stand der Technik in der Sonnenblumenproduktion in unserem Land in den letzten 10 Jahren praktisch unverändert geblieben ist, bedeutet dies, dass die Ertragsschwankungen im analysierten Zeitraum offenbar stark von Schwankungen der Wetter- und Klimabedingungen abhingen. Ist das wirklich wahr?

Erstes OLS-Verfahren. Die Hypothese über die Existenz eines Trends bei den Änderungen des Sonnenblumenertrags in Abhängigkeit von Änderungen der Wetter- und Klimabedingungen in den analysierten 10 Jahren wird getestet.

In diesem Beispiel für „ j „Es empfiehlt sich, den Sonnenblumenertrag zu nehmen, und für“ X » – Nummer des beobachteten Jahres im analysierten Zeitraum. Prüfung der Hypothese über die Existenz einer Beziehung zwischen „ X " Und " j „kann auf zwei Arten erfolgen: manuell und mithilfe von Computerprogrammen. Wenn Sie über Computertechnologie verfügen, kann dieses Problem natürlich von selbst gelöst werden. Um die MNC-Tools besser zu verstehen, ist es jedoch ratsam, die Hypothese über die Existenz eines Zusammenhangs zwischen „ X " Und " j » manuell, wenn nur ein Stift und ein gewöhnlicher Taschenrechner zur Hand sind. In solchen Fällen lässt sich die Hypothese über das Vorhandensein eines Trends am besten visuell anhand der Position des grafischen Bildes der analysierten Dynamikreihe – des Korrelationsfelds – überprüfen:

Das Korrelationsfeld liegt in unserem Beispiel um eine langsam ansteigende Linie. Dies allein weist darauf hin, dass es einen bestimmten Trend bei den Veränderungen der Sonnenblumenerträge gibt. Es ist unmöglich, nur dann über das Vorhandensein einer Tendenz zu sprechen, wenn das Korrelationsfeld wie ein Kreis, ein Kreis, eine streng vertikale oder streng horizontale Wolke aussieht oder aus chaotisch verstreuten Punkten besteht. In allen anderen Fällen ist die Hypothese über die Existenz einer Beziehung zwischen „ X " Und " j ", und weiter forschen.

Zweites OLS-Verfahren. Es wird ermittelt, welche Linie (Trajektorie) den Trend der Veränderungen des Sonnenblumenertrags im analysierten Zeitraum am besten beschreiben oder charakterisieren kann.

Wenn Sie über Computertechnologie verfügen, erfolgt die Auswahl des optimalen Trends automatisch. Bei der „manuellen“ Verarbeitung erfolgt die Auswahl der optimalen Funktion in der Regel visuell – anhand der Lage des Korrelationsfeldes. Das heißt, basierend auf der Art des Diagramms wird die Gleichung der Linie ausgewählt, die am besten zum empirischen Trend (der tatsächlichen Flugbahn) passt.

Bekanntlich gibt es in der Natur eine Vielzahl funktionaler Abhängigkeiten, sodass es äußerst schwierig ist, auch nur einen kleinen Teil davon visuell zu analysieren. Glücklicherweise können in der realen Wirtschaftspraxis die meisten Zusammenhänge ziemlich genau beschrieben werden, entweder durch eine Parabel, eine Hyperbel oder eine gerade Linie. Dabei kann man sich mit der „manuellen“ Möglichkeit der Auswahl der besten Funktion auf nur diese drei Modelle beschränken.

Hyperbel:

Parabel zweiter Ordnung: :

Es ist leicht zu erkennen, dass sich in unserem Beispiel der Trend der Änderung des Sonnenblumenertrags über die analysierten 10 Jahre am besten durch eine gerade Linie charakterisieren lässt, sodass die Regressionsgleichung die Gleichung einer geraden Linie sein wird.

Drittes Verfahren. Die Parameter der diese Linie charakterisierenden Regressionsgleichung werden berechnet, d. h. es wird eine analytische Formel ermittelt, die das beste Trendmodell beschreibt.

Das Finden der Werte der Parameter der Regressionsgleichung, in unserem Fall der Parameter und , ist der Kern des OLS. Bei diesem Prozess geht es darum, ein System normaler Gleichungen zu lösen.

(9.2)

Dieses Gleichungssystem lässt sich recht einfach mit der Gauß-Methode lösen. Erinnern wir uns daran, dass als Ergebnis der Lösung in unserem Beispiel die Werte der Parameter und gefunden werden. Somit hat die gefundene Regressionsgleichung die folgende Form:

100 RUR Bonus für die erste Bestellung

Wählen Sie die Art der Arbeit aus. Diplomarbeit. Kursarbeit. Zusammenfassung. Masterarbeit. Praxisbericht. Artikel. Bericht. Rezension. Testarbeit. Monographie. Problemlösung. Geschäftsplan. Antworten auf Fragen. Kreative Arbeit. Aufsatz. Zeichnen. Essays. Übersetzung. Präsentationen. Tippen. Sonstiges. Erhöhung der Einzigartigkeit des Textes. Masterarbeit. Laborarbeit. Online-Hilfe

Finden Sie den Preis heraus

Die Methode der kleinsten Quadrate ist eine mathematische (mathematisch-statistische) Technik, die dazu dient, Zeitreihen auszurichten, die Form der Korrelation zwischen Zufallsvariablen zu identifizieren usw. Sie besteht darin, dass die Funktion, die ein bestimmtes Phänomen beschreibt, durch eine einfachere Funktion angenähert wird. Letzteres wird außerdem so gewählt, dass die Standardabweichung (siehe Streuung) der tatsächlichen Niveaus der Funktion an den beobachteten Punkten von den ausgerichteten Punkten am kleinsten ist.

Den verfügbaren Daten zufolge ( xi,yi) (ich = 1, 2, ..., N) wird eine solche Kurve konstruiert j = A + bx, bei dem die minimale Summe der quadratischen Abweichungen erreicht wird

d.h. eine von zwei Parametern abhängige Funktion wird minimiert: A- Segment auf der Ordinatenachse und B- Gerade Steigung.

Gleichungen, die die notwendigen Bedingungen zur Minimierung der Funktion angeben S(A,B), werden genannt normale Gleichungen. Als Näherungsfunktionen werden nicht nur lineare (Ausrichtung entlang einer geraden Linie), sondern auch quadratische, parabolische, exponentielle usw. verwendet. Ein Beispiel für die Ausrichtung einer Zeitreihe entlang einer geraden Linie finden Sie in Abb. M.2, wobei die Summe der quadrierten Abstände ( j 1 – ȳ 1)2 + (j 2 – ȳ 2)2 .... ist die kleinste, und die resultierende gerade Linie spiegelt am besten den Trend einer dynamischen Reihe von Beobachtungen eines bestimmten Indikators über die Zeit wider.

Für unverzerrte OLS-Schätzungen ist es notwendig und ausreichend, die wichtigste Bedingung der Regressionsanalyse zu erfüllen: Die mathematische Erwartung eines zufälligen Fehlers, bedingt durch die Faktoren, muss gleich Null sein. Diese Bedingung ist insbesondere dann erfüllt, wenn: 1. die mathematische Erwartung von Zufallsfehlern Null ist und 2. Faktoren und Zufallsfehler unabhängige Zufallsvariablen sind. Die erste Bedingung kann für Modelle mit einer Konstante als immer erfüllt angesehen werden, da die Konstante eine mathematische Fehlererwartung ungleich Null annimmt. Die zweite Bedingung – die Bedingung der Exogenität der Faktoren – ist grundlegend. Wenn diese Eigenschaft nicht erfüllt ist, können wir davon ausgehen, dass fast alle Schätzungen äußerst unbefriedigend sind: Sie sind nicht einmal konsistent (d. h. selbst eine sehr große Datenmenge ermöglicht es uns in diesem Fall nicht, qualitativ hochwertige Schätzungen zu erhalten ).

Die gebräuchlichste Methode zur statistischen Schätzung von Parametern von Regressionsgleichungen ist die Methode der kleinsten Quadrate. Diese Methode basiert auf einer Reihe von Annahmen hinsichtlich der Art der Daten und der Ergebnisse des Modells. Die wichtigsten sind eine klare Unterteilung der ursprünglichen Variablen in abhängige und unabhängige, die Nichtkorrelation der in den Gleichungen enthaltenen Faktoren, die Linearität der Beziehung, das Fehlen einer Autokorrelation der Residuen, die Gleichheit ihrer mathematischen Erwartungen mit Null und Konstante Streuung.

Eine der Haupthypothesen von OLS ist die Annahme der Gleichheit der Varianzen der Abweichungen ei, d.h. ihre Spanne um den Durchschnittswert (Null) der Reihe sollte einen stabilen Wert haben. Diese Eigenschaft wird Homoskedastizität genannt. In der Praxis sind die Varianzen der Abweichungen häufig ungleich, das heißt, es wird Heteroskedastizität beobachtet. Dies kann verschiedene Gründe haben. Beispielsweise können Fehler in den Quelldaten vorliegen. Gelegentliche Ungenauigkeiten in den Quellinformationen, beispielsweise Fehler in der Reihenfolge der Zahlen, können erhebliche Auswirkungen auf die Ergebnisse haben. Bei großen Werten der abhängigen Variablen (Variablen) wird häufig eine größere Streuung der Abweichungen єi beobachtet. Wenn die Daten einen erheblichen Fehler enthalten, ist natürlich auch die Abweichung des aus den fehlerhaften Daten berechneten Modellwerts groß. Um diesen Fehler zu beseitigen, müssen wir den Beitrag dieser Daten zu den Berechnungsergebnissen reduzieren und ihnen weniger Gewicht zuweisen als allen anderen. Diese Idee wird im gewichteten OLS umgesetzt.

Wenn eine bestimmte physikalische Größe von einer anderen Größe abhängt, kann diese Abhängigkeit untersucht werden, indem y bei verschiedenen x-Werten gemessen wird. Als Ergebnis von Messungen werden eine Reihe von Werten erhalten:

x 1, x 2, ..., x i, ..., x n;

y 1 , y 2 , ..., y i , ... , y n .

Basierend auf den Daten eines solchen Experiments ist es möglich, einen Graphen der Abhängigkeit y = ƒ(x) zu erstellen. Die resultierende Kurve ermöglicht es, die Form der Funktion ƒ(x) zu beurteilen. Allerdings bleiben die konstanten Koeffizienten, die in diese Funktion eingehen, unbekannt. Sie können mit der Methode der kleinsten Quadrate ermittelt werden. Experimentelle Punkte liegen in der Regel nicht genau auf der Kurve. Die Methode der kleinsten Quadrate erfordert, dass die Summe der Quadrate der Abweichungen der experimentellen Punkte von der Kurve, d. h. 2 war die kleinste.

In der Praxis wird diese Methode am häufigsten (und am einfachsten) bei einem linearen Zusammenhang angewendet, d. h. Wann

y = kx oder y = a + bx.

Die lineare Abhängigkeit ist in der Physik weit verbreitet. Und selbst wenn die Beziehung nichtlinear ist, versuchen sie normalerweise, ein Diagramm so zu konstruieren, dass eine gerade Linie entsteht. Wenn beispielsweise davon ausgegangen wird, dass der Brechungsindex von Glas n über die Beziehung n = a + b/λ 2 mit der Lichtwellenlänge λ zusammenhängt, wird die Abhängigkeit von n von λ -2 im Diagramm aufgetragen.

Bedenken Sie die Abhängigkeit y = kx(eine gerade Linie, die durch den Ursprung geht). Bilden wir den Wert φ aus der Summe der Quadrate der Abweichungen unserer Punkte von der Geraden

Der Wert von φ ist immer positiv und fällt umso kleiner aus, je näher unsere Punkte an der Geraden liegen. Die Methode der kleinsten Quadrate besagt, dass der Wert für k so gewählt werden sollte, dass φ ein Minimum aufweist


oder
(19)

Die Berechnung zeigt, dass der quadratische Mittelfehler bei der Bestimmung des Werts von k gleich ist

, (20)
wobei n die Anzahl der Messungen ist.

Betrachten wir nun einen etwas schwierigeren Fall, bei dem die Punkte die Formel erfüllen müssen y = a + bx(eine gerade Linie, die nicht durch den Ursprung verläuft).

Die Aufgabe besteht darin, aus der verfügbaren Wertemenge x i, y i die besten Werte von a und b zu finden.

Stellen wir erneut die quadratische Form φ zusammen, die der Summe der quadratischen Abweichungen der Punkte x i, y i von der Geraden entspricht

und finden Sie die Werte von a und b, für die φ ein Minimum hat

;

.

.

Die gemeinsame Lösung dieser Gleichungen ergibt

(21)

Die quadratischen Mittelfehler der Bestimmung von a und b sind gleich

(23)

.  (24)

Bei der Verarbeitung von Messergebnissen mit dieser Methode ist es zweckmäßig, alle Daten in einer Tabelle zusammenzufassen, in der alle in den Formeln (19)(24) enthaltenen Beträge vorab berechnet werden. Die Formen dieser Tabellen sind in den folgenden Beispielen angegeben.

Beispiel 1. Die Grundgleichung der Dynamik der Rotationsbewegung ε = M/J (eine gerade Linie durch den Ursprung) wurde untersucht. Bei verschiedenen Werten des Moments M wurde die Winkelbeschleunigung ε eines bestimmten Körpers gemessen. Es ist erforderlich, das Trägheitsmoment dieses Körpers zu bestimmen. In der zweiten und dritten Spalte sind die Ergebnisse der Messungen des Kraftmoments und der Winkelbeschleunigung aufgeführt Tabelle 5.

Tabelle 5
N M, N m ε, s -1 M 2 M ε ε - kM (ε - kM) 2
1 1.44 0.52 2.0736 0.7488 0.039432 0.001555
2 3.12 1.06 9.7344 3.3072 0.018768 0.000352
3 4.59 1.45 21.0681 6.6555 -0.08181 0.006693
4 5.90 1.92 34.81 11.328 -0.049 0.002401
5 7.45 2.56 55.5025 19.072 0.073725 0.005435
– – 123.1886 41.1115 – 0.016436

Mit Formel (19) ermitteln wir:

.

Um den quadratischen Mittelwertfehler zu bestimmen, verwenden wir Formel (20)

0.005775kg-1 · M -2 .

Nach Formel (18) gilt

; .

SJ = (2,996 0,005775)/0,3337 = 0,05185 kg m2.

Nachdem wir die Zuverlässigkeit P = 0,95 festgelegt haben, finden wir unter Verwendung der Tabelle der Student-Koeffizienten für n = 5 t = 2,78 und bestimmen den absoluten Fehler ΔJ = 2,78 0,05185 = 0,1441 ≈ 0,2 kg m2.

Schreiben wir die Ergebnisse in das Formular:

J = (3,0 ± 0,2) kg m2;


Beispiel 2. Berechnen wir den Temperaturkoeffizienten des Metallwiderstands mithilfe der Methode der kleinsten Quadrate. Der Widerstand hängt linear von der Temperatur ab

R t = R 0 (1 + α t°) = R 0 + R 0 α t°.

Der freie Term bestimmt den Widerstand R 0 bei einer Temperatur von 0 °C und der Steigungskoeffizient ist das Produkt aus dem Temperaturkoeffizienten α und dem Widerstand R 0 .

Die Ergebnisse der Messungen und Berechnungen sind in der Tabelle aufgeführt ( siehe Tabelle 6).

Tabelle 6
N t°, s r, Ohm t-¯t (t-¯t) 2 (t-¯t)r r - bt - a (r - bt - a) 2 .10 -6
1 23 1.242 -62.8333 3948.028 -78.039 0.007673 58.8722
2 59 1.326 -26.8333 720.0278 -35.581 -0.00353 12.4959
3 84 1.386 -1.83333 3.361111 -2.541 -0.00965 93.1506
4 96 1.417 10.16667 103.3611 14.40617 -0.01039 107.898
5 120 1.512 34.16667 1167.361 51.66 0.021141 446.932
6 133 1.520 47.16667 2224.694 71.69333 -0.00524 27.4556
515 8.403 – 8166.833 21.5985 – 746.804
∑/n 85.83333 1.4005 – – – – –

Mit den Formeln (21), (22) ermitteln wir

R 0 = ¯ R- α R 0 ¯ t = 1,4005 - 0,002645 85,83333 = 1,1735 Ohm.

Finden wir einen Fehler in der Definition von α. Da gilt dann nach Formel (18):

.

Mit den Formeln (23), (24) haben wir

;

0.014126 Ohm.

Nachdem wir die Zuverlässigkeit auf P = 0,95 eingestellt haben und die Tabelle der Student-Koeffizienten für n = 6 verwenden, finden wir t = 2,57 und bestimmen den absoluten Fehler Δα = 2,57 0,000132 = 0,000338 Grad -1.

α = (23 ± 4) 10 -4 Hagel-1 bei P = 0,95.


Beispiel 3. Es ist erforderlich, den Krümmungsradius der Linse mithilfe der Newtonschen Ringe zu bestimmen. Die Radien r m der Newtonschen Ringe wurden gemessen und die Anzahl dieser Ringe m bestimmt. Die Radien der Newtonschen Ringe hängen durch die Gleichung mit dem Krümmungsradius der Linse R und der Ringzahl zusammen

r 2 m = mλR - 2d 0 R,

wobei d 0 die Dicke des Spaltes zwischen Linse und planparalleler Platte (bzw. die Verformung der Linse) ist,

λ Wellenlänge des einfallenden Lichts.

λ = (600 ± 6) nm;
r 2 m = y;
m = x;
λR = b;
-2d 0 R = a,

dann nimmt die Gleichung die Form an y = a + bx.

.

Die Ergebnisse von Messungen und Berechnungen werden eingetragen Tabelle 7.

Tabelle 7
N x = m y = r 2, 10 -2 mm 2 m -¯ m (m -¯m) 2 (m -¯ m)y y - bx - a, 10 -4 (y - bx - a) 2 , 10 -6
1 1 6.101 -2.5 6.25 -0.152525 12.01 1.44229
2 2 11.834 -1.5 2.25 -0.17751 -9.6 0.930766
3 3 17.808 -0.5 0.25 -0.08904 -7.2 0.519086
4 4 23.814 0.5 0.25 0.11907 -1.6 0.0243955
5 5 29.812 1.5 2.25 0.44718 3.28 0.107646
6 6 35.760 2.5 6.25 0.894 3.12 0.0975819
21 125.129 – 17.5 1.041175 – 3.12176
∑/n 3.5 20.8548333 – – – – –

Mit der Methode der kleinsten Quadrate (OLS) können Sie verschiedene Größen anhand der Ergebnisse vieler Messungen schätzen, die zufällige Fehler enthalten.

Merkmale multinationaler Unternehmen

Der Grundgedanke dieser Methode besteht darin, dass die Summe der Fehlerquadrate als Kriterium für die Genauigkeit der Problemlösung betrachtet wird, die minimiert werden soll. Bei der Anwendung dieser Methode können sowohl numerische als auch analytische Ansätze verwendet werden.

Als numerische Implementierung geht es bei der Methode der kleinsten Quadrate insbesondere darum, möglichst viele Messungen einer unbekannten Zufallsvariablen vorzunehmen. Darüber hinaus ist die Lösung umso genauer, je mehr Berechnungen durchgeführt werden. Basierend auf diesem Berechnungssatz (Ausgangsdaten) wird ein weiterer Satz geschätzter Lösungen ermittelt, aus denen dann die beste ausgewählt wird. Wenn die Lösungsmenge parametrisiert ist, reduziert sich die Methode der kleinsten Quadrate darauf, den optimalen Wert der Parameter zu finden.

Als analytischer Ansatz zur Implementierung von LSM wird anhand eines Satzes von Ausgangsdaten (Messungen) und eines erwarteten Satzes von Lösungen ein bestimmter (funktionaler) Satz bestimmt, der durch eine Formel ausgedrückt werden kann, die als bestimmte Hypothese erhalten wird, die einer Bestätigung bedarf. In diesem Fall kommt es bei der Methode der kleinsten Quadrate darauf an, das Minimum dieser Funktion auf der Menge der quadratischen Fehler der Originaldaten zu finden.

Bitte beachten Sie, dass es sich nicht um die Fehler selbst handelt, sondern um die Fehlerquadrate. Warum? Tatsache ist, dass Abweichungen der Messwerte vom exakten Wert oft sowohl positiv als auch negativ sind. Bei der Ermittlung des Durchschnitts kann eine einfache Summierung zu einer falschen Schlussfolgerung über die Qualität der Schätzung führen, da die Aufhebung positiver und negativer Werte die Aussagekraft der Stichprobenziehung mehrerer Messungen verringert. Und damit auch die Genauigkeit der Beurteilung.

Um dies zu verhindern, werden die quadrierten Abweichungen aufsummiert. Darüber hinaus wird die Summe der quadrierten Fehler extrahiert, um die Dimension des Messwerts und der endgültigen Schätzung anzugleichen

Einige Anwendungen von MNC

MNC wird in verschiedenen Bereichen häufig eingesetzt. In der Wahrscheinlichkeitstheorie und der mathematischen Statistik wird die Methode beispielsweise verwendet, um ein Merkmal einer Zufallsvariablen wie die Standardabweichung zu bestimmen, die die Breite des Wertebereichs der Zufallsvariablen bestimmt.

Was die breiteste Anwendung in verschiedenen Bereichen der Wissenschaft und der praktischen Tätigkeit findet. Das können Physik, Chemie, Biologie, Wirtschaftswissenschaften, Soziologie, Psychologie usw. sein. Durch den Willen des Schicksals muss ich mich oft mit der Wirtschaft auseinandersetzen, und deshalb werde ich heute für Sie eine Reise in ein erstaunliches Land namens arrangieren Ökonometrie=) ...Wie kann man es nicht wollen?! Es ist dort sehr gut – man muss sich nur entscheiden! ...Aber was Sie wahrscheinlich auf jeden Fall wollen, ist zu lernen, wie man Probleme löst Methode der kleinsten Quadrate. Und besonders fleißige Leser werden lernen, sie nicht nur präzise, ​​sondern auch SEHR SCHNELL zu lösen ;-) Aber zuerst allgemeine Darstellung des Problems+ begleitendes Beispiel:

Angenommen, in einem bestimmten Fachgebiet werden Indikatoren untersucht, die einen quantitativen Ausdruck haben. Gleichzeitig gibt es allen Grund zu der Annahme, dass der Indikator vom Indikator abhängt. Diese Annahme kann entweder eine wissenschaftliche Hypothese sein oder auf dem gesunden Menschenverstand basieren. Lassen wir die Wissenschaft jedoch beiseite und erkunden appetitlichere Bereiche – nämlich Lebensmittelgeschäfte. Bezeichnen wir mit:

– Verkaufsfläche eines Lebensmittelgeschäfts, qm,
– Jahresumsatz eines Lebensmittelgeschäfts, Millionen Rubel.

Es ist völlig klar, dass der Umsatz in den meisten Fällen umso größer ist, je größer die Ladenfläche ist.

Nehmen wir an, dass uns nach der Durchführung von Beobachtungen/Experimenten/Berechnungen/Tänzen mit einem Tamburin numerische Daten zur Verfügung stehen:

Bei Lebensmittelgeschäften ist meiner Meinung nach alles klar: - das ist die Fläche des 1. Ladens, - sein Jahresumsatz, - die Fläche des 2. Ladens, - sein Jahresumsatz usw. Übrigens ist es überhaupt nicht notwendig, Zugang zu geheimen Materialien zu haben – eine ziemlich genaue Einschätzung des Handelsumsatzes kann dadurch erhalten werden mathematische Statistik. Aber lassen wir uns nicht ablenken, der Wirtschaftsspionagekurs ist bereits bezahlt =)

Tabellarische Daten können auch in Form von Punkten geschrieben und in der bekannten Form dargestellt werden Kartesisches System .

Beantworten wir eine wichtige Frage: Wie viele Punkte werden für eine qualitative Studie benötigt?

Je mehr desto besser. Der akzeptable Mindestsatz besteht aus 5-6 Punkten. Darüber hinaus können bei kleinen Datenmengen keine „anomalen“ Ergebnisse in die Stichprobe aufgenommen werden. So kann beispielsweise ein kleiner Elite-Laden um Größenordnungen mehr verdienen als „seine Kollegen“, wodurch das allgemeine Muster, das Sie finden müssen, verzerrt wird!

Um es ganz einfach auszudrücken: Wir müssen eine Funktion auswählen, Zeitplan die so nah wie möglich an den Punkten vorbeiführt . Diese Funktion wird aufgerufen annähernd (Näherung - Näherung) oder theoretische Funktion . Im Allgemeinen taucht hier sofort ein offensichtlicher „Anwärter“ auf – ein Polynom höheren Grades, dessen Graph ALLE Punkte durchläuft. Diese Option ist jedoch kompliziert und oft einfach falsch. (da die Grafik ständig eine „Schleife“ durchläuft und den Haupttrend schlecht widerspiegelt).

Die gesuchte Funktion muss also recht einfach sein und gleichzeitig die Abhängigkeit angemessen widerspiegeln. Wie Sie vielleicht erraten haben, heißt eine der Methoden zum Finden solcher Funktionen aufgerufen Methode der kleinsten Quadrate. Schauen wir uns zunächst das Wesentliche allgemein an. Lassen Sie einige Funktionen experimentelle Daten annähern:


Wie lässt sich die Genauigkeit dieser Näherung beurteilen? Berechnen wir auch die Unterschiede (Abweichungen) zwischen den experimentellen und funktionalen Werten (wir studieren die Zeichnung). Der erste Gedanke, der mir in den Sinn kommt, ist, abzuschätzen, wie groß die Summe ist, aber das Problem besteht darin, dass die Unterschiede negativ sein können (Zum Beispiel, ) und Abweichungen als Ergebnis einer solchen Summierung heben sich gegenseitig auf. Um die Genauigkeit der Näherung abzuschätzen, muss daher die Summe herangezogen werden Module Abweichungen:

oder zusammengebrochen: (Falls es jemand nicht weiß: – das ist das Summensymbol, und – eine Hilfsvariable – „Zähler“, die Werte von 1 bis annimmt).

Indem wir experimentelle Punkte mit unterschiedlichen Funktionen approximieren, erhalten wir unterschiedliche Werte, und offensichtlich ist diese Funktion genauer, wenn diese Summe kleiner ist.

Eine solche Methode existiert und wird aufgerufen Methode des kleinsten Moduls. In der Praxis hat es jedoch eine viel größere Verbreitung gefunden Methode der kleinsten Quadrate, bei dem mögliche negative Werte nicht durch den Modul, sondern durch Quadrieren der Abweichungen eliminiert werden:

Danach zielen die Bemühungen darauf ab, eine Funktion auszuwählen, die die Summe der quadrierten Abweichungen darstellt war so klein wie möglich. Daher stammt eigentlich auch der Name der Methode.

Und nun kommen wir zu einem weiteren wichtigen Punkt zurück: Wie oben erwähnt, sollte die ausgewählte Funktion recht einfach sein – es gibt aber auch viele solcher Funktionen: linear , hyperbolisch, exponentiell, logarithmisch, quadratisch usw. Und natürlich möchte ich hier gleich „das Tätigkeitsfeld reduzieren“. Welche Funktionsklasse sollte ich für die Forschung wählen? Eine primitive, aber effektive Technik:

– Der einfachste Weg ist die Darstellung von Punkten auf der Zeichnung und analysieren Sie ihre Position. Wenn sie dazu neigen, in einer geraden Linie zu verlaufen, dann sollten Sie danach suchen Gleichung einer Geraden mit optimalen Werten und . Mit anderen Worten besteht die Aufgabe darin, SOLCHE Koeffizienten zu finden, sodass die Summe der quadratischen Abweichungen am kleinsten ist.

Wenn die Punkte beispielsweise entlang liegen Hyperbel, dann ist offensichtlich klar, dass die lineare Funktion eine schlechte Näherung liefert. In diesem Fall suchen wir nach den „günstigsten“ Koeffizienten für die Hyperbelgleichung – diejenigen, die die minimale Quadratsumme ergeben .

Beachten Sie nun, dass wir in beiden Fällen darüber sprechen Funktionen zweier Variablen, deren Argumente sind gesuchte Abhängigkeitsparameter:

Und im Wesentlichen müssen wir ein Standardproblem lösen – finden Minimalfunktion zweier Variablen.

Erinnern wir uns an unser Beispiel: Nehmen wir an, dass „Laden“-Punkte in der Regel auf einer geraden Linie liegen, und es gibt allen Grund, dies anzunehmen lineare Abhängigkeit Umsatz aus Verkaufsflächen. Finden wir SOLCHE Koeffizienten „a“ und „be“, sodass die Summe der quadrierten Abweichungen entsteht war der Kleinste. Alles ist wie immer – zunächst einmal Partielle Ableitungen 1. Ordnung. Entsprechend Linearitätsregel Direkt unter dem Summensymbol können Sie unterscheiden:

Wenn Sie diese Informationen für einen Aufsatz oder eine Hausarbeit verwenden möchten, bin ich für den Link im Quellenverzeichnis sehr dankbar. Solche detaillierten Berechnungen finden Sie an wenigen Stellen:

Lassen Sie uns ein Standardsystem erstellen:

Wir reduzieren jede Gleichung um „zwei“ und „brechen“ zusätzlich die Summen auf:

Notiz : Analysieren Sie unabhängig, warum „a“ und „be“ über das Summensymbol hinaus entfernt werden können. Formal lässt sich das übrigens mit der Summe machen

Schreiben wir das System in „angewandter“ Form um:

Danach beginnt sich der Algorithmus zur Lösung unseres Problems abzuzeichnen:

Kennen wir die Koordinaten der Punkte? Wir wissen. Beträge Können wir es finden? Leicht. Machen wir es am einfachsten System zweier linearer Gleichungen in zwei Unbekannten(„a“ und „sein“). Wir lösen das System zum Beispiel, Cramers Methode, wodurch wir einen stationären Punkt erhalten. Überprüfung ausreichende Bedingung für ein Extremum, können wir an dieser Stelle die Funktion überprüfen genau erreicht Minimum. Die Prüfung erfordert zusätzliche Berechnungen und wird daher nicht durchgeführt (Bei Bedarf kann der fehlende Rahmen eingesehen werden). Wir ziehen das abschließende Fazit:

Funktion der beste Weg (zumindest im Vergleich zu jeder anderen linearen Funktion) bringt experimentelle Punkte näher . Grob gesagt verläuft sein Graph so nah wie möglich an diesen Punkten. In Tradition Ökonometrie die resultierende Näherungsfunktion wird auch aufgerufen gepaarte lineare Regressionsgleichung .

Das betrachtete Problem ist von großer praktischer Bedeutung. In unserer Beispielsituation gilt Gl. ermöglicht es Ihnen, den Handelsumsatz vorherzusagen ("Ich G") Der Laden wird den einen oder anderen Wert der Verkaufsfläche haben (die eine oder andere Bedeutung von „x“). Ja, die resultierende Prognose wird nur eine Prognose sein, aber in vielen Fällen wird sie sich als recht genau erweisen.

Ich werde nur ein Problem mit „echten“ Zahlen analysieren, da es keine Schwierigkeiten bereitet – alle Berechnungen erfolgen auf dem Niveau des Lehrplans der 7. bis 8. Klasse. In 95 Prozent der Fälle werden Sie aufgefordert, nur eine lineare Funktion zu finden, aber ganz am Ende des Artikels werde ich zeigen, dass es nicht schwieriger ist, die Gleichungen der optimalen Hyperbel-, Exponential- und einiger anderer Funktionen zu finden.

Tatsächlich müssen nur noch die versprochenen Leckereien verteilt werden – damit Sie lernen, solche Beispiele nicht nur genau, sondern auch schnell zu lösen. Wir studieren den Standard sorgfältig:

Aufgabe

Als Ergebnis der Untersuchung der Beziehung zwischen zwei Indikatoren wurden die folgenden Zahlenpaare erhalten:

Finden Sie mithilfe der Methode der kleinsten Quadrate die lineare Funktion, die der empirischen Funktion am besten entspricht (erfahren) Daten. Erstellen Sie eine Zeichnung, auf der Sie experimentelle Punkte und einen Graphen der Näherungsfunktion in einem kartesischen rechtwinkligen Koordinatensystem konstruieren . Ermitteln Sie die Summe der quadratischen Abweichungen zwischen den empirischen und theoretischen Werten. Finden Sie heraus, ob die Funktion besser wäre (aus Sicht der Methode der kleinsten Quadrate) Bringen Sie experimentelle Punkte näher.

Bitte beachten Sie, dass die „x“-Bedeutungen natürlich sind und eine charakteristische Bedeutung haben, auf die ich etwas später eingehen werde; aber sie können natürlich auch gebrochen sein. Darüber hinaus können je nach Inhalt einer bestimmten Aufgabe sowohl die Werte „X“ als auch „Spiel“ ganz oder teilweise negativ sein. Nun, uns wurde eine „gesichtslose“ Aufgabe gegeben, und wir beginnen damit Lösung:

Wir finden die Koeffizienten der optimalen Funktion als Lösung des Systems:

Zwecks kompakterer Aufzeichnung kann die Variable „Zähler“ weggelassen werden, da bereits klar ist, dass die Summierung von 1 bis erfolgt.

Bequemer ist es, die benötigten Beträge tabellarisch zu berechnen:


Berechnungen können mit einem Mikrorechner durchgeführt werden, viel besser ist jedoch die Verwendung von Excel – sowohl schneller als auch fehlerfrei; Sehen Sie sich ein kurzes Video an:

Somit erhalten wir Folgendes System:

Hier können Sie die zweite Gleichung mit 3 multiplizieren und Subtrahieren Sie Term für Term den 2. von der 1. Gleichung. Aber das ist Glück – in der Praxis sind Systeme oft kein Geschenk, und in solchen Fällen spart es Cramers Methode:
, was bedeutet, dass das System über eine einzigartige Lösung verfügt.

Lass uns das Prüfen. Ich verstehe, dass Sie das nicht möchten, aber warum sollten Sie Fehler überspringen, wenn sie absolut nicht übersehen werden können? Setzen wir die gefundene Lösung in die linke Seite jeder Gleichung des Systems ein:

Man erhält die rechten Seiten der entsprechenden Gleichungen, was bedeutet, dass das System korrekt gelöst ist.

Somit ist die gewünschte Näherungsfunktion: – von alle linearen Funktionen Sie ist es, die die experimentellen Daten am besten annähert.

Im Gegensatz zu gerade Abhängigkeit des Umsatzes des Ladens von seiner Fläche, die gefundene Abhängigkeit ist umkehren (Prinzip „je mehr, desto weniger“), und diese Tatsache wird durch das Negativ sofort offenbart Neigung. Funktion sagt uns, dass mit einer Erhöhung eines bestimmten Indikators um 1 Einheit der Wert des abhängigen Indikators abnimmt im mittleren um 0,65 Einheiten. Man sagt: Je höher der Buchweizenpreis, desto weniger wird er verkauft.

Um den Graphen der Näherungsfunktion darzustellen, ermitteln wir ihre beiden Werte:

und führen Sie die Zeichnung aus:


Die konstruierte Gerade heißt Trendlinie (nämlich eine lineare Trendlinie, d. h. im Allgemeinen ist ein Trend nicht unbedingt eine gerade Linie). Jeder kennt den Ausdruck „im Trend sein“, und ich denke, dieser Begriff bedarf keiner weiteren Kommentare.

Berechnen wir die Summe der quadrierten Abweichungen zwischen empirischen und theoretischen Werten. Geometrisch gesehen ist dies die Summe der Quadrate der Längen der „Himbeer“-Segmente (zwei davon sind so klein, dass sie nicht einmal sichtbar sind).

Fassen wir die Berechnungen in einer Tabelle zusammen:


Auch hier können sie für alle Fälle manuell durchgeführt werden. Für den ersten Punkt gebe ich ein Beispiel:

aber es ist viel effektiver, es auf die bereits bekannte Weise zu tun:

Wir wiederholen noch einmal: Welche Bedeutung hat das erhaltene Ergebnis? Aus alle linearen Funktionen y-Funktion Der Indikator ist der kleinste, d. h. in seiner Familie ist er die beste Näherung. Und hier ist übrigens die letzte Frage des Problems nicht zufällig: Was wäre, wenn die vorgeschlagene Exponentialfunktion wäre? Wäre es besser, die experimentellen Punkte näher zusammenzubringen?

Finden wir die entsprechende Summe der quadratischen Abweichungen – zur Unterscheidung werde ich sie mit dem Buchstaben „Epsilon“ bezeichnen. Die Technik ist genau die gleiche:


Und zur Sicherheit noch einmal die Berechnungen zum 1. Punkt:

In Excel verwenden wir die Standardfunktion EXP (Syntax finden Sie in der Excel-Hilfe).

Abschluss: , was bedeutet, dass die Exponentialfunktion die experimentellen Punkte schlechter annähert als eine Gerade .

Aber hier ist zu beachten, dass es „schlimmer“ ist bedeutet noch nicht, Was ist falsch. Jetzt habe ich einen Graphen dieser Exponentialfunktion erstellt – und er verläuft auch in der Nähe der Punkte - so sehr, dass es ohne analytische Forschung schwierig ist zu sagen, welche Funktion genauer ist.

Damit ist die Lösung abgeschlossen und ich kehre zur Frage nach den natürlichen Werten des Arguments zurück. In verschiedenen Studien, meist wirtschaftlicher oder soziologischer Art, werden natürliche „X“ zur Nummerierung von Monaten, Jahren oder anderen gleichen Zeitintervallen verwendet. Betrachten Sie zum Beispiel das folgende Problem.