Как да начертаете регресионни остатъци. Бърза линейна регресия в Excel: линия на тренда. Линейна регресия в Excel

Какво е регресия?

Разгледайте две непрекъснати променливи x=(x 1, x 2, .., x n), y=(y 1, y 2, ..., y n).

Нека поставим точките върху 2D точкова диаграма и да кажем, че имаме линейна връзкаако данните са апроксимирани с права линия.

Ако приемем, че гзависи от х, и промените в гпричинени от промени в х, можем да дефинираме регресионна линия (регресия гна х), което най-добре описва праволинейната връзка между тези две променливи.

Статистическата употреба на думата "регресия" идва от феномен, известен като регресия към средната стойност, приписван на сър Франсис Галтън (1889).

Той показа, че докато високите бащи са склонни да имат високи синове, средният ръст на синовете е по-нисък от този на техните високи бащи. Средният ръст на синовете „регресира“ и „се върна“ до средния ръст на всички бащи в популацията. Така средно високите бащи имат по-ниски (но все още високи) синове, а ниските бащи имат по-високи (но все още доста ниски) синове.

регресионна линия

Математическо уравнение, което оценява проста (по двойки) линия на линейна регресия:

хнаречена независима променлива или предиктор.

Yе зависимата или отговорна променлива. Това е стойността, която очакваме г(средно), ако знаем стойността х, т.е. е предвидената стойност г»

  • а- свободен член (пресичане) на линията за оценка; тази стойност Y, кога х=0(Фиг. 1).
  • b- наклон или градиент на прогнозната линия; това е сумата, с която Yсе увеличава средно, ако увеличим хза една единица.
  • аи bсе наричат ​​регресионни коефициенти на оценената линия, въпреки че този термин често се използва само за b.

Линейната регресия по двойки може да бъде разширена, за да включва повече от една независима променлива; в този случай е известен като множествена регресия.

Фиг. 1. Линия на линейна регресия, показваща пресечната точка на a и наклона b (степента на увеличение на Y, когато x се увеличи с една единица)

Метод на най-малките квадрати

Извършваме регресионен анализ, използвайки извадка от наблюдения, където аи b- извадкови оценки на истинските (общи) параметри, α и β , които определят линията на линейна регресия в популацията (генерална популация).

Най-простият метод за определяне на коефициентите аи bе метод на най-малките квадрати(MNK).

Напасването се оценява чрез отчитане на остатъците (вертикалното разстояние на всяка точка от линията, напр. остатък = видимо г- предсказано г, Ориз. 2).

Линията на най-добро прилягане е избрана така, че сумата от квадратите на остатъците да е минимална.

Ориз. 2. Линия на линейна регресия с изобразени остатъци (вертикални пунктирани линии) за всяка точка.

Предположения за линейна регресия

Така че за всяка наблюдавана стойност остатъкът е равен на разликата и съответната прогнозирана.Всеки остатък може да бъде положителен или отрицателен.

Можете да използвате остатъци, за да тествате следните допускания зад линейната регресия:

  • Остатъците обикновено се разпределят с нулева средна стойност;

Ако допусканията за линейност, нормалност и/или постоянна дисперсия са съмнителни, можем да трансформираме или изчислим нова регресионна линия, за която тези допускания са изпълнени (напр. да използваме логаритмична трансформация и т.н.).

Ненормални стойности (отклонения) и точки на влияние

„Влиятелно“ наблюдение, ако е пропуснато, променя една или повече оценки на параметрите на модела (т.е. наклон или пресечна точка).

Отклонение (наблюдение, което противоречи на повечето от стойностите в набора от данни) може да бъде „влиятелно“ наблюдение и може да бъде добре открито визуално, когато се гледа 2D диаграма на разсейване или диаграма на остатъци.

Както за отклонения, така и за "влиятелни" наблюдения (точки) се използват модели, както с тяхното включване, така и без тях, обърнете внимание на промяната в оценката (регресионни коефициенти).

Когато правите анализ, не отхвърляйте автоматично отклоненията или точките на влияние, тъй като простото им игнориране може да повлияе на резултатите. Винаги изучавайте причините за тези отклонения и ги анализирайте.

Хипотеза за линейна регресия

При конструиране на линейна регресия се проверява нулевата хипотеза, че общият наклон на линията на регресия β е равен на нула.

Ако наклонът на линията е нула, няма линейна връзка между и: промяната не засяга

За да тествате нулевата хипотеза, че истинският наклон е нула, можете да използвате следния алгоритъм:

Изчислете тестовата статистика, равна на съотношението , което се подчинява на разпределение със степени на свобода, където стандартната грешка на коефициента


,

- оценка на дисперсията на остатъците.

Обикновено, ако достигнатото ниво на значимост е нулевата хипотеза се отхвърля.


където е процентната точка на разпределението със степени на свобода, което дава вероятността за двустранен тест

Това е интервалът, който съдържа общия наклон с вероятност от 95%.

За големи извадки, да кажем, че можем да приближим със стойност от 1,96 (т.е. тестовата статистика ще има тенденция да бъде нормално разпределена)

Оценка на качеството на линейната регресия: коефициент на детерминация R 2

Поради линейната връзка и ние очакваме това да се променя с промените и ние наричаме това вариацията, която се дължи или се обяснява с регресията. Остатъчната вариация трябва да бъде възможно най-малка.

Ако е така, тогава по-голямата част от вариацията ще се обясни с регресията и точките ще лежат близо до линията на регресия, т.е. линията пасва добре на данните.

Пропорцията на общата дисперсия, която се обяснява с регресията, се нарича коефициент на детерминация, обикновено изразен като процент и означен R2(при сдвоена линейна регресия това е стойността r2, квадрат на корелационния коефициент), ви позволява субективно да оцените качеството на регресионното уравнение.

Разликата е процентът на дисперсията, който не може да се обясни с регресия.

Без официален тест за оценка, ние сме принудени да разчитаме на субективна преценка, за да определим качеството на съответствие на регресионната линия.

Прилагане на регресионна линия към прогноза

Можете да използвате регресионна линия, за да предвидите стойност от стойност в рамките на наблюдавания диапазон (никога не екстраполирайте извън тези граници).

Ние предвиждаме средната стойност за наблюдаеми, които имат определена стойност, като заместваме тази стойност в уравнението на регресионната линия.

Така че, ако прогнозираме като Ние използваме тази прогнозирана стойност и нейната стандартна грешка, за да оценим доверителния интервал за истинската средна съвкупност.

Повтарянето на тази процедура за различни стойности ви позволява да изградите граници на доверие за този ред. Това е лента или област, която съдържа истинска линия, например, с 95% ниво на сигурност.

Прости планове за регресия

Простите регресионни проекти съдържат един непрекъснат предиктор. Ако има 3 случая с предикторни стойности P, като 7, 4 и 9, и дизайнът включва ефект от първи ред P, тогава проектната матрица X ще бъде

и регресионното уравнение, използващо P за X1, изглежда така

Y = b0 + b1 P

Ако един прост регресионен дизайн съдържа ефект от по-висок порядък върху P, като например квадратичен ефект, тогава стойностите в колона X1 в проектната матрица ще бъдат повишени на втора степен:

и уравнението ще приеме формата

Y = b0 + b1 P2

Сигма-ограничените и свръхпараметризираните методи за кодиране не се прилагат за прости регресионни дизайни и други дизайни, съдържащи само непрекъснати предиктори (защото просто няма категорични предиктори). Независимо от избрания метод на кодиране, стойностите на непрекъснатите променливи се увеличават с подходящата мощност и се използват като стойности за X променливите. В този случай не се извършва преобразуване. Освен това, когато описвате регресионни планове, можете да пропуснете разглеждането на плановата матрица X и да работите само с регресионното уравнение.

Пример: Прост регресионен анализ

Този пример използва данните, предоставени в таблицата:

Ориз. 3. Таблица с изходни данни.

Данните се основават на сравнение на преброяванията от 1960 г. и 1970 г. в 30 произволно избрани окръга. Имената на окръгите са представени като имена на наблюдения. Информацията за всяка променлива е представена по-долу:

Ориз. 4. Таблица със спецификации на променливи.

Цел на изследването

За този пример ще бъде анализирана връзката между нивото на бедност и силата, която предсказва процента на семействата, които са под прага на бедността. Следователно ще третираме променлива 3 (Pt_Poor ) като зависима променлива.

Може да се изложи една хипотеза: изменението на населението и процента на семействата, които са под прага на бедността, са свързани. Изглежда разумно да се очаква, че бедността води до изтичане на населението, следователно би имало отрицателна корелация между процента на хората под прага на бедността и изменението на населението. Следователно ще третираме променлива 1 (Pop_Chng) като променлива за прогнозиране.

Вижте резултатите

Коефициенти на регресия

Ориз. 5. Коефициенти на регресия Pt_Poor върху Pop_Chng.

В пресечната точка на реда Pop_Chng и Param. нестандартизираният коефициент за регресията на Pt_Poor върху Pop_Chng е -0,40374. Това означава, че за всяка единица намаление на населението има увеличение на нивото на бедност от 0,40374. Горната и долната (по подразбиране) 95% доверителни граници за този нестандартизиран коефициент не включват нула, така че регресионният коефициент е значим на ниво p<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

Разпределение на променливите

Коефициентите на корелация могат да станат значително надценени или подценени, ако има големи отклонения в данните. Нека разгледаме разпределението на зависимата променлива Pt_Poor по окръг. За да направим това, ще изградим хистограма на променливата Pt_Poor.

Ориз. 6. Хистограма на променливата Pt_Poor.

Както можете да видите, разпределението на тази променлива се различава значително от нормалното разпределение. Въпреки това, въпреки че дори два окръга (двите две колони) имат по-висок процент семейства, които са под прага на бедността, отколкото се очаква при нормално разпределение, те изглеждат „в рамките на диапазона“.

Ориз. 7. Хистограма на променливата Pt_Poor.

Тази преценка е донякъде субективна. Основното правило е, че отклоненията трябва да се вземат предвид, ако едно наблюдение (или наблюдения) не попадат в интервала (средно ± 3 пъти стандартното отклонение). В този случай си струва да повторите анализа със и без извънредни стойности, за да сте сигурни, че те нямат сериозен ефект върху корелацията между членовете на популацията.

Точкова диаграма

Ако една от хипотезите е a priori за връзката между дадените променливи, тогава е полезно да я проверите върху диаграмата на съответната диаграма на разсейване.

Ориз. 8. Точкова диаграма.

Точковата диаграма показва ясна отрицателна корелация (-.65) между двете променливи. Той също така показва 95% доверителен интервал за регресионната линия, т.е. с 95% вероятност регресионната линия минава между двете пунктирани криви.

Критерии за значимост

Ориз. 9. Таблица, съдържаща критериите за значимост.

Тестът за регресионния коефициент Pop_Chng потвърждава, че Pop_Chng е тясно свързан с Pt_Poor, p<.001 .

Резултат

Този пример показа как да се анализира прост регресионен план. Представена е и интерпретация на нестандартизирани и стандартизирани регресионни коефициенти. Обсъжда се значението на изучаването на разпределението на отговора на зависимата променлива и се демонстрира техника за определяне на посоката и силата на връзката между предиктора и зависимата променлива.

Сервизно задание. С помощта на онлайн услугата можете да намерите:
  • параметри на уравнението на линейната регресия y=a+bx , линеен корелационен коефициент с тест за неговата значимост;
  • плътност на връзката с помощта на индикатори за корелация и определяне, оценка на най-малките квадрати, статична надеждност на регресионното моделиране с помощта на F-тест на Fisher и t-тест на Student, доверителен интервал на прогнозата за ниво на значимост α

Уравнението на двойната регресия се отнася до регресионно уравнение от първи ред. Ако един иконометричен модел съдържа само една обяснителна променлива, тогава той се нарича регресия по двойки. Регресионно уравнение от втори реди регресионно уравнение от трети редсе отнасят до нелинейни регресионни уравнения.

Пример. Изберете зависимата (обяснена) и обяснителна променлива, за да изградите сдвоен регресионен модел. дайте . Определете теоретичното уравнение на двойната регресия. Оценете адекватността на изградения модел (интерпретирайте R-квадрат, t-статистика, F-статистика).
Решениеще се базира на процес на иконометрично моделиране.
Етап 1 (постановка) - определяне на крайните цели на моделирането, набор от фактори и показатели, участващи в модела, и тяхната роля.
Спецификация на модела - дефиниране на целта на изследването и избор на икономически променливи на модела.
Ситуационна (практическа) задача. За 10 предприятия в региона изследваме зависимостта на продукцията на работник y (хиляда рубли) от дела на висококвалифицираните работници в общия брой на работниците x (в%).
Етап 2 (априори) - предмоделен анализ на икономическата същност на изследваното явление, формирането и формализирането на априорна информация и първоначални предположения, по-специално свързани с естеството и генезиса на първоначалните статистически данни и случайни остатъци компоненти под формата на поредица от хипотези.
Още на този етап можем да говорим за ясна зависимост между нивото на квалификация на работника и неговата продукция, тъй като колкото по-опитен е работникът, толкова по-висока е неговата производителност. Но как да оценим тази зависимост?
Регресия по двойкие регресия между две променливи - y и x, т.е. модел от вида:

Където y е зависимата променлива (резултатен знак); x е независима или обяснителна променлива (фактор на знак). Знакът "^" означава, че няма строга функционална зависимост между променливите x и y, следователно в почти всеки отделен случай стойността на y се състои от два члена:

Където y е действителната стойност на ефективната характеристика; y x е теоретичната стойност на ефективния признак, намерена на базата на регресионното уравнение; ε е случайна променлива, която характеризира отклоненията на реалната стойност на резултантната характеристика от теоретичната стойност, получена от регресионното уравнение.
Ще покажем графично регресионната зависимост между продукцията на работник и дела на висококвалифицираните работници.


3-ти етап (параметризация) - същинско моделиране, т.е. избор на общата форма на модела, включително състава и формата на връзките между включените в него променливи. Изборът на типа функционална зависимост в регресионното уравнение се нарича параметризация на модела. Избирам двойка регресионно уравнение, т.е. само един фактор ще повлияе на крайния резултат y.
4-ти етап (информационен) - събиране на необходимата статистическа информация, т.е. регистриране на стойностите на факторите и показателите, участващи в модела. Извадката се състои от 10 предприятия от индустрията.
Етап 5 (идентификация на модела) – оценка на неизвестни параметри на модела с помощта на наличните статистически данни.
За да определим параметрите на модела, използваме LSM - метод на най-малките квадрати. Системата от нормални уравнения ще изглежда така:
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
За да изчислим регресионните параметри, ще изградим изчислителна таблица (Таблица 1).
хгx2y2x y
10 6 100 36 60
12 6 144 36 72
15 7 225 49 105
17 7 289 49 119
18 7 324 49 126
19 8 361 64 152
19 8 361 64 152
20 9 400 81 180
20 9 400 81 180
21 10 441 100 210
171 77 3045 609 1356

Вземаме данните от таблица 1 (последния ред), в резултат на което имаме:
10a + 171b = 77
171 a + 3045 b = 1356
Тази SLAE се решава по метода на Крамер или метода на обратната матрица.
Получаваме емпирични регресионни коефициенти: b = 0,3251, a = 2,1414
Уравнението на емпиричната регресия има формата:
y = 0,3251 x + 2,1414
Етап 6 (проверка на модела) - сравнение на реални и моделни данни, проверка на адекватността на модела, оценка на точността на моделните данни.
Анализът се извършва с помощта на

Регресионен и корелационен анализ - статистически методи за изследване. Това са най-често срещаните начини за показване на зависимостта на параметър от една или повече независими променливи.

По-долу, използвайки конкретни практически примери, ще разгледаме тези два много популярни анализа сред икономистите. Ще дадем и пример за получаване на резултати, когато се комбинират.

Регресионен анализ в Excel

Показва влиянието на някои стойности (независими, независими) върху зависимата променлива. Например как броят на икономически активното население зависи от броя на предприятията, заплатите и други параметри. Или: как влияят на нивото на БВП чуждите инвестиции, цените на енергията и т.н.

Резултатът от анализа ви позволява да дадете приоритет. И въз основа на основните фактори, да се прогнозира, планира развитието на приоритетните области, да се вземат управленски решения.

Регресията се случва:

  • линеен (y = a + bx);
  • параболичен (y = a + bx + cx 2);
  • експоненциален (y = a * exp(bx));
  • мощност (y = a*x^b);
  • хиперболичен (y = b/x + a);
  • логаритмичен (y = b * 1n(x) + a);
  • експоненциален (y = a * b^x).

Разгледайте примера за изграждане на регресионен модел в Excel и интерпретиране на резултатите. Нека вземем линеен тип регресия.

Задача. В 6 предприятия са анализирани средната месечна работна заплата и напусналите служители. Необходимо е да се установи зависимостта на броя на пенсионираните служители от средната работна заплата.

Линейният регресионен модел има следния вид:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Където a са регресионните коефициенти, x са влияещите променливи и k е броят на факторите.

В нашия пример Y е индикаторът за напуснали работници. Влияещият фактор е работната заплата (x).

Excel има вградени функции, които могат да се използват за изчисляване на параметрите на линеен регресионен модел. Но добавката Analysis ToolPak ще го направи по-бързо.

Активирайте мощен аналитичен инструмент:

След като бъде активирана, добавката ще бъде достъпна в раздела Данни.

Сега ще се занимаваме директно с регресионния анализ.



На първо място, обръщаме внимание на R-квадрата и коефициентите.

R-квадрат е коефициентът на детерминация. В нашия пример това е 0,755, или 75,5%. Това означава, че изчислените параметри на модела обясняват връзката между изследваните параметри с 75,5%. Колкото по-висок е коефициентът на детерминация, толкова по-добър е моделът. Добър - над 0,8. Слабо - под 0,5 (такъв анализ едва ли може да се счита за разумен). В нашия пример - "не е лошо".

Коефициентът 64.1428 показва какво ще бъде Y, ако всички променливи в разглеждания модел са равни на 0. Тоест други фактори, които не са описани в модела, също влияят върху стойността на анализирания параметър.

Коефициентът -0.16285 показва тежестта на променливата X върху Y. Тоест средната месечна заплата в този модел влияе върху броя на напусналите с тежест -0.16285 (това е малка степен на влияние). Знакът „-“ показва отрицателно въздействие: колкото по-висока е заплатата, толкова по-малко напускат. Което е справедливо.



Корелационен анализ в Excel

Корелационният анализ помага да се установи дали има връзка между показателите в една или две проби. Например между времето за работа на машината и разходите за ремонт, цената на оборудването и продължителността на работа, височината и теглото на децата и т.н.

Ако има връзка, тогава дали увеличението на един параметър води до увеличение (положителна корелация) или намаление (отрицателна) на другия. Корелационният анализ помага на анализатора да определи дали стойността на един индикатор може да предвиди възможната стойност на друг.

Коефициентът на корелация се обозначава с r. Варира от +1 до -1. Класификацията на корелациите за различните области ще бъде различна. Когато стойността на коефициента е 0, няма линейна връзка между извадките.

Помислете как да използвате Excel, за да намерите коефициента на корелация.

Функцията CORREL се използва за намиране на сдвоените коефициенти.

Задача: Установете дали има връзка между времето на работа на струг и разходите за неговата поддръжка.

Поставете курсора в произволна клетка и натиснете бутона fx.

  1. В категорията "Статистически" изберете функцията CORREL.
  2. Аргумент "Масив 1" - първият диапазон от стойности - времето на машината: A2: A14.
  3. Аргумент "Масив 2" - вторият диапазон от стойности - цената на ремонта: B2:B14. Натиснете OK.

За да определите вида на връзката, трябва да погледнете абсолютното число на коефициента (всяка сфера на дейност има своя собствена скала).

За корелационен анализ на няколко параметъра (повече от 2) е по-удобно да използвате "Анализ на данни" (добавка "Пакет за анализ"). В списъка трябва да изберете корелация и да посочите масив. Всичко.

Получените коефициенти ще бъдат показани в корелационната матрица. Като този:

Корелационно-регресионен анализ

На практика тези две техники често се използват заедно.

Пример:


Сега данните от регресионния анализ са видими.

AT превъзходенима още по-бърз и удобен начин за начертаване на линейна регресия (и дори основните видове нелинейни регресии, вижте по-долу). Това може да стане по следния начин:

1) изберете колони с данни хи Y(трябва да са в този ред!);

2) обаждане Съветник за диаграмии изберете в група Типпунктирани веднага натиснете Готов;

3) без да премахвате отметката от диаграмата, изберете елемента от главното меню, който се появява Диаграма, в който трябва да изберете елемента Добавяне на тренд линия;

4) в диалоговия прозорец, който се появява тренд линияраздел Типизбирам Линеен;

5) раздел Настроикипревключвателят може да се активира Покажете уравнението на диаграмата, което ще ви позволи да видите уравнението на линейната регресия (4.4), в което ще бъдат изчислени коефициентите (4.5).

6) В същия раздел можете да активирате превключвателя Поставете върху диаграмата стойността на апроксимационната увереност (R^2). Тази стойност е квадрат на корелационния коефициент (4.3) и показва колко добре изчисленото уравнение описва експерименталната зависимост. Ако Р 2 е близо до единица, тогава теоретичното регресионно уравнение описва добре експерименталната зависимост (теорията се съгласува добре с експеримента) и ако Р 2 е близо до нула, тогава това уравнение не е подходящо за описание на експерименталната зависимост (теорията не е в съответствие с експеримента).

В резултат на извършване на описаните действия ще получите диаграма с регресионна графика и нейното уравнение.

§4.3. Основни видове нелинейна регресия

Параболична и полиномиална регресия.

Параболичензависимост на стойността Yот стойността хзависимостта, изразена чрез квадратична функция (парабола от 2-ри ред), се нарича:

Това уравнение се нарича параболична регресия Yна х. Настроики а, b, сНаречен коефициенти на параболична регресия. Изчисляването на коефициентите на параболична регресия винаги е тромаво, така че се препоръчва използването на компютър за изчисления.

Уравнение (4.8) на параболична регресия е специален случай на по-обща регресия, наречена полином. полиномзависимост на стойността Yот стойността хсе нарича зависимостта, изразена от полинома н-та поръчка:

къде са числата a i (аз=0,1,…, н) са наречени коефициенти на полиномна регресия.

Силова регресия.

Мощностзависимост на стойността Yот стойността хсе нарича зависимост на формата:

Това уравнение се нарича уравнение на степенна регресия Yна х. Настроики аи bНаречен коефициенти на регресия на мощността.

ln=ln а+bвътре х. (4.11)

Това уравнение описва права линия в равнината с логаритмични координатни оси ln хи л.н. Следователно критерият за приложимостта на степенната регресия е изискването точките на логаритмите на емпиричните данни ln x iи л.н азбяха най-близо до правата линия (4.11).

експоненциална регресия.

примерен(или експоненциален) зависимост от количеството Yот стойността хсе нарича зависимост на формата:

(или ). (4.12)

Това уравнение се нарича експоненциално уравнение(или експоненциален) регресия Yна х. Настроики а(или к) и bНаречен експоненциален(или експоненциален) регресия.

Ако вземем логаритъма от двете страни на уравнението за степенна регресия, получаваме уравнението

ln = хвътре а+вн b(или ln = k x+вн b). (4.13)

Това уравнение описва линейната зависимост на логаритъма на една величина ln от друга величина х. Следователно, критерият за приложимостта на степенната регресия е изискването емпиричните данни да са с еднаква величина x iи логаритми с друга стойност ln азбяха най-близо до правата линия (4.13).

логаритмична регресия.

Логаритмичензависимост на стойността Yот стойността хсе нарича зависимост на формата:

=а+bвътре х. (4.14)

Това уравнение се нарича логаритмична регресия Yна х. Настроики аи bНаречен коефициенти на логаритмична регресия.

хиперболична регресия.

Хиперболичнозависимост на стойността Yот стойността хсе нарича зависимост на формата:

Това уравнение се нарича уравнение на хиперболична регресия Yна х. Настроики аи bНаречен коефициенти на хиперболична регресияи се определят по метода на най-малките квадрати. Прилагането на този метод води до формулите:

Във формули (4.16-4.17) сумирането се извършва върху индекса азот едно до броя на наблюденията н.

За съжаление, в превъзходенняма функция, която изчислява коефициентите на хиперболична регресия. В случаите, когато не е известно със сигурност, че измерените стойности са свързани с обратна пропорционалност, се препоръчва да се търси уравнение на степенна регресия вместо уравнение на хиперболична регресия, така че в превъзходенима процедура за намирането му. Ако се приеме хиперболична зависимост между измерените стойности, тогава нейните коефициенти на регресия ще трябва да се изчислят с помощта на помощни изчислителни таблици и операции за сумиране по формули (4.16-4.17).

Регресионната линия е графично отражение на връзката между явленията. Можете лесно да изградите регресионна линия в Excel.

За целта са ви необходими:

1. Отворете програмата Excel

2. Създайте колони с данни. В нашия пример ще изградим регресионна линия или връзка между агресивността и неувереността в себе си при първокласниците. Експериментът включва 30 деца, данните са представени в таблицата на Excel:

1 колона - номер на предмета

2 колона - агресивноств точки

3 колона - липса на самочувствиев точки

3. След това трябва да изберете двете колони (без името на колоната), натиснете раздела вмъкнете , избирам точка , и от предложените оформления изберете най-първото точка с маркери .

4. Така че имаме празно място за регресионната линия - т.нар. точкова диаграма. За да отидете на линията на регресия, трябва да кликнете върху получената фигура, щракнете върху раздела конструктор, намерете на панела оформления на диаграми и изберете М акет9 , пише още f(x)

5. И така, имаме регресионна линия. Графиката също показва неговото уравнение и квадрата на корелационния коефициент

6. Остава да добавите името на графиката, името на осите. Също така, ако желаете, можете да премахнете легендата, да намалите броя на хоризонталните линии на мрежата (таб оформление , тогава решетка ). Основните промени и настройки се правят в раздела Оформление

Регресионната линия е построена в MS Excel. Сега може да се добави към текста на произведението.