Математика/3. Теория вероятностей и математическая статистика

Егармин П.А., Егармина Л.В., Шароглазов А.В.

Сибирский государственный технологический университет

Лесосибирский филиал, Россия

Статистическое изучение связей между явлениями
методами корреляционного и регрессионного анализа

Исследование зависимостей и взаимосвязей между объективно существующими явлениями и процессами играет значительную роль во многих науках. Оно позволяет глубже понять механизм причинно-следственных отношений. В настоящее время важно уметь количественно измерить тесноту причинно-следственных связей. Для исследования связей между процессами и явлениями широко применяется корреляционный и регрессионный анализ.

  Цель работы – на основе изучения и обобщения статистических методов корреляционного и регрессионного анализа исследовать зависимость уровня успеваемости школьников от класса обучения.

  Задачи:

-       осуществить сбор статистической информации об уровне успеваемости учеников 10 класса МОУ “СОШ №11” г. Лесосибирска на протяжении всех лет обучения (с 1 по 10 классы);

-       выполнить статистическую обработку информации, используя методы корреляционного и регрессионного анализа;

-       оценить адекватность результата и его практическое использование.

  В исследовании принимала участие параллель 9 классов (46 человек) 2005-2006 учебного года МОУ “СОШ №11” г. Лесосибирска.

На первом этапе исследования была составлена предварительная статистическая совокупность: для каждого ученика 9 класса был рассчитан средний годовой балл  на протяжении всех лет обучения.  Результаты отражены в таблице 1.

На втором этапе был рассчитан средний балл всех учеников за 1, 2…, 9 класс и получена корреляционная зависимость между факторным признаком (х) – класс обучения и результативным признаком (у) – средний балл обучения (успеваемость). Результаты представлены в таблице 2.


Таблица 1 – Расчетные данные

Ученик

Средний балл обучения (с 1 по 9 класс)

1

2

3

5

6

7

8

9

1

Балдин Д.

4,57

3,625

4,25

3,636

4

3,467

3,313

3,2

2

Ботнарь К.

3,5

3,875

3,75

3,727

4

3,467

3,47

3

3

Белоусов Т.

3,875

3,875

4,125

4,091

4,077

3,733

3,438

3,067

4

Бортникова М.

5

4,889

5

4,909

4,538

4,667

4,733

4,467

5

Васильева Т.

4,455

4,455

4,4

4,455

4,583

4,733

4,625

4,867

6

Герасимов М.

4,857

4,857

4,857

5

4,846

5

5

4,933

7

Гарманов А.

4

4,2

3,857

3,3

3,333

3,2

3,2

3

8

Дроботова Н.

4,571

4,5

4,375

4,182

4,077

3,733

3,875

3,067

9

Долгошеева А.

4,429

4,429

4,429

4,5

4,077

4,133

4,176

4

10

Ефимов Д.

3,286

3,556

3,333

3,4

3,583

3,357

3,375

3

11

Зырянова Е.

4,857

4,625

4,5

4,727

4,615

4,786

4,733

4,4

12

Захарова М.

4,6

4,6

4,7

4,727

4,364

4,2

4,235

4,133

13

Иванов В.

4,429

4,5

4,25

4,091

4,077

3,333

3,176

3,333

14

Исаев Ю.

4

3,75

3,556

3,636

3,615

3,867

3,882

3,4

15

Капитонов С.

4,143

4,5

3,75

3,909

4

3,733

3,529

3,2

16

Моисеева К.

4,714

4,429

4,571

4,636

4,308

3,933

3,824

3,643

17

Матронина К.

4,857

4,875

5

5

5

5

5

4,867

18

Степуро Т.

5

5

5

5

5

5

5

4,933

19

Сундетов Н.

4

3,75

3,778

3,455

3,231

3,133

3,353

3

20

Ушакова В.

4,714

4,5

4,5

4,636

4,231

3,733

3,824

3,333

21

Филимонов И.

4,571

4,5

4,625

4,545

4,167

3,933

3,933

3,214

22

Хабибуллин И.

4,286

4,125

3,875

3,818

3,462

3,333

3,313

3

23

Чемисов А.

4,57

4,429

4,143

4,273

4,231

4,2

4,294

4

24

Шевченко О.

4,75

4,5

4,625

4,364

4,231

4,267

4,25

4,133

25

Шароглазов А.

4,714

4,75

4,75

5

5

5

5

5

26

Щербаков И.

4,571

3,75

3,625

3,364

3,231

3,2

3,313

3,067

27

Дитковская А.

4,286

4,5

4,125

4,091

4,154

4,067

4,235

3,533

28

Меркулов А.

4,857

4,75

4,375

4,091

4,231

4,067

4,125

3,733

29

Бондаренко Н.

4,143

3,625

3,625

3,727

3,308

3,267

3,294

3,133

30

Бондаренко Ю.

4,571

4,375

4,5

4,364

4,417

4,286

4,412

4,067

31

Звягинцев А.

4,222

4,25

4,375

4,091

4

4,067

4,176

3,933

32

Кайсина Н.

4,333

4,5

4,125

4,273

3,846

3,929

3,688

3,071

33

Козлов А.

4,333

4,25

4

3,909

3,615

3,8

3,588

3,333

34

Капитан М.

3,857

4

3

3,583

3,385

3,133

3,117

2,667

35

Коробейников С.

4

4,167

4,125

3,636

3,462

3,4

3,706

3,2

36

Каверзин А.

3,625

3,625

3,625

3,4

3,308

3,2

3,353

3,2

37

Лозовская Н.

3,833

4

3,714

3,818

3,692

3,867

4

3,667

38

Мухаметшин Р.

4,667

4,625

4,625

3,909

4,154

3,867

3,823

3,467

39

Нехорошев Д.

3,5

3,375

3,5

3,455

3,308

3,067

3,353

3,133

40

Раченко А.

3,75

3,875

4

4

3,846

3,4

3,294

3

41

Тимук Д.

4

4

4,222

3,364

4,538

3,467

3,765

3,533

42

Филимонова Т.

4,5

4,375

4,375

4,091

4

4,267

4,125

3,267

43

Черноусов Г.

5

4,875

4,375

3,923

3,769

4,071

4,294

4,133

44

Шарафутдинова Д.

4,286

4,375

4,125

4,091

4,083

3,692

3,867

3,2

45

Юсупов Р.

3,833

3,75

3,625

3,364

3,538

3,333

3,294

3

                                                               Таблица 2 – Средний балл учеников

x

1

2

3

4

5

6

7

8

9

y

4,317

4,256

4,170

-

4,064

3,999

3,863

3,888

3,581

Рисунок 1 - Зависимость среднего балла учеников от класса обучения

 На третьем этапе был рассчитан показатель тесноты корреляционной связи – линейный коэффициент корреляции r = -0,958. Согласно которому связь между изучаемыми явлениями является обратной, сильной.

На следующем этапе было составлено уравнение регрессии для рассматриваемой корреляционной зависимости. Согласно графической интерпретации результатов исследования (рисунок 1) для математического описания статистической зависимости необходимо воспользоваться линейным уравнением регрессии: . Уравнение регрессионной модели для нашего случая примет вид:.

Далее была построена статистическая таблица, в которой указаны значения факторного признака х (класс обучения), эмпирические значения результативного признака y, теоретические значения результативного признака у. Кроме того, в таблицу были добавлены результаты успеваемости за 1 полугодие 10 класса и спрогнозирована успеваемость школьников на 10,11 классы обучения.

Таблица 3 – Практическое использование построенной модели

х

y (эмпирические)

у (теоретические)

1

4,317

4,346

2

4,256

4,267

3

4,170

4,188

5

4,064

4,030

6

3,999

3,954

7

3,863

3,872

8

3,888

3,793

9

3,581

3,714

10

3,894

3,635

11

 

3,556

Рисунок 2 - Эмпирическая и теоретическая линии регрессии

  Результаты показывают, что с 1 по 9 класс эмпирические и теоретические данные очень близки, достаточно большое расхождение наблюдается по данным за 10 класс. Это связано с тем, что число учеников, принимавших участие в эксперименте, сократилось с 45 до 20 человек, обучение в 10 классе продолжили школьники со средними и высокими способностями.

Таким образом, в нашем исследовании мы изучили статистический метод корреляционного и регрессионного анализа, обобщили его и исследовали зависимость уровня успеваемости школьников от класса обучения (с увеличением класса обучения успеваемость школьников снижается). Результаты исследования могут быть использованы в своей работе педагогами, администрацией школы, родителями и учениками.

Список литературы

 

1.     Гмурман В. Е. Теория вероятностей и математическая статистика. Учеб. пособие для вузов. – Изд. 7-е. – М.: Высш. шк., 2001. – 479 с.

2.     Гусаров В. М. Статистика: Учеб. пособие для вузов. – М.: ЮНИТИ-ДАНА, 2002. – 463 с.

3.     Елисеева И. И., Юзбашев М. М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. – 4-е изд. – М.: Финансы и статистика, 2001. – 480 с.

4.     Ефимова М. Р.,  Ганченко О. И., Петрова Е. В. Практикум по общей теории статистики: Учеб. пособие. – М.: Финансы и статистика, 2000. – 280 с.