Початкові відомості про статистику
Яким тиражем слід видати підручник з алгебри для 9 класу? Чи варто певному політику висувати свою кандидатуру на чергових виборах мера? Скільки кілограмів риби та морепродуктів уживає в середньому за рік один житель України?
На ці та багато інших запитань допомагає відповідати статистика.
Статистика (від латин. status — стан) — це наука про отримання, обробку й аналіз кількісних даних, які характеризують масові явища.
Статистичне дослідження складається з кількох етапів: збирання даних, обробка даних та їх подання у зручній формі, аналіз даних, висновки та рекомендації.
Збирання даних
У статистиці сукупність об’єктів, на основі яких проводять дослідження, називають вибіркою. Варто зазначити, що статистичний висновок, заснований лише на чисельності вибірки, не завжди є достовірним. Статистики говорять, що вибірка має бути репрезентативною (від фр. representatif — показовий).
Отже, збирання даних має грунтуватися на масовості та репрезентативності вибірки. Іноді вибірка може збігатися з множиною всіх об’єктів, щодо яких проводиться дослідження.
Способи подання даних
Зібрану інформацію (сукупність даних) зручно подавати у вигляді таблиць, графіків, діаграм.
Умова. У таблиці подано результати виступів українських школярів на міжнародних математичних олімпіадах протягом 1993—2016 рр.
Розв’язання. У багатьох випадках дані зручно подавати у вигляді стовпчастої діаграми, яку ще називають гістограмою (від грец. histos — стовп і gramma — написання). Така інформація легко сприймається та добре запам’ятовується.
Інформацію також можна подавати у вигляді графіків та кругових діаграм: круг зображає загальну кількість, а кожному предмету відповідає певний сектор круга.
Аналіз даних. Середнє арифметичне
Середнє арифметичне (або просто середнє значення) сукупності даних — це сума всіх значень, поділена на їх кількість.
Умова. Визначити, скільки в середньому медалей за рік виборювали школярі України на міжнародних математичних олімпіадах за період 1993—2016 рр.
Розв’язання. Потрібно кількість усіх медалей, отриманих протягом періоду, що розглядається, поділити на кількість років. За період 1993—2016 рр. маємо:
Оскільки за рік можна виборити не більше ніж 6 медалей, то знайдене середнє значення свідчить про те, що команда України гідно виступає на цьому престижному форумі.
Середнє значення не завжди точно (адекватно) відображає ситуацію. Наприклад, якщо в країні доходи різних верств населення дуже різняться, то середній дохід на одну людину для більшості жителів може не відображати їхнього матеріального стану.
Частотна таблиця та мода
Таблицю, в якій записано значення даних та відповідні кількості їх появ, називають частотною, а числа, записані в другому рядку, — частотами.
Показник, який трапляється найчастіше, називають модою отриманих даних.
Це слово всім добре знайоме. Ми часто говоримо: «увійти в моду», «вийти з моди», «данина моди». У повсякденному житті мода означає сукупність поглядів і уподобань, яким більшість віддає перевагу в даний момент часу.
Саме мода є найважливішою характеристикою тоді, коли отримана сукупність даних не є числовою множиною.
Умова. Одна відома фірма, яка планує постачати джинси в Україну, провела опитування репрезентативної вибірки, що складалася з 500 осіб.
Розв’язання. Результати опитування:
| Розмір | XS | S | M | L | XL | XXL | XXXL |
|---|---|---|---|---|---|---|---|
| Частота | 52 | 71 | 145 | 126 | 59 | 40 | 7 |
| Відносна частота (%) | 10,4 | 14,2 | 29 | 25,2 | 11,8 | 8 | 1,4 |
Мода даної вибірки — це розмір M, і її відносна частота 29 %. Тим самим фірма отримала інформацію, що найбільшу частину обсягів постачання (приблизно 29 %) мають складати джинси розміру M.
Медіана
Число, яке стоїть посередині впорядкованої сукупності даних, називають медіаною цієї вибірки.
Умова. Сім’я вирішила зробити ремонт на кухні та цікавиться, скільки коштує один квадратний метр кахляної плитки. Вивчивши прейскурант 11 будівельних фірм, вони отримали таку інформацію (ціни записано в гривнях у порядку зростання):
Розв’язання. Середнє значення отриманої сукупності даних дорівнює 200. Проте отримані дані показують, що ціну 200 грн скоріше можна віднести до високих, ніж до середніх. Число 130 стоїть посередині впорядкованої сукупності даних. Його називають медіаною цієї вибірки. У розглядуваній ситуації саме медіана допомагає вибрати фірму із середніми цінами.
Якщо сукупність складається з парної кількості чисел, наприклад:
то «серединою» вибірки є одразу два числа: 7 і 8. Вважають, що медіана такої вибірки дорівнює їхньому середньому арифметичному: .
Середнє значення, моду та медіану називають мірами центральної тенденції отриманої сукупності даних. Ці методи можуть доповнювати один одного, і якийсь із них може точніше (адекватніше), ніж інші, відображати конкретну ситуацію.
-
Користуючись таблицею середніх річних температур повітря в окремих містах України, побудуйте відповідну стовпчасту діаграму.
-
Знайдіть міри центральної тенденції сукупності даних: 3, 3, 4, 4, 7, 7, 7, 7, 8, 8, 10.
-
Дівчата 9 класу на уроці фізкультури здавали залік зі стрибків у висоту. Учитель записав таку послідовність результатів: 105, 65, 115, 100, 105, 110, 110, 115, 110, 100, 115 (у см). Знайдіть середнє значення та медіану отриманих даних.