База знаний для подготовки к ОГЭ и ЕГЭ, проверенная Российской академией наук

Описательная статистика (ОГЭ)

Описа́тельная стати́стика — раздел статистики, изучающий методы описания массивов данных. Задачей описательной статистики является поиск различных значений, эффективно характеризующих весь числовой массив данных. К ним относятся среднее арифметическое, медиана, наибольшее и наименьшее значения и другие показатели[1].

Основные понятия

  • Статистика (от лат. status — состояние, положение вещей) — это наука, которая занимается способами сбора, обработкой и анализом количественных данных, характеризующих массовые явления[2].
  • Выборка — это совокупность объектов, на основании которых проводят исследование.
  • Среднее арифметическое числового массива — отношение всех чисел массива к их количеству.
  • Медиана числового массива — это такое число , что хотя бы половина чисел массива не больше числа и хотя бы половина чисел массива не меньше числа [3].
  • Выбросы — одно или несколько чисел, которые намного больше или намного меньше всех остальных.
  • Вариационный ряд — упорядоченный набор исходных числовых данных.
  • Размах выборки — это разность между максимальным и минимальным значениями выборки числовых данных.
  • Мода выборки — это такое число из набора данных, которое встречается в списке чаще всего. Если таких частых данных несколько, то каждое из них является модой данной выборки.

Обозначения

Данные в статистических массивах часто обозначают буквами. Для чисел одного массива обычно используют одну и ту же букву с индексами — номерами. Если набор состоит из чисел, то записывают: [4].

Среднее арифметическое обозначают . Для набора из чисел .

Для наименьшего значения набора обычно используется обозначение min, а для наибольшего — max.

Статистические показатели

Среднее арифметическое 

Среднее арифметическое хорошо описывает однородные массивы данных, то есть массивы, в которых величины имеют один и тот же смысл, и нет значений, которые сильно отличаются от большинства. Это самая употребительная центральная мера. Поэтому иногда среднее арифметическое называют просто средним или средним значением.

Свойства среднего арифметического

 1. Если каждое число набора увеличить (уменьшить) на одно и то же число , то среднее арифметическое набора увеличится (уменьшится) на это же число .
2. Если каждое число набора умножить на одно и то же число , то среднее арифметическое набора также умножится на число .

Медиана

Если в изучаемом числовом наборе встречаются выбросы, то в качестве среднего значения часто используют медиану.

Чтобы найти медиану числового массива, в котором чисел, нужно выполнить следующие действия:

 1. Упорядочить массив по возрастанию. Получить вариационный ряд. 
2. Если  нечётно, то медианой будет число с порядковым номером  .
3. Если  чётно, то медианой будет любое из чисел с номерами  и  или любое число между ними (чаще всего в качестве медианы берут среднее арифметическое этих чисел).

Пример 1.

Пусть  дан числовой набор . Вариационный ряд данного набора: . Так как в наборе нечётное количество чисел, то медианой является число, стоящее посередине, то есть .

Пример 2.

Пусть  дан числовой набор . Вариационный ряд данного набора: . Так как в наборе чётное количество чисел, то медианой может быть среднее арифметическое двух чисел, стоящих посередине, то есть .

Достоинство медианы — устойчивость относительно выбросов. Медиана в случаях выбросов лучше описывает набор, чем среднее арифметическое. Недостатки медианы — для её поиска приходится упорядочивать набор и отбрасывать все значения, кроме одного-двух. Таким образом, теряется много полезной информации о массиве данных.

Меры рассеивания данных

Эти показатели характеризуют степень разброса данных относительно их среднего значения или насколько далеко значения массива отклоняются от его центра[5].

Размах

Разность между наибольшим и наименьшим значениями: .

Так как размах опирается только на наименьшее и наибольшее значения, которые могут быть нетипичными или ошибочными, то для более точного описания рассеивания данных обычно используют другие меры - дисперсию и стандартное отклонение.

Отклонения

В массиве чисел отклонением числа от среднего арифметического или просто отклонением называется разность между этим числом и средним арифметическим набора. Если число меньше среднего, то его отклонение отрицательное, если число больше среднего, то его отклонение положительно.

Свойство отклонений — сумма отклонений от среднего арифметического равна нулю.

Абсолютные отклонения

Абсолютным отклонением называют модуль отклонения. Оно показывает, как далеко число отстоит от среднего арифметического, но не показывает, в какую сторону - вправо или влево.

Дисперсия

Чтобы судить о рассеивании, принято усреднять квадраты отклонений. Чем больше отклонения по модулю, тем больше будет средний квадрат отклонений.

Среднее арифметическое квадратов отклонений чисел от их среднего арифметического называется дисперсией набора чисел. Более коротко: дисперсия - это средний квадрат отклонений.

.

Стандартное отклонение

Стандартным отклонением числового массива называется квадратный корень из дисперсии этого массива. Квадратный корень из среднего квадрата называют средним квадратичным. Таким образом, стандартное отклонение — это среднее квадратичное отклонение от среднего арифметического.

.

Частоты значений в массивах данных

Если в наборе всего  чисел, и значения, равные , встречаются  раз. Частотой значения  называется отношение .
Свойство частот — в любом наборе сумма частот значений равна единице.

Связь между частотами значений и средним арифметическим

Теорема. Пусть в наборе чисел, но среди них только различных значений . Пусть значение встречается раз, значение встречается раз, и т. д.: значение встречается ровно раз. Тогда среднее арифметическое набора равно сумме произведений значений и их частот:

.

Доказательство теоремы.

Составим сумму из произведений различных чисел и их частот: . 

Получили среднее арифметическое. Теорема доказана.

Группировка данных и гистограммы

Группировку данных применяют для того, чтобы представить, насколько плотно распределены значения на каждом участке числовой прямой. Чтобы сгруппировать данные, нужно разбить числовую прямую на одинаковые промежутки — интервалы группировки. Длина интервала называется шагом группировки. Затем подсчитывают долю значений в каждом интервале. Получаются частоты значений в интервалах. По полученным данным строят диаграмму частот — гистограмму. Пример гистограммы представлен на рисунке ниже.

Динамика численности населения России с 1800 по 2012 гг.

Заключение

Описательная статистика выступает краеугольным инструментом анализа данных, обеспечивая эффективное их суммирование и представление. Она закладывает основу для последующих этапов статистического анализа и обоснованного принятия решений на базе эмпирических данных.

Примечания

  1. Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко. — М.: Просвещение, 2023. — С. 33. — 177 с.
  2. Мерзляк А. Г., Полонский В.Б., Якир М.С. Математика : новый полный справочник для подготовки к ОГЭ / А.Г. Мерзляк. — М.: Издательство АСТ, 2019. — С. 255. — 477 с.
  3. Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко  . — М.: Просвещение, 2023. — С. 36. — 177 с.
  4. Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко. — М.: Просвещение, 2023. — С. 44. — 177 с.
  5. Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко. — М.: Просвещение, 2023. — С. 155. — 177 с.

Литература

Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко. — М.: Просвещение, 2023. — 177 с.

Мерзляк А. Г., Полонский В.Б., Якир М.С. Математика : новый полный справочник для подготовки к ОГЭ / А.Г. Мерзляк. — М.: Издательство АСТ, 2019. — С. 255-257. — 477 с.Кожухов И. Б., Прокофьев А.А. Математика. Полный справочник. — М.: Махаон, 2008. — С. 332-339. — 352 с.