База знаний для подготовки к ОГЭ и ЕГЭ, проверенная Российской академией наук

Описательная статистика (ЕГЭ)

Описа́тельная стати́стика — раздел статистики, изучающий методы описания массивов данных. Задачей описательной статистики является поиск различных значений, эффективно характеризующих весь числовой массив данных. К ним относятся среднее арифметическое, медиана, наибольшее и наименьшее значения и другие показатели[1].

Основные понятия

  • Статистика (от лат. status — состояние, положение вещей) — это наука, которая занимается способами сбора, обработкой и анализом количественных данных, характеризующих массовые явления[2].
  • Среднее арифметическое числового массива — отношение всех чисел массива к их количеству.
  • Медиана числового массива — это такое число , что хотя бы половина чисел массива не больше числа и хотя бы половина чисел массива не меньше числа [3].
  • Выбросы — одно или несколько чисел, которые намного больше или намного меньше всех остальных.
  • Генеральная совокупность — множество всех объектов, подлежащее исследованию с помощью выборочного метода на распространённость какого-либо признака.
  • Выборка — это часть генеральной совокупности объектов, отобранная для исследования.
  • Объём выборки — число объектов, отобранных из генеральной совокупности для проведения случайного исследования.
  • Размах выборки — это разность между максимальным и минимальным значениями выборки числовых данных.
  • Мода — это такое число из набора данных, которое встречается в списке чаще всего. Если таких частых данных несколько, то каждое из них является модой данного набора.

Статистические показатели

Среднее арифметическое

Среднее арифметическое хорошо описывает однородные массивы данных, то есть массивы, в которых величины имеют один и тот же смысл, и нет значений, которые сильно отличаются от большинства. Это самая употребительная центральная мера. Поэтому иногда среднее арифметическое называют просто средним или средним значением.

 Среднее арифметическое обозначают . Для набора из  чисел .

Свойства среднего арифметического

 1. Если каждое число набора увеличить (уменьшить) на одно и то же число , то среднее арифметическое набора увеличится (уменьшится) на это же число .
2. Если каждое число набора умножить на одно и то же число , то среднее арифметическое набора также умножится на число .

Медиана

Если в изучаемом числовом наборе встречаются выбросы, то в качестве среднего значения часто используют медиану.

Чтобы найти медиану числового массива, в котором чисел, нужно выполнить следующие действия:

 1. Упорядочить массив по возрастанию. 
2. Если  нечётно, то медианой будет число с порядковым номером  .
3. Если  чётно, то медианой будет любое из чисел с номерами  и  или любое число между ними (чаще всего в качестве медианы берут среднее арифметическое этих чисел).

Меры рассеивания

Эти показатели характеризуют степень разброса данных относительно их среднего значения.

Размах вариации

 Разность между максимальным и минимальным значениями: .

Дисперсия набора чисел

Мера рассеивания значений числового набора относительно среднего арифметического[4]. Дисперсию числового набора обычно обозначают .

При расчётах дисперсии используется выражение . Его можно прочесть «средний квадрат без квадрата среднего».

Стандартное отклонение или среднеквадратическое отклонение

 Арифметический квадратный корень из дисперсии: .

Случайные величины

Случайная величина — это числовая функция, определённая на множестве элементарных событий случайного эксперимента[5].

Дискретная случайная величина

Это случайная величина, значения которой образуют конечную или бесконечную последовательность чисел. Для её описания используют такой показатель как математическое ожидание[6].

Математическим ожиданием дискретной случайной величины  называют сумму произведений значений этой величины на соответствующие вероятности. Математическое ожидание обозначают  или .

Непрерывная случайная величина

Это случайная величина, значения которой образуют один или несколько промежутков на числовой прямой. Распределения непрерывных случайных величин описывают с помощью функции, которая определена на множестве значений этой случайной величины — функции плотности вероятности.

Пусть — случайная величина, — отрезок числовой прямой, а событие имеет вероятность . Функция удовлетворяет двум условиям:

  1. Функция неотрицательна: для всех .
  2. Площадь фигуры, заключённой между графиком функции и осью абсцисс, равна 1.

Если функция удовлетворяет условиям 1 и 2, то эта функция является функцией плотности вероятности некоторой случайной величины . При этом для любого отрезка площадь криволинейной трапеции, ограниченной графиком функции и осью абсцисс на отрезке , равна [7]. (Рис.1).

Рис.1
  • Если в конкретной ситуации известно выражение для , с его помощью можно вычислить
вероятность попадания величины  в интервал  как .
  • Зная плотность вероятности, можно также определить наиболее вероятное значение (моду) случайной величины как максимум .
  • Среднее значение случайной величины с использованием плотности вероятности:
.

Группировка данных и гистограммы

Группировку данных применяют для того, чтобы представить, насколько плотно распределены значения на каждом участке числовой прямой. Чтобы сгруппировать данные, нужно разбить числовую прямую на одинаковые промежутки — интервалы группировки. Длина интервала называется шагом группировки. Затем подсчитывают долю значений в каждом интервале. Получаются частоты значений в интервалах. По полученным данным строят диаграмму частот — гистограмму. Пример гистограммы представлен на рисунке ниже.

Динамика численности населения России с 1800 по 2012 гг.

Заключение

Описательная статистика выступает краеугольным инструментом анализа данных, обеспечивая эффективное их суммирование и представление. Она закладывает основу для последующих этапов статистического анализа и обоснованного принятия решений на базе эмпирических данных.

Примечания

  1. Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко. — М.: Просвещение, 2023. — С. 33. — 177 с.
  2. Мерзляк А. Г., Полонский В.Б., Якир М.С. Математика : новый полный справочник для подготовки к ОГЭ / А.Г. Мерзляк. — М.: Издательство АСТ, 2019. — С. 255. — 477 с.
  3. Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко . — М.: Просвещение, 2023. — С. 36. — 177 с.
  4. Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И.В. Теория вероятностей и статистика. Экспериментальное учебное пособие для 10 и 11 классов общеобразовательных учреждений. — М.: Издательство МЦНМО, 2014. — С. 210. — 248 с.
  5. Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И.В. Теория вероятностей и статистика. Экспериментальное учебное пособие для 10 и 11 классов общеобразовательных учреждений. — М.: Издательство МЦНМО, 2014. — С. 72. — 248 с.
  6. Муравин Г. К., Муравина О. В. Алгебра и начала математического анализа. Углубленный уровень. 11 кл.: учебник. — М.: Дрофа, 2014. — С. 188-200. — 318 с.
  7. Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И.В. Теория вероятностей и статистика. Экспериментальное учебное пособие для 10 и 11 классов общеобразовательных учреждений. — М.: Издательство МЦНМО, 2014. — С. 162. — 248 с.

Литература

Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко. — М.: Просвещение, 2023. — 177 с.

Мерзляк А. Г., Полонский В.Б., Якир М.С. Математика : новый полный справочник / А.Г. Мерзляк. — М.: Издательство АСТ, 2019. — С. 255-257. — 477 с.

Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И.В. Теория вероятностей и статистика. Экспериментальное учебное пособие для 10 и 11 классов общеобразовательных учреждений. — М.: Издательство МЦНМО, 2014. — 248 с.

Муравин Г. К., Муравина О. В. Алгебра и начала математического анализа. Углубленный уровень. 11 кл.: учебник. — М.: Дрофа, 2014. — 318 с.