Описательная статистика (ЕГЭ)
Описа́тельная стати́стика — раздел статистики, изучающий методы описания массивов данных. Задачей описательной статистики является поиск различных значений, эффективно характеризующих весь числовой массив данных. К ним относятся среднее арифметическое, медиана, наибольшее и наименьшее значения и другие показатели[1].
Основные понятия
- Статистика (от лат. status — состояние, положение вещей) — это наука, которая занимается способами сбора, обработкой и анализом количественных данных, характеризующих массовые явления[2].
- Среднее арифметическое числового массива — отношение всех чисел массива к их количеству.
- Медиана числового массива — это такое число , что хотя бы половина чисел массива не больше числа и хотя бы половина чисел массива не меньше числа [3].
- Выбросы — одно или несколько чисел, которые намного больше или намного меньше всех остальных.
- Генеральная совокупность — множество всех объектов, подлежащее исследованию с помощью выборочного метода на распространённость какого-либо признака.
- Выборка — это часть генеральной совокупности объектов, отобранная для исследования.
- Объём выборки — число объектов, отобранных из генеральной совокупности для проведения случайного исследования.
- Размах выборки — это разность между максимальным и минимальным значениями выборки числовых данных.
- Мода — это такое число из набора данных, которое встречается в списке чаще всего. Если таких частых данных несколько, то каждое из них является модой данного набора.
Статистические показатели
Среднее арифметическое хорошо описывает однородные массивы данных, то есть массивы, в которых величины имеют один и тот же смысл, и нет значений, которые сильно отличаются от большинства. Это самая употребительная центральная мера. Поэтому иногда среднее арифметическое называют просто средним или средним значением.
Среднее арифметическое обозначают . Для набора из чисел .
1. Если каждое число набора увеличить (уменьшить) на одно и то же число , то среднее арифметическое набора увеличится (уменьшится) на это же число .
2. Если каждое число набора умножить на одно и то же число , то среднее арифметическое набора также умножится на число .
Если в изучаемом числовом наборе встречаются выбросы, то в качестве среднего значения часто используют медиану.
Чтобы найти медиану числового массива, в котором чисел, нужно выполнить следующие действия:
1. Упорядочить массив по возрастанию.
2. Если нечётно, то медианой будет число с порядковым номером .
3. Если чётно, то медианой будет любое из чисел с номерами и или любое число между ними (чаще всего в качестве медианы берут среднее арифметическое этих чисел).
Эти показатели характеризуют степень разброса данных относительно их среднего значения.
Разность между максимальным и минимальным значениями: .
Мера рассеивания значений числового набора относительно среднего арифметического[4]. Дисперсию числового набора обычно обозначают .
При расчётах дисперсии используется выражение . Его можно прочесть «средний квадрат без квадрата среднего».
Арифметический квадратный корень из дисперсии: .
Случайные величины
Случайная величина — это числовая функция, определённая на множестве элементарных событий случайного эксперимента[5].
Это случайная величина, значения которой образуют конечную или бесконечную последовательность чисел. Для её описания используют такой показатель как математическое ожидание[6].
Математическим ожиданием дискретной случайной величины называют сумму произведений значений этой величины на соответствующие вероятности. Математическое ожидание обозначают или .
Это случайная величина, значения которой образуют один или несколько промежутков на числовой прямой. Распределения непрерывных случайных величин описывают с помощью функции, которая определена на множестве значений этой случайной величины — функции плотности вероятности.
Пусть — случайная величина, — отрезок числовой прямой, а событие имеет вероятность . Функция удовлетворяет двум условиям:
- Функция неотрицательна: для всех .
- Площадь фигуры, заключённой между графиком функции и осью абсцисс, равна 1.
Если функция удовлетворяет условиям 1 и 2, то эта функция является функцией плотности вероятности некоторой случайной величины . При этом для любого отрезка площадь криволинейной трапеции, ограниченной графиком функции и осью абсцисс на отрезке , равна [7]. (Рис.1).
- Если в конкретной ситуации известно выражение для , с его помощью можно вычислить
вероятность попадания величины в интервал как .
- Зная плотность вероятности, можно также определить наиболее вероятное значение (моду) случайной величины как максимум .
- Среднее значение случайной величины с использованием плотности вероятности:
.
Группировка данных и гистограммы
Группировку данных применяют для того, чтобы представить, насколько плотно распределены значения на каждом участке числовой прямой. Чтобы сгруппировать данные, нужно разбить числовую прямую на одинаковые промежутки — интервалы группировки. Длина интервала называется шагом группировки. Затем подсчитывают долю значений в каждом интервале. Получаются частоты значений в интервалах. По полученным данным строят диаграмму частот — гистограмму. Пример гистограммы представлен на рисунке ниже.
Заключение
Описательная статистика выступает краеугольным инструментом анализа данных, обеспечивая эффективное их суммирование и представление. Она закладывает основу для последующих этапов статистического анализа и обоснованного принятия решений на базе эмпирических данных.
Примечания
- ↑ Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко. — М.: Просвещение, 2023. — С. 33. — 177 с.
- ↑ Мерзляк А. Г., Полонский В.Б., Якир М.С. Математика : новый полный справочник для подготовки к ОГЭ / А.Г. Мерзляк. — М.: Издательство АСТ, 2019. — С. 255. — 477 с.
- ↑ Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко . — М.: Просвещение, 2023. — С. 36. — 177 с.
- ↑ Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И.В. Теория вероятностей и статистика. Экспериментальное учебное пособие для 10 и 11 классов общеобразовательных учреждений. — М.: Издательство МЦНМО, 2014. — С. 210. — 248 с.
- ↑ Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И.В. Теория вероятностей и статистика. Экспериментальное учебное пособие для 10 и 11 классов общеобразовательных учреждений. — М.: Издательство МЦНМО, 2014. — С. 72. — 248 с.
- ↑ Муравин Г. К., Муравина О. В. Алгебра и начала математического анализа. Углубленный уровень. 11 кл.: учебник. — М.: Дрофа, 2014. — С. 188-200. — 318 с.
- ↑ Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И.В. Теория вероятностей и статистика. Экспериментальное учебное пособие для 10 и 11 классов общеобразовательных учреждений. — М.: Издательство МЦНМО, 2014. — С. 162. — 248 с.
Литература
Высоцкий И.Р., Ященко И.В. Вероятность и статистика. Базовый уровень. 7-9 классы. Часть 1 / под ред. И.В. Ященко. — М.: Просвещение, 2023. — 177 с.
Мерзляк А. Г., Полонский В.Б., Якир М.С. Математика : новый полный справочник / А.Г. Мерзляк. — М.: Издательство АСТ, 2019. — С. 255-257. — 477 с.
Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И.В. Теория вероятностей и статистика. Экспериментальное учебное пособие для 10 и 11 классов общеобразовательных учреждений. — М.: Издательство МЦНМО, 2014. — 248 с.
Муравин Г. К., Муравина О. В. Алгебра и начала математического анализа. Углубленный уровень. 11 кл.: учебник. — М.: Дрофа, 2014. — 318 с.





