Z-оценка
Z-оценка (англ. z-score, также стандартная оценка) — в статистике это число стандартных отклонений, на которое значение наблюдаемой величины (или исходной оценки/англ. raw score — то есть фактически измеренного значения) отклоняется от среднего по рассматриваемой совокупности или выборке. Если исходная оценка выше среднего, её z-оценка положительна; если ниже — отрицательна.
Z-оценка вычисляется вычитанием среднего значения генеральной совокупности из индивидуального значения и последующим делением на стандартное отклонение для совокупности. Этот процесс называется стандартизацией или нормированием (впрочем, термин «нормирование» также используется для иных видов отношения; подробнее см. Нормализация (статистика)).
Чаще всего такие значения называют именно z-оценками (или по-английски «z-score»); эти термины взаимозаменяемы. Существуют и другие синонимы: z-значение, z-статистика, нормальная оценка, стандартизированная переменная и англ. pull (в физике высоких энергий)[1][2].
Для вычисления z-оценки необходимо знать среднее и стандартное отклонение полной совокупности, к которой относится наблюдение; если доступны только данные выборки, то аналогичная величина, вычисленная по среднему и стандартному отклонению выборки, называется t-статистикой.
Вычисление
Если известны среднее значение и стандартное отклонение по генеральной совокупности, исходная оценка x переводится в стандартную оценку по формуле[3]:
где:
- μ — математическое ожидание генеральной совокупности,
- σ — стандартное отклонение генеральной совокупности.
Абсолютное значение z отражает расстояние между данным значением x и средним совокупности в единицах стандартного отклонения. z отрицательно, если значение ниже среднего, и положительно — если выше.
Для применения этой формулы требуется использовать именно параметры совокупности (не выборки), что на практике редко возможно, кроме ситуаций вроде стандартизированного тестирования, где измеряется вся совокупность.
Если среднее и стандартное отклонение совокупности неизвестны, стандартную оценку могут аппроксимировать с помощью средних и стандартных отклонений по выборке[4][5][6][7]:
где:
- — среднее по выборке,
- S — стандартное отклонение по выборке.
Хотя этот момент следовало бы явно указывать, различие между использованием параметров выборки или совокупности зачастую не проводится. В любом случае, числитель и знаменатель выражаются в одних и тех же единицах, поэтому результат безразмерен.
Применение
Z-оценка используется в z-тесте при стандартизированном тестировании — аналоге t-критерия Стьюдента для случая, когда параметры совокупности известны, а не оцениваются. Поскольку на практике параметры известны редко, t-критерий куда более распространён.
Стандартная оценка применяется для вычисления интервалов прогнозирования. Прогнозный интервал [L, U] — это диапазон, такой что будущая оценка X с высокой вероятностью попадёт в него:
Для стандартной оценки Z величины X это выражается так:[8]
Выбирая квантиль z по уравнению
получаем:
В задачах контроля процессов значение Z позволяет количественно оценивать степень отклонения процесса от целевого значения.
Если результаты получены в разных шкалах, они могут быть переведены в z-оценки для облегчения сравнения. Dietz и соавт[9]. приводят следующий пример сравнения баллов студентов на экзаменах SAT и ACT. В таблице указаны средние и стандартные отклонения для обоих экзаменов. Предположим, студент A набрал 1800 баллов на SAT, а студент B — 24 балла на ACT. Кто из них выступил относительно других тестируемых лучше?
| SAT | ACT | |
|---|---|---|
| Среднее значение | 1500 | 21 |
| Стандартное отклонение | 300 | 5 |
Для студента A z-оценка:
Для студента B:
Поскольку z-оценка студента A выше, его результат был лучше по сравнению с одногруппниками, чем у студента B.
В продолжение этого примера, если предположить, что баллы SAT и ACT имеют нормальное распределение (что приближённо верно), то z-оценки позволяют вычислить процент испытуемых, результат которых ниже, чем у студентов A и B.
«Для некоторых многомерных техник, таких как многомерное шкалирование и кластерный анализ, концепция расстояния между объектами данных очень важна… Когда переменные имеют разные шкалы измерения, разумнее вычислять расстояния после их стандартизации.»[10]
В анализе главных компонент часто производится стандартизация переменных с разными шкалами или существенно различающимися диапазонами[11].
Сравнительная значимость переменных в множественной регрессии: стандартизированные коэффициенты регрессии
Стандартизация переменных до множественной регрессии иногда используется для облегчения интерпретации[12]. (стр. 95) отмечают:
«Стандартизированный коэффициент наклона регрессии — это наклон в уравнении регрессии при стандартизированных X и Y… Стандартизация X и Y — это вычитание из каждого значения своего среднего и деление результата на стандартное отклонение… В многомерной регрессии стандартизированные коэффициенты оценивают относительный вклад каждой переменной X.»
Однако Кутнер и др[13]. (стр. 278) предупреждают: «… нужно с осторожностью интерпретировать любые коэффициенты регрессии, и стандартизованные в том числе. Если предикторы взаимосвязаны между собой, значения коэффициентов зависят от других переменных, включённых в модель… Величины стандартизованных коэффициентов зависят не только от корреляций между предикторами, но и от распределения наблюдений по каждой переменной, а эти распределения могут быть произвольными. Обычно не рекомендуется рассматривать величины стандартизованных коэффициентов как меру сравнительной значимости переменных-предикторов.»
Стандартизация в математической статистике
В математической статистике случайная величина X стандартизируется вычитанием её математического ожидания и делением на стандартное отклонение
Если рассматриваемая переменная — это выборочное среднее случайной выборки из X:
то стандартизированное среднее вычисляется так:
Где дисперсия выборочного среднего рассчитывается следующим образом:
T-оценка
В области образовательных измерений T-оценка — это такая стандартная оценка Z, смещённая и отмасштабированная так, чтобы среднее было 50, а стандартное отклонение — 10[14][15][16].
В диагностике минеральной плотности кости T-оценка — это стандартная оценка результата относительно распределения значений у здоровых 30-летних взрослых, со средним 0 и стандартным отклонением 1[17].
Примечания
Литература
- Carroll, Susan Rovezzi. Statistics Made Simple for School Leaders / Susan Rovezzi Carroll, David J. Carroll. — illustrated. — Rowman & Littlefield, 2002. — ISBN 978-0-8108-4322-6.
- Larsen, Richard J. An Introduction to Mathematical Statistics and Its Applications / Richard J. Larsen, Morris L. Marx. — Third. — Prentice Hall, 2000. — P. 282. — ISBN 0-13-922303-7.


