Z-оценка

Z-оценка (англ. z-score, также стандартная оценка) — в статистике это число стандартных отклонений, на которое значение наблюдаемой величины (или исходной оценки/англ. raw score — то есть фактически измеренного значения) отклоняется от среднего по рассматриваемой совокупности или выборке. Если исходная оценка выше среднего, её z-оценка положительна; если ниже — отрицательна.

Z-оценка вычисляется вычитанием среднего значения генеральной совокупности из индивидуального значения и последующим делением на стандартное отклонение для совокупности. Этот процесс называется стандартизацией или нормированием (впрочем, термин «нормирование» также используется для иных видов отношения; подробнее см. Нормализация (статистика)).

Чаще всего такие значения называют именно z-оценками (или по-английски «z-score»); эти термины взаимозаменяемы. Существуют и другие синонимы: z-значение, z-статистика, нормальная оценка, стандартизированная переменная и англ. pullфизике высоких энергий)[1][2].

Для вычисления z-оценки необходимо знать среднее и стандартное отклонение полной совокупности, к которой относится наблюдение; если доступны только данные выборки, то аналогичная величина, вычисленная по среднему и стандартному отклонению выборки, называется t-статистикой.

Вычисление

Если известны среднее значение и стандартное отклонение по генеральной совокупности, исходная оценка x переводится в стандартную оценку по формуле[3]:

где:

μ — математическое ожидание генеральной совокупности,
σ — стандартное отклонение генеральной совокупности.

Абсолютное значение z отражает расстояние между данным значением x и средним совокупности в единицах стандартного отклонения. z отрицательно, если значение ниже среднего, и положительно — если выше.

Для применения этой формулы требуется использовать именно параметры совокупности (не выборки), что на практике редко возможно, кроме ситуаций вроде стандартизированного тестирования, где измеряется вся совокупность.

Если среднее и стандартное отклонение совокупности неизвестны, стандартную оценку могут аппроксимировать с помощью средних и стандартных отклонений по выборке[4][5][6][7]:

где:

 — среднее по выборке,
S — стандартное отклонение по выборке.

Хотя этот момент следовало бы явно указывать, различие между использованием параметров выборки или совокупности зачастую не проводится. В любом случае, числитель и знаменатель выражаются в одних и тех же единицах, поэтому результат безразмерен.

Применение

Z-тест

Z-оценка используется в z-тесте при стандартизированном тестировании — аналоге t-критерия Стьюдента для случая, когда параметры совокупности известны, а не оцениваются. Поскольку на практике параметры известны редко, t-критерий куда более распространён.

Предсказательные интервалы

Стандартная оценка применяется для вычисления интервалов прогнозирования. Прогнозный интервал [L, U] — это диапазон, такой что будущая оценка X с высокой вероятностью попадёт в него:

Для стандартной оценки Z величины X это выражается так:[8]

Выбирая квантиль z по уравнению

получаем:

Контроль технологических процессов

В задачах контроля процессов значение Z позволяет количественно оценивать степень отклонения процесса от целевого значения.

Сравнение баллов, измеренных в разных шкалах: SAT и ACT

undefined

Если результаты получены в разных шкалах, они могут быть переведены в z-оценки для облегчения сравнения. Dietz и соавт[9]. приводят следующий пример сравнения баллов студентов на экзаменах SAT и ACT. В таблице указаны средние и стандартные отклонения для обоих экзаменов. Предположим, студент A набрал 1800 баллов на SAT, а студент B — 24 балла на ACT. Кто из них выступил относительно других тестируемых лучше?

SAT ACT
Среднее значение 1500 21
Стандартное отклонение 300 5
undefined

Для студента A z-оценка:

Для студента B:

Поскольку z-оценка студента A выше, его результат был лучше по сравнению с одногруппниками, чем у студента B.

Процент наблюдений ниже заданной z-оценки

В продолжение этого примера, если предположить, что баллы SAT и ACT имеют нормальное распределение (что приближённо верно), то z-оценки позволяют вычислить процент испытуемых, результат которых ниже, чем у студентов A и B.

Кластерный анализ и многомерное шкалирование

«Для некоторых многомерных техник, таких как многомерное шкалирование и кластерный анализ, концепция расстояния между объектами данных очень важна… Когда переменные имеют разные шкалы измерения, разумнее вычислять расстояния после их стандартизации.»[10]

Анализ главных компонент

В анализе главных компонент часто производится стандартизация переменных с разными шкалами или существенно различающимися диапазонами[11].

Сравнительная значимость переменных в множественной регрессии: стандартизированные коэффициенты регрессии

Стандартизация переменных до множественной регрессии иногда используется для облегчения интерпретации[12]. (стр. 95) отмечают:

«Стандартизированный коэффициент наклона регрессии — это наклон в уравнении регрессии при стандартизированных X и Y… Стандартизация X и Y — это вычитание из каждого значения своего среднего и деление результата на стандартное отклонение… В многомерной регрессии стандартизированные коэффициенты оценивают относительный вклад каждой переменной X.»

Однако Кутнер и др[13]. (стр. 278) предупреждают: «… нужно с осторожностью интерпретировать любые коэффициенты регрессии, и стандартизованные в том числе. Если предикторы взаимосвязаны между собой, значения коэффициентов зависят от других переменных, включённых в модель… Величины стандартизованных коэффициентов зависят не только от корреляций между предикторами, но и от распределения наблюдений по каждой переменной, а эти распределения могут быть произвольными. Обычно не рекомендуется рассматривать величины стандартизованных коэффициентов как меру сравнительной значимости переменных-предикторов.»

Стандартизация в математической статистике

В математической статистике случайная величина X стандартизируется вычитанием её математического ожидания и делением на стандартное отклонение

Если рассматриваемая переменная — это выборочное среднее случайной выборки из X:

то стандартизированное среднее вычисляется так:

Где дисперсия выборочного среднего рассчитывается следующим образом:

T-оценка

В области образовательных измерений T-оценка — это такая стандартная оценка Z, смещённая и отмасштабированная так, чтобы среднее было 50, а стандартное отклонение — 10[14][15][16].

В диагностике минеральной плотности кости T-оценка — это стандартная оценка результата относительно распределения значений у здоровых 30-летних взрослых, со средним 0 и стандартным отклонением 1[17].

Примечания

  1. 2015 European School of High-Energy Physics: Bansko, Bulgaria 02 - 15 Sep 2015. — Geneva : CERN, 2017. — ISBN 978-92-9083-472-4.
  2. Gross, Eilam (6 ноября 2017). “Practical Statistics for High Energy Physics”. CERN Yellow Reports: School Proceedings [англ.]. 4/2017: 165—186. DOI:10.23730/CYRSP-2017-004.165.
  3. E. Kreyszig. Advanced Engineering Mathematics. — Fourth. — Wiley, 1979. — P. 880, eq. 5. — ISBN 0-471-02140-7.
  4. Spiegel, Murray R. Schaum's Outlines Statistics / Murray R. Spiegel, Larry J Stephens. — Fourth. — McGraw Hill, 2008. — ISBN 978-0-07-148584-5.
  5. Mendenhall, William. Statistics for Engineering and the Sciences / William Mendenhall, Terry Sincich. — Fifth. — Pearson / Prentice Hall, 2007. — ISBN 978-0131877061.
  6. Glantz, Stanton A. Primer of Applied Regression & Analysis of Variance / Stanton A. Glantz, Bryan K. Slinker, Torsten B. Neilands. — Third. — McGraw Hill, 2016. — ISBN 978-0071824118.
  7. Aho, Ken A. Foundational and Applied Statistics for Biologists. — First. — Chapman & Hall / CRC Press, 2014. — ISBN 978-1439873380.
  8. E. Kreyszig. Advanced Engineering Mathematics. — Fourth. — Wiley, 1979. — P. 880, eq. 6. — ISBN 0-471-02140-7.
  9. Diez, David. OpenIntro Statistics / David Diez, Christopher Barr, Mine Çetinkaya-Rundel. — Second. — openintro.org, 2012.
  10. Everitt, Brian. An Introduction to Applied Multivariate Analysis with R / Brian Everitt, Torsten J Hothorn. — Springer, 2011. — ISBN 978-1441996497.
  11. Johnson, Richard. Applied Multivariate Statistical Analysis / Richard Johnson, Wichern Wichern. — Pearson / Prentice Hall, 2007.
  12. Afifi, Abdelmonem. Practical Multivariate Analysis / Abdelmonem Afifi, Susanne K. May, Virginia A. Clark. — Fifth. — Chapman & Hall/CRC, 2012. — ISBN 978-1439816806.
  13. Kutner, Michael. Applied Linear Regression Models / Michael Kutner, Christopher Nachtsheim, John Neter. — Fourth. — McGraw Hill, 2004. — ISBN 978-0073014661.
  14. John Salvia. Assessment: In Special and Inclusive Education / John Salvia, James Ysseldyke, Sara Witmer. — Cengage Learning, 29 января 2009. — P. 43–. — ISBN 978-0-547-13437-6.
  15. Edward S. Neukrug. Essentials of Testing and Assessment: A Practical Guide for Counselors, Social Workers, and Psychologists / Edward S. Neukrug, R. Charles Fawcett. — Cengage Learning, 1 января 2014. — P. 133–. — ISBN 978-1-305-16183-2.
  16. Randy W. Kamphaus. Clinical Assessment of Child and Adolescent Intelligence. — Springer, 16 августа 2005. — P. 123–. — ISBN 978-0-387-26299-4.
  17. Bone Mass Measurement: What the Numbers Mean. NIH Osteoporosis and Related Bone Diseases National Resource Center. National Institute of Health. Дата обращения: 16 июня 2024. Архивировано 19 сентября 2025 года.

Литература

  • Carroll, Susan Rovezzi. Statistics Made Simple for School Leaders / Susan Rovezzi Carroll, David J. Carroll. — illustrated. — Rowman & Littlefield, 2002. — ISBN 978-0-8108-4322-6.
  • Larsen, Richard J. An Introduction to Mathematical Statistics and Its Applications / Richard J. Larsen, Morris L. Marx. — Third. — Prentice Hall, 2000. — P. 282. — ISBN 0-13-922303-7.

Ссылки

Категории