Z-оценка

Z-оценка (англ. z-score, также стандартная оценка) — в статистике это число стандартных отклонений, на которое значение наблюдаемой величины (или исходной оценки/англ. raw score — то есть фактически измеренного значения) отклоняется от среднего по рассматриваемой совокупности или выборке. Если исходная оценка выше среднего, её z-оценка положительна; если ниже — отрицательна.

Z-оценка вычисляется вычитанием среднего значения генеральной совокупности из индивидуального значения и последующим делением на стандартное отклонение для совокупности. Этот процесс называется стандартизацией или нормированием (впрочем, термин «нормирование» также используется для иных видов отношения; подробнее см. Нормализация (статистика)).

Чаще всего такие значения называют именно z-оценками (или по-английски «z-score»); эти термины взаимозаменяемы. Существуют и другие синонимы: z-значение, z-статистика, нормальная оценка, стандартизированная переменная и англ. pull (в физике высоких энергий)^[1]^[2].

Для вычисления z-оценки необходимо знать среднее и стандартное отклонение полной совокупности, к которой относится наблюдение; если доступны только данные выборки, то аналогичная величина, вычисленная по среднему и стандартному отклонению выборки, называется t-статистикой.

Если известны среднее значение и стандартное отклонение по генеральной совокупности, исходная оценка x переводится в стандартную оценку по формуле^[3]:

z={x-\mu  \over \sigma }

где:

μ — математическое ожидание генеральной совокупности,

σ — стандартное отклонение генеральной совокупности.

Абсолютное значение z отражает расстояние между данным значением x и средним совокупности в единицах стандартного отклонения. z отрицательно, если значение ниже среднего, и положительно — если выше.

Для применения этой формулы требуется использовать именно параметры совокупности (не выборки), что на практике редко возможно, кроме ситуаций вроде стандартизированного тестирования, где измеряется вся совокупность.

Если среднее и стандартное отклонение совокупности неизвестны, стандартную оценку могут аппроксимировать с помощью средних и стандартных отклонений по выборке^[4]^[5]^[6]^[7]:

z={x-{\bar {x}} \over S}

где:

{\bar {x}}

— среднее по выборке,

S — стандартное отклонение по выборке.

Хотя этот момент следовало бы явно указывать, различие между использованием параметров выборки или совокупности зачастую не проводится. В любом случае, числитель и знаменатель выражаются в одних и тех же единицах, поэтому результат безразмерен.

Z-тест

Z-оценка используется в z-тесте при стандартизированном тестировании — аналоге t-критерия Стьюдента для случая, когда параметры совокупности известны, а не оцениваются. Поскольку на практике параметры известны редко, t-критерий куда более распространён.

Предсказательные интервалы

Стандартная оценка применяется для вычисления интервалов прогнозирования. Прогнозный интервал [L, U] — это диапазон, такой что будущая оценка X с высокой вероятностью $\gamma$ попадёт в него:

P(L<X<U)=\gamma ,

Для стандартной оценки Z величины X это выражается так:^[8]

P\left({\frac {L-\mu }{\sigma }}<Z<{\frac {U-\mu }{\sigma }}\right)=\gamma .

Выбирая квантиль z по уравнению

P\left(-z<Z<z\right)=\gamma

получаем:

L=\mu -z\sigma ,\ U=\mu +z\sigma

Контроль технологических процессов

В задачах контроля процессов значение Z позволяет количественно оценивать степень отклонения процесса от целевого значения.

Сравнение баллов, измеренных в разных шкалах: SAT и ACT

Если результаты получены в разных шкалах, они могут быть переведены в z-оценки для облегчения сравнения. Dietz и соавт^[9]. приводят следующий пример сравнения баллов студентов на экзаменах SAT и ACT. В таблице указаны средние и стандартные отклонения для обоих экзаменов. Предположим, студент A набрал 1800 баллов на SAT, а студент B — 24 балла на ACT. Кто из них выступил относительно других тестируемых лучше?

	SAT	ACT
Среднее значение	1500	21
Стандартное отклонение	300	5

Для студента A z-оценка: $z={x-\mu \over \sigma }={1800-1500 \over 300}=1$

Для студента B: $z={x-\mu \over \sigma }={24-21 \over 5}=0,6$

Поскольку z-оценка студента A выше, его результат был лучше по сравнению с одногруппниками, чем у студента B.

Процент наблюдений ниже заданной z-оценки

В продолжение этого примера, если предположить, что баллы SAT и ACT имеют нормальное распределение (что приближённо верно), то z-оценки позволяют вычислить процент испытуемых, результат которых ниже, чем у студентов A и B.

Кластерный анализ и многомерное шкалирование

«Для некоторых многомерных техник, таких как многомерное шкалирование и кластерный анализ, концепция расстояния между объектами данных очень важна… Когда переменные имеют разные шкалы измерения, разумнее вычислять расстояния после их стандартизации.»^[10]

Анализ главных компонент

В анализе главных компонент часто производится стандартизация переменных с разными шкалами или существенно различающимися диапазонами^[11].

Сравнительная значимость переменных в множественной регрессии: стандартизированные коэффициенты регрессии

Стандартизация переменных до множественной регрессии иногда используется для облегчения интерпретации^[12]. (стр. 95) отмечают:

«Стандартизированный коэффициент наклона регрессии — это наклон в уравнении регрессии при стандартизированных X и Y… Стандартизация X и Y — это вычитание из каждого значения своего среднего и деление результата на стандартное отклонение… В многомерной регрессии стандартизированные коэффициенты оценивают относительный вклад каждой переменной X.»

Однако Кутнер и др^[13]. (стр. 278) предупреждают: «… нужно с осторожностью интерпретировать любые коэффициенты регрессии, и стандартизованные в том числе. Если предикторы взаимосвязаны между собой, значения коэффициентов зависят от других переменных, включённых в модель… Величины стандартизованных коэффициентов зависят не только от корреляций между предикторами, но и от распределения наблюдений по каждой переменной, а эти распределения могут быть произвольными. Обычно не рекомендуется рассматривать величины стандартизованных коэффициентов как меру сравнительной значимости переменных-предикторов.»

В математической статистике случайная величина X стандартизируется вычитанием её математического ожидания $\operatorname {E} [X]$ и делением на стандартное отклонение $\sigma (X)={\sqrt {\operatorname {Var} (X)}}:$

Z={X-\operatorname {E} [X] \over \sigma (X)}

Если рассматриваемая переменная — это выборочное среднее случайной выборки $X_{1},\dots ,X_{n}$ из X:

{\bar {X}}={1 \over n}\sum _{i=1}^{n}X_{i}

то стандартизированное среднее вычисляется так:

Z={\frac {{\bar {X}}-\operatorname {E} [{\bar {X}}]}{\sigma (X)/{\sqrt {n}}}}

Где дисперсия выборочного среднего рассчитывается следующим образом:

{\begin{array}{l}\operatorname {Var} \left(\sum x_{i}\right)=\sum \operatorname {Var} (x_{i})=n\operatorname {Var} (x_{i})=n\sigma ^{2}\\\operatorname {Var} ({\overline {X}})=\operatorname {Var} \left({\frac {\sum x_{i}}{n}}\right)={\frac {1}{n^{2}}}\operatorname {Var} \left(\sum x_{i}\right)={\frac {n\sigma ^{2}}{n^{2}}}={\frac {\sigma ^{2}}{n}}\end{array}}

В области образовательных измерений T-оценка — это такая стандартная оценка Z, смещённая и отмасштабированная так, чтобы среднее было 50, а стандартное отклонение — 10^[14]^[15]^[16].

В диагностике минеральной плотности кости T-оценка — это стандартная оценка результата относительно распределения значений у здоровых 30-летних взрослых, со средним 0 и стандартным отклонением 1^[17].

↑ 2015 European School of High-Energy Physics: Bansko, Bulgaria 02 - 15 Sep 2015. — Geneva : CERN, 2017. — ISBN 978-92-9083-472-4.
↑ Gross, Eilam (6 ноября 2017). “Practical Statistics for High Energy Physics”. CERN Yellow Reports: School Proceedings [англ.]. 4/2017: 165—186. DOI:10.23730/CYRSP-2017-004.165.
↑ E. Kreyszig. Advanced Engineering Mathematics. — Fourth. — Wiley, 1979. — P. 880, eq. 5. — ISBN 0-471-02140-7.
↑ Spiegel, Murray R. Schaum's Outlines Statistics / Murray R. Spiegel, Larry J Stephens. — Fourth. — McGraw Hill, 2008. — ISBN 978-0-07-148584-5.
↑ Mendenhall, William. Statistics for Engineering and the Sciences / William Mendenhall, Terry Sincich. — Fifth. — Pearson / Prentice Hall, 2007. — ISBN 978-0131877061.
↑ Glantz, Stanton A. Primer of Applied Regression & Analysis of Variance / Stanton A. Glantz, Bryan K. Slinker, Torsten B. Neilands. — Third. — McGraw Hill, 2016. — ISBN 978-0071824118.
↑ Aho, Ken A. Foundational and Applied Statistics for Biologists. — First. — Chapman & Hall / CRC Press, 2014. — ISBN 978-1439873380.
↑ E. Kreyszig. Advanced Engineering Mathematics. — Fourth. — Wiley, 1979. — P. 880, eq. 6. — ISBN 0-471-02140-7.
↑ Diez, David. OpenIntro Statistics / David Diez, Christopher Barr, Mine Çetinkaya-Rundel. — Second. — openintro.org, 2012.
↑ Everitt, Brian. An Introduction to Applied Multivariate Analysis with R / Brian Everitt, Torsten J Hothorn. — Springer, 2011. — ISBN 978-1441996497.
↑ Johnson, Richard. Applied Multivariate Statistical Analysis / Richard Johnson, Wichern Wichern. — Pearson / Prentice Hall, 2007.
↑ Afifi, Abdelmonem. Practical Multivariate Analysis / Abdelmonem Afifi, Susanne K. May, Virginia A. Clark. — Fifth. — Chapman & Hall/CRC, 2012. — ISBN 978-1439816806.
↑ Kutner, Michael. Applied Linear Regression Models / Michael Kutner, Christopher Nachtsheim, John Neter. — Fourth. — McGraw Hill, 2004. — ISBN 978-0073014661.
↑ John Salvia. Assessment: In Special and Inclusive Education / John Salvia, James Ysseldyke, Sara Witmer. — Cengage Learning, 29 января 2009. — P. 43–. — ISBN 978-0-547-13437-6.
↑ Edward S. Neukrug. Essentials of Testing and Assessment: A Practical Guide for Counselors, Social Workers, and Psychologists / Edward S. Neukrug, R. Charles Fawcett. — Cengage Learning, 1 января 2014. — P. 133–. — ISBN 978-1-305-16183-2.
↑ Randy W. Kamphaus. Clinical Assessment of Child and Adolescent Intelligence. — Springer, 16 августа 2005. — P. 123–. — ISBN 978-0-387-26299-4.
↑ Bone Mass Measurement: What the Numbers Mean (неопр.). NIH Osteoporosis and Related Bone Diseases National Resource Center. National Institute of Health. Дата обращения: 16 июня 2024. Архивировано 19 сентября 2025 года.

Carroll, Susan Rovezzi. Statistics Made Simple for School Leaders / Susan Rovezzi Carroll, David J. Carroll. — illustrated. — Rowman & Littlefield, 2002. — ISBN 978-0-8108-4322-6.
Larsen, Richard J. An Introduction to Mathematical Statistics and Its Applications / Richard J. Larsen, Morris L. Marx. — Third. — Prentice Hall, 2000. — P. 282. — ISBN 0-13-922303-7.

Калькулятор Z-оценки

[1] 2015 European School of High-Energy Physics: Bansko, Bulgaria 02 - 15 Sep 2015. — Geneva : CERN, 2017. — ISBN 978-92-9083-472-4.

[2] Gross, Eilam (6 ноября 2017). “Practical Statistics for High Energy Physics”. CERN Yellow Reports: School Proceedings [англ.]. 4/2017: 165—186. DOI:10.23730/CYRSP-2017-004.165.

[3] E. Kreyszig. Advanced Engineering Mathematics. — Fourth. — Wiley, 1979. — P. 880, eq. 5. — ISBN 0-471-02140-7.

[SpiegelStephens2008-4] Spiegel, Murray R. Schaum's Outlines Statistics / Murray R. Spiegel, Larry J Stephens. — Fourth. — McGraw Hill, 2008. — ISBN 978-0-07-148584-5.

[Mendenhall2007-5] Mendenhall, William. Statistics for Engineering and the Sciences / William Mendenhall, Terry Sincich. — Fifth. — Pearson / Prentice Hall, 2007. — ISBN 978-0131877061.

[GlantzSlinker2016-6] Glantz, Stanton A. Primer of Applied Regression & Analysis of Variance / Stanton A. Glantz, Bryan K. Slinker, Torsten B. Neilands. — Third. — McGraw Hill, 2016. — ISBN 978-0071824118.

[Aho2014-7] Aho, Ken A. Foundational and Applied Statistics for Biologists. — First. — Chapman & Hall / CRC Press, 2014. — ISBN 978-1439873380.

[8] E. Kreyszig. Advanced Engineering Mathematics. — Fourth. — Wiley, 1979. — P. 880, eq. 6. — ISBN 0-471-02140-7.

[Diez2012-9] Diez, David. OpenIntro Statistics / David Diez, Christopher Barr, Mine Çetinkaya-Rundel. — Second. — openintro.org, 2012.

[EverittHothorn2011-10] Everitt, Brian. An Introduction to Applied Multivariate Analysis with R / Brian Everitt, Torsten J Hothorn. — Springer, 2011. — ISBN 978-1441996497.

[JohnsonWichern2007-11] Johnson, Richard. Applied Multivariate Statistical Analysis / Richard Johnson, Wichern Wichern. — Pearson / Prentice Hall, 2007.

[AfifiMayClark2012-12] Afifi, Abdelmonem. Practical Multivariate Analysis / Abdelmonem Afifi, Susanne K. May, Virginia A. Clark. — Fifth. — Chapman & Hall/CRC, 2012. — ISBN 978-1439816806.

[KutnerNachtsheim2004-13] Kutner, Michael. Applied Linear Regression Models / Michael Kutner, Christopher Nachtsheim, John Neter. — Fourth. — McGraw Hill, 2004. — ISBN 978-0073014661.

[14] John Salvia. Assessment: In Special and Inclusive Education / John Salvia, James Ysseldyke, Sara Witmer. — Cengage Learning, 29 января 2009. — P. 43–. — ISBN 978-0-547-13437-6.

[15] Edward S. Neukrug. Essentials of Testing and Assessment: A Practical Guide for Counselors, Social Workers, and Psychologists / Edward S. Neukrug, R. Charles Fawcett. — Cengage Learning, 1 января 2014. — P. 133–. — ISBN 978-1-305-16183-2.

[16] Randy W. Kamphaus. Clinical Assessment of Child and Adolescent Intelligence. — Springer, 16 августа 2005. — P. 123–. — ISBN 978-0-387-26299-4.

[17] Bone Mass Measurement: What the Numbers Mean (неопр.). NIH Osteoporosis and Related Bone Diseases National Resource Center. National Institute of Health. Дата обращения: 16 июня 2024. Архивировано 19 сентября 2025 года.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

Z-оценка

Вычисление

Применение

Z-тест

Предсказательные интервалы

Контроль технологических процессов

Сравнение баллов, измеренных в разных шкалах: SAT и ACT

Процент наблюдений ниже заданной z-оценки

Кластерный анализ и многомерное шкалирование

Анализ главных компонент

Сравнительная значимость переменных в множественной регрессии: стандартизированные коэффициенты регрессии

Стандартизация в математической статистике

T-оценка

Примечания

Литература

Ссылки

Категории