Распределение Парето

Распределе́ние Паре́то в теории вероятностей — двухпараметрическое семейство абсолютно непрерывных распределений, являющихся степенными. Называется по имени Вилфредо Парето. Встречается при исследовании различных явлений, в частности, социальных, экономических и физических[1]. Вне области экономики иногда называется также распределением Брэдфорда.

Что важно знать
Распределение Парето
Обозначение
Параметры  — коэффициент масштаба
Носитель
Плотность вероятности
Функция распределения
Математическое ожидание , если
Медиана
Мода
Дисперсия при
Коэффициент асимметрии при
Коэффициент эксцесса при
Дифференциальная энтропия
Производящая функция моментов не определена
Характеристическая функция

Определение

Пусть случайная величина такова, что её распределение задаётся равенством

где . Тогда говорят, что имеет распределение Парето с параметрами и . Плотность распределения Парето имеет вид

Моменты

Моменты случайной величины, имеющей распределение Парето, задаются формулой

откуда, в частности,

Приложения

Вилфредо Парето изначально использовал это распределение для описания распределения благосостояния, а также распределения дохода[2]. Его «правило 20 к 80» (которое гласит: 20 % популяции владеет 80 % богатства) однако зависит от конкретной величины , и утверждается, что фактически встречаются существенные количественные отклонения, например, данные самого Парето по Британии в его труде «Курс политической экономии» говорят, что там примерно 30 % населения владеет 70 % общего дохода.

Распределение Парето встречается не только в экономике. Можно привести следующие примеры:

  • В лингвистике распределение Парето известно под именем закона Ципфа (для разных языков показатель степени может несколько различаться, также существует небольшое отклонение от простой степенной зависимости у самых частотных слов, однако в целом степенной закон описывает это распределение достаточно хорошо). Частными проявлениями этой закономерности можно считать:
    • Зависимость абсолютной частоты слов (сколько всего раз каждое конкретное слово встретилось) в достаточно длинном тексте от ранга (порядкового номера при упорядочении слов по абсолютной частоте). Степенной характер остается вне зависимости от того, приводятся ли слова к начальной форме или берутся из текста как есть.
    • Аналогичная кривая для популярности имён.
  • Распределение размера населённых пунктов[3].

Примечания