История неравенства о среднем арифметическом, среднем геометрическом и среднем гармоническом

Первые интуитивные представления о среднем арифметическом и среднем геометрическом возникли в вавилонской и древнеегипетской математике, где они применялись в землемерных, коммерческих и астрономических расчётах. Систематическое осмысление этих понятий началось в античной Греции: пифагорейцы связали три классических средних с музыкальными интервалами, Евклид дал им геометрическое воплощение в «Началах», а Папп Александрийский сформулировал полную цепочку неравенств на едином чертеже.

Предыстория: математика Древнего Востока

Истоки понятия среднего восходят к древнейшим цивилизациям. Вавилонские математики (около 2000–1600 гг. до н. э.) умели находить среднее арифметическое и использовали его в вычислениях, связанных с распределением продовольствия, землемерными работами и астрономическими вычислениями. На клинописных табличках серии YBC 7289 обнаружены итеративные процедуры приближённого извлечения квадратных корней, в основе которых лежит идея, близкая к среднему геометрическому.[1]

Древнеегипетский Папирус Ринда (около 1650 г. до н. э.) содержит задачи на раздел ресурсов поровну и пропорциональное распределение, что свидетельствует о практике использования среднего арифметического. Но теоретически понятие средней величины в египетской математике не было оформлено.

В древнеиндийской геометрии, представленной в ритуальных текстах шульба-сутр (около VIII–V вв. до н. э.), подробно рассматривались задачи преобразования фигур с сохранением площади. Одной из классических была задача построения квадрата, равновеликого заданному прямоугольнику со сторонами и . Фактически алгоритмы сутр описывали точное геометрическое конструирование отрезка длиной , что эквивалентно нахождению среднего пропорционального[2].Хотя индийские математики того времени не оперировали абстрактными алгебраическими понятиями «средних» и не формулировали неравенств в явном виде, сами геометрические соотношения, лежащие в основе этих построений (в частности, использование полусуммы и полуразности сторон), неявно отражают фундаментальный факт: сторона искомого квадрата не превосходит полусуммы сторон исходного прямоугольника, то есть

Пифагорейская школа: три классических средних

В пифагорейской традиции теория средних величин изначально формировалась на стыке арифметики и музыкальной акустики. Уже в эпоху Пифагора выделялись три основных вида средних: арифметическое, геометрическое и «субконтрарное» (ὑπεναντία), термин, который впоследствии Архит (совместно с Гиппасом) заменил на «гармоническое»[3].

Согласно исследованиям, опирающимся на сохранившиеся компиляции, для построения этих средних пифагорейцы использовали так называемый метод пропорций: рассматривался набор из трёх чисел , обладающий тем свойством, что отношение двух их разностей равно отношению двух исходных чисел. Именно этот алгоритм традиционно приписывается Пифагору Самосскому (569–500 до н. э.)[4], хотя в современной историографии встречается и альтернативная атрибуция Евдоксу[5].

В сохранившемся фрагменте трактата Архита «О музыке» эти понятия получают строгие определения: арифметическое среднее характеризуется постоянной разностью между соседними членами, геометрическое — постоянным отношением, а гармоническое — тем свойством, что «на какую часть первое превосходит второе, на такую же часть второго превосходит третье», что в современной записи соответствует формуле [6]. Данная система средних стала математическим фундаментом пифагорейской теории музыки и нашла применение в космологических построениях школы: Филолай связывал гармоническое среднее с «геометрической гармонией» куба (12 рёбер, 8 вершин и 6 граней, где 8 выступает средним между 12 и 6)[7], а позднее Ямвлих описал открытую пифагорейцами четырёхчленную «музыкальную пропорцию» (классический пример ), которая, согласно античной традиции, восходит к вавилонским источникам и была использована Платоном в диалоге «Тимей» для описания гармонического строения мировой души[8].

Десять греческих средних

Исследование пропорционального метода показывает, что если в левой части пропорции использовать отношения разностей , или , а в правой — отношения исходных чисел и , то из 21 возможной пропорции ровно 10 дают нетривиальные средние величины[4]. В историографии существует дискуссия об авторстве этих десяти «греческих средних»: если три классических (A, G, H) прочно связываются с Пифагором, то следующие три (включая контрагармоническое) атрибутируются Евдоксу[9], а оставшиеся четыре — геометрам Темноиду и Евфранору. В то же время, Дж. Джини приписывает все семь поздних средних Никомаху[10].

Решая пропорции относительно , получаем аналитические выражения всех десяти средних (в современных обозначениях, предложенных Дж. и П. Борвейнами[11]):

  1. Арифметическое
  2. Геометрическое
  3. Гармоническое
  4. Контрагармоническое
  5. Первое контрагеометрическое
  6. Второе контрагеометрическое

Евклид: геометрические средние в «Началах»

Евклид (около 300 г. до н. э.) в своих «Началах» (Στοιχεῖα) дал геометрическое воплощение всех трёх средних без их явного именования:

Книга II, предложение 14. Построение квадрата, равновеликого данному прямоугольнику. Это конструкция среднего геометрического: сторона квадрата — это «среднее пропорциональное» между и .

Книга VI, предложение 13. Явная конструкция среднего пропорционального (геометрического среднего) двух отрезков с помощью вписанного угла: перпендикуляр из точки, разделяющей диаметр, до пересечения с полуокружностью равен .

Книга VI, предложение 17. Доказательство того, что (то есть ) эквивалентно пропорциональности отрезков. Из конструкции VI.13 непосредственно следует неравенство , поскольку высота в треугольнике, вписанном в полуокружность, не превосходит радиуса — то есть геометрическое среднее не превосходит арифметического. Евклид осознавал этот факт геометрически, хотя и не формулировал его как отдельное неравенство.

Папп Александрийский: систематизация и геометрическая интерпретация

Папп Александрийский (около 290–350 гг. н. э.) в Synagoge («Математическом собрании», книга III) дал наиболее полное античное изложение теории средних.[12] Папп: • перечислил все десять видов средних, известных к его времени (три классических пифагорейских и семь позднейших), • описал пропорциональный метод их определения, • описал геометрическую конструкцию, одновременно изображающую все три классических средних на одном чертеже, • явно указал, что для любых неравных выполняется строгое неравенство .

Конструкция Паппа состоит в следующем. Пусть — диаметр полуокружности, — точка, делящая так, что , . Тогда: • Радиус полуокружности . • Перпендикуляр из до окружности: (по свойству вписанного угла). • Отрезок , где — проекция точки на радиус ( — центр полуокружности): .

undefined

Из рисунка очевидно, что , что и даёт . Это одна из наиболее изящных геометрических иллюстраций неравенства, сохранившая свою наглядность до наших дней.

Современный анализ показывает, что среди всех десяти греческих средних справедливы только следующие глобальные неравенства[4]:

Все греческие средние являются однородными функциями первой степени и строгими средними, однако их монотонность по второму аргументу различается: если изотонны, то обладают нелинейной монотонностью (убывают на начальном интервале и возрастают далее), что отражает разнообразие античных пропорциональных конструкций[4].

Средние века: арабская и индийская традиции

В эпоху средневековья центр математической мысли переместился на Ближний Восток и в Индию[13].

Аль-Хорезми (около 780–850) в своих трактатах систематически использовал среднее арифметическое, хотя специально теорией неравенства средних не занимался[14]. Арабские переводы Евклида и Паппа сохранили знания о трёх средних и перенесли их в исламский математический мир.

Аль-Бируни (973–1048) в астрономических и географических вычислениях применял различные виды средних, понимая их различие. В частности, при усреднении угловых наблюдений он фактически использовал свойства, близкие к неравенству средних The Science of Al-Biruni. — Vol. 2. — Вып. 12. — С. 52–60.</ref>.

Насир ад-Дин ат-Туси (1201–1274) в комментариях к Евклиду подробно обсуждал конструкцию среднего геометрического и соотношение средних в геометрическом контексте[15]. В индийской средневековой математике Брахмагупта (598–668) и Бхаскара II (1114–1185) работали с различными видами средних в задачах коммерческой арифметики и астрономии, хотя строгой теории неравенства средних не развивали [16].

Возрождение и начало Нового времени

В XVI–XVII веках, с расцветом алгебры и развитием аналитической геометрии, соотношение между средними получило новое осмысление. Люка Пачоли (1445–1517) в трактате «Summa de arithmetica» (1494) систематизирует как теоретическую арифметику, так и практику коммерческих вычислений. В разделе, посвящённом «товариществам» (compagnia), он излагает правила распределения прибыли и убытков строго пропорционально вложенному капиталу и времени участия партнёров, что соответствует классическому правилу трёх и прямой пропорции. Теоретический базис трактата опирается на античную традицию пропорций. В арифметическом разделе Пачоли подробно рассматривает три классических средних величин – арифметическое, геометрическое и гармоническое, следуя пифагорейско-евклидовой классификации . Гармоническое среднее, традиционно связанное в средневековой науке с музыкальными интервалами и этическими категориями соразмерности, упоминается в контексте прогрессий и пропорциональных рядов . Однако в практических коммерческих задачах Summa распределение долей строится исключительно на прямой пропорциональности, а не на усреднении величин. Идеи аристотелевской справедливости как соразмерности, безусловно, формировали интеллектуальный фон эпохи, но Пачоли как практик опирался на отработанные алгоритмы итальянской абацистской школы [17].

Рене Декарт (1596–1650) в «Рассуждении о методе» и в приложении «Геометрия» использовал геометрические построения, неявно опирающиеся на неравенство , при решении задач на нахождение пропорциональных отрезков[18]. Конструкции Декарта для среднего пропорционального между отрезками фактически реализуют геометрическую интерпретацию неравенства между средним арифметическим и средним геометрическим, хотя и не формулируют его в алгебраическом виде[19].

Особое место занимает Пьер де Ферма (1601–1665). В задачах на нахождение экстремумов методом «адекватности» (adequality) он фактически применял идею о том, что в точке экстремума приращения функции «сглаживаются», что концептуально близко к условию равенства аргументов в неравенстве между средним арифметическим и средним геометрическим (AM–GM)[20]. Современный анализ показывает, что условие «почти равенства» у Ферма предвосхищает необходимое условие экстремума, которое в контексте неравенства AM–GM достигается именно при равенстве аргументов[21].

Христиан Гюйгенс (1629–1695), исследуя задачи теории вероятностей и вводя понятие математического ожидания в трактате «De Ratiociniis in Ludo Aleae» (1657), формализовал концепцию взвешенного среднего как суммы произведений значений на их вероятности[22]. Это определение заложило теоретические основы для взвешенной формы неравенства средних, поскольку математическое ожидание по своей структуре является взвешенным арифметическим средним, для которого справедливо обобщение неравенства AM–GM[23]. Историко-математический анализ подтверждает, что именно через работу Гюйгенса понятие взвешенного среднего вошло в математический аппарат теории вероятностей и последующих исследований неравенств[24].

XVIII век: аналитическая формализация

В XVIII веке математика движется в сторону формального анализа, и неравенство средних оказывается в центре нескольких важных разработок. Якопо Риккати (1676–1754) и другие итальянские математики исследовали свойства средних в контексте дифференциальных уравнений. Среднее геометрическое и его соотношение с арифметическим возникало при изучении разделения переменных.

Принципиальную роль сыграл Карл Фридрих Гаусс (1777–1855), который глубоко изучил арифметико-геометрическое среднее (AGM). В 1799 году Гаусс открыл, что AGM связано с эллиптическими интегралами, и развил теорию итерационного процесса

[25]

Леонард Эйлер (1707–1783) в работах по анализу, теории чисел и механике неоднократно использовал неравенства типа AM–GM. В частности, при доказательстве неравенства и родственных результатов он заложил аналитический аппарат, впоследствии использованный в доказательстве Пойа.

Жозеф Луи Лагранж (1736–1813) в «Аналитической механике» и в работах по вариационному исчислению применял принцип, согласно которому при симметричных ограничениях экстремум достигается в симметричной точке — обобщение условия равенства в неравенстве средних.

Коши: первое строгое доказательство (1821)

Поворотным моментом в истории неравенства стала монография Огюстена Луи Коши «Cours d'analyse de l'École Royale Polytechnique» (1821).[26] В «Примечании II» этой книги Коши впервые дал строгое алгебраическое доказательство неравенства для произвольного числа положительных слагаемых. Он использовал метод, вошедший в историю как «прямая и обратная индукция Коши» (forward-backward induction).

Прямой шаг: из истинности неравенства для чисел вывести его для чисел, применяя неравенство дважды и используя AM–GM для двух чисел.

Обратный шаг: из истинности для чисел вывести его для чисел, добавив дополнительное число, равное среднему арифметическому остальных. Комбинация этих двух шагов (сначала поднимаемся по степеням двойки, затем спускаемся к любому натуральному ) даёт доказательство для всех . Метод Коши стал классическим и вошёл в учебники.

Современник Коши, Симеон Дени Пуассон (1781–1840), предложил в тот же период независимое доказательство, использующее дифференциальное исчисление: фиксируя произведение и минимизируя сумму, он показал, что минимум достигается при равных значениях. Этот подход неявно предполагает теоремы о существовании экстремума.

Вторая половина XIX века: обобщения и новые подходы

После Коши теория неравенств средних развивалась сразу в нескольких направлениях.

Степенные средние. Отто Гёльдер (1859–1937) в 1889 году доказал фундаментальное неравенство Гёльдера и развил теорию степенных средних . В частности, монотонность по (которая обобщает AM–GM как частный случай и ) была установлена именно в его работах.[27]

Неравенство Йенсена. Йохан Йенсен (1859–1925) в 1906 году опубликовал статью, в которой ввёл понятие выпуклой функции и доказал общее неравенство для выпуклых функций, носящее его имя.[28] Неравенство AM–GM следует из неравенства Йенсена для функции (вогнутая) или (выпуклая). Это поставило AM–GM в один ряд с основными теоремами анализа.

Неравенство Коши — Буняковского — Шварца. Виктор Буняковский (1804–1889) и Герман Шварц (1843–1921) доказали интегральное неравенство, из которого (при соответствующей специализации) также следует AM–GM. Взаимосвязь этих неравенств была детально разработана в конце XIX века.

Неравенство Чебышёва. Пафнутий Чебышёв (1821–1894) доказал в 1882 году неравенство о монотонных суммах, находящееся в тесной связи с AM–GM: если последовательности и одновременно не убывают или не возрастают, то

Неравенство Маклорена. Колин Маклорен в 1729 году доказал фундаментальное неравенство между элементарными симметрическими средними, обобщающее AM–GM: . Впоследствии оно было включено в общую теорию симметрических функций и мажоризации.

В России развитие теории неравенств было связано с именами Маркова, Ляпунова и других. Александр Ляпунов в 1901 году детально исследовал неравенство между степенными средними (в русскоязычной традиции часто называемое неравенством Ляпунова), являющееся обобщением AM–GM:

Начало XX века

Первые десятилетия XX века стали временем систематизации накопленных знаний о неравенствах.

Дьёрдь Пойа предложил своё доказательство AM–GM через неравенство . Пойа специально искал доказательство, не требующее индукции или явного обращения к свойствам логарифма, и нашёл способ, основанный только на одном элементарном факте об экспоненте.[29]

Иссай Шур доказал неравенство, носящее его имя:

[30]

Вершиной этого периода стала монография Харди, Литлвуда и Пойа «Inequalities» (Cambridge University Press, 1934; переиздана в 1952, на русском языке издана в 1948 г.).[31][32] В этой книге были систематизированы сотни неравенств и установлены между ними логические связи, приведено несколько доказательств AM–GM и его взвешенной формы, обобщены неравенства на степенные средние и доказана теорема о монотонности, введен аппарат мажоризации (Schur-выпуклость)

Середина XX века: мажоризация, матричные средние, теория информации

Шур (1923) и независимо Харди, Литлвуд и Пойа развили теорию мажоризации: вектор мажорирует , если упорядоченные частичные суммы первого не меньше второго. Оказалось, что AM–GM — один из частных случаев более общего принципа: для Schur-выпуклых функций мажоризация влечёт неравенство значений. Это концептуально объединило AM–GM, неравенство Мюирхеда и многие другие результаты.[33]

Роберт Мюирхед доказал, что симметрические суммы, соответствующие мажорируемому набору показателей, меньше или равны суммам для мажорирующего набора. AM–GM является простейшим частным случаем этого результата.

В 1950–1980-е годы была развита теория средних для положительно определённых матриц. Ф. Кун (F. Kuhn), Ричард Беллман и другие показали, что аналог AM–GM для матриц

геометрическое среднее матрицпорядка Лёвнера[34]

Клод Шеннон в статье 1948 года использовал неравенства между средними при доказательстве свойств энтропии. В частности, неравенство AM–GM эквивалентно неравенству Гиббса, из которого непосредственно следует неотрицательность KL-дивергенции, которая стала центральным объектом современной теории информации.[35]

Вторая половина XX века

В послевоенный период неравенство AM–GM заняло центральное место в олимпиадной математике. Начиная с первых Международных математических олимпиад (ИМО; с 1959 года), задачи на доказательство и применение неравенств стали регулярными. Метод AM–GM — один из главных инструментов участников. Постепенно сложилась разветвлённая система методов доказательства неравенств, включающая:

• AM–GM в прямой и взвешенной форме,

SOS-метод (суммы квадратов),

• метод нормировки Шура,

метод Тангентной прямой,

метод pqr,

метод uvw.

Дьёрдь Пойа в книгах «How to Solve It» (1945) и «Mathematics and Plausible Reasoning» (1954) неоднократно использовал AM–GM как иллюстрацию математического открытия и эвристики, что способствовало широкому педагогическому распространению неравенства.[36] В 1961 году вышла книга Беккенбаха и Беллмана «An Introduction to Inequalities», написанная для широкой аудитории и сделавшая AM–GM доступным для старшеклассников и студентов.[37]

Работа Маршалла и Олкина «Inequalities: Theory of Majorization and Its Applications» (1979, переиздана в 2011) окончательно систематизировала связь AM–GM с теорией мажоризации, Schur-выпуклостью и смежными областями [38]

Конец XX — начало XXI века: новые направления

В последние десятилетия исследования, связанные с AM–GM, развиваются в нескольких направлениях. Теория матричных средних получила значительное развитие в контексте квантовой информатики. Квантовая относительная энтропия удовлетворяет неравенствам, аналогичным AM–GM для матриц, и играет роль в квантовой криптографии и теории квантовых каналов.[39]

Неравенство AM–GM лежит в основе методов доказательства сходимости в EM-алгоритме, вариационном байесовском выводе и геометрическом программировании. В частности, геометрическое программирование (geometric programming) — класс задач оптимизации, в котором целевая функция и ограничения заданы позинномами (полиномиально-геометрическими выражениями), — целиком основано на AM–GM.[40]

Осознание того, что геометрическая доходность систематически ниже арифметической, привело к пересмотру методов оценки эффективности инвестиций. Неравенство AM–GM лежит в основе различия между «time-weighted» и «money-weighted» доходностями, стандартизованного в нормах CFA Institute.

К началу XXI века было предложено более 100 различных доказательств AM–GM, что само по себе является предметом математического исследования. Обзор множества доказательств содержится в книге Дж. М. Стила «The Cauchy-Schwarz Master Class» (2004).[41]

Примечания

Литература

  • Беккенбах Э. Ф., Беллман Р. Введение в неравенства / Пер. с англ. Р. А. Лукацкой ; под ред. И. М. Яглома. — М.: Мир, 1965. — 165 с.
  • Borwein J. M., Borwein P. B. The way of all means // Amer. Math. Monthly. — 1987. — Т. 94, № 6. — С. 519–522.
  • Харди Г. Г., Литтльвуд Дж. Е., Полиа Г. Неравенства / Пер. с англ. В. И. Левина ; с доп. В. И. Левина и С. Б. Стечкина. — М.: Гос. изд-во иностр. лит., 1948. — 456 с.
  • Heath T. L. A History of Greek Mathematics. — Oxford: Clarendon Press, 1921. — Т. 1. — С. 82–85.
  • Katz V. J. A History of Mathematics: An Introduction. — 3rd ed.. — Addison-Wesley, 2009. — С. 482–485. — ISBN 0-321-38700-7.
  • Маршалл А., Олкин И. Неравенства: теория мажоризации и ее приложения / Пер. с англ. Г. П. Гаврилова, В. Г. Миранцева. — М.: Мир, 1983. — 574 с.
  • Нейгебауэр О. Точные науки в древности / Пер. с англ. Е. В. Гохман ; под ред. А. П. Юшкевича. — М.: Наука, Гл. ред. физ.-мат. лит., 1968. — С. 63–64.
  • Toader Gh., Toader S. Greek means and the arithmetic–geometric mean. — RGMIA Monographs, Victoria University, 2005. — 95 с.
© Правообладателем данного материала является АНО «Интернет-энциклопедия «РУВИКИ».
Использование данного материала на других сайтах возможно только с согласия АНО «Интернет-энциклопедия «РУВИКИ».