Производительность на ватт

Производительность на ватт — это мера энергоэффективности конкретной компьютерной архитектуры или аппаратного обеспечения компьютера. Данная характеристика отражает, какое количество вычислений может быть выполнено компьютером на каждый потребляемый ватт энергии. При сравнении вычислительных систем производительность на ватт часто измеряется с помощью теста LINPACK; примером такого применения является рейтинг суперкомпьютеров Green500. Производительность на ватт рассматривается как один из критериев устойчивых вычислений[1].

Проектировщики систем, создающие параллельные вычислительные системы, часто выбирают процессоры исходя из их производительности на ватт, поскольку затраты на питание процессора могут превышать его собственную стоимость[2].

В вычислениях для космических аппаратов существуют жёсткие ограничения по максимальной доступной мощности, а также жёсткие требования по минимальной производительности в реальном времени. Соотношение скорости обработки к необходимой электрической мощности оказывается более информативным показателем, чем чистая вычислительная мощность[3].

Определение

Методы оценки производительности и потребления энергии зависят от контекста; в качестве показателей производительности используются FLOPS, MIPS, либо баллы в выбранных бенчмарках. Подходы к измерению энергопотребления также различаются: одни учитывают лишь электричество, поступающее непосредственно к компьютеру, другие включают всё электропитание, необходимое для работы, включая системы охлаждения и мониторинга. Обычно энергопотребление оценивается по среднему значению во время теста, хотя иногда рассматриваются и другие показатели (например, пиковое или в простое).

Так, один из первых электронных компьютеров UNIVAC I выполнял около 0,015 операций на ватт-секунду (1 905 операций в секунду при энергопотреблении 125 кВт). В 2005 году Fujitsu создала систему на кристалле FR-V (VLIW/векторный процессор) с четырьмя ядрами FR550, выполняющую 51 гигаоперацию в секунду при потреблении 3 ватт — 17 миллиардов операций на ватт-секунду[4][5]. Это более чем триллионное улучшение за 54 года.

Большая часть энергии, потребляемой компьютером, превращается в тепло, и системы с меньшей мощностью для той же задачи требуют менее трудоёмкого охлаждения. Снижение тепловыделения упрощает создание тихих систем. Низкое энергопотребление уменьшает эксплуатационные затраты и снижает воздействие на окружающую среду (см. зелёные вычисления). В помещениях с ограниченным климат-контролем низкопотребляющий компьютер будет работать на более низкой температуре, что повышает надёжность. В контролируемых средах экономия прямой энергии даёт дополнительный эффект в виде снижения расходов на охлаждение.

Энергопотребление компьютера иногда измеряют через затраченную энергию на выполнение конкретного теста (например, EEMBC EnergyBench). Энергозатраты при фиксированной нагрузке позволяют нагляднее оценить выгоду от повышения энергоэффективности.

Если производительность определяется в операции/секунда, то производительность на ватт можно выразить как операции/ватт, а с учётом того, что ватт — это джоуль/секунда, то эквивалентной формой будет операции/джоуль.

FLOPS на ватт

FLOPS на ватт — один из наиболее распространённых показателей, отражающий, сколько FLOPS (операций с плавающей запятой в секунду) выполняет система на каждый ватт потребления. Обычно используется для оценки производительности в научных и инженерных задачах с преобладанием расчётов с плавающей запятой.

undefined

Примеры

По состоянию на июнь 2016 года в рейтинге Green500 лидируют две японские суперкомпьютерные системы с многопроцессорным ускорителем PEZY-SCnp и процессорами Intel Xeon (обе в RIKEN), демонстрирующие показатель 6673,8 MFLOPS/ватт; на третьем месте — Sunway TaihuLight (Китай, занимает 2-е место в TOP500) с результатом 6051,3 MFLOPS/ватт[6].

В июне 2012 года самой энергоэффективной системой TOP500 стала BlueGene/Q, Power BQC 16C — 2 100,88 MFLOPS/ватт[7].

В ноябре 2010 года IBM Blue Gene/Q показала эффективность 1 684 MFLOPS/ватт[8][9].

9 июня 2008 года CNN сообщила, что IBM Roadrunner достигла 376 MFLOPS/ватт[10][11].

В рамках исследовательского проекта Intel Tera-Scale была создана 80-ядерная процессорная микросхема, достигшая эффективности свыше 16 000 MFLOPS/ватт[12][13]. Дальнейшая судьба этого процессора не определена.

Microwulf — недорогий Beowulf-кластер из четырёх двухъядерных Athlon 64 X2 3800+ — обеспечивает 58 MFLOPS/ватт[14].

Kalray разработала 256-ядерный процессор VLIW с эффективностью 25 000 MFLOPS/ватт; следующее поколение ожидается на уровне 75 000 MFLOPS/ватт[15]. Однако в 2019 году их чип для embedded-решений — 80-ядерный, с заявленной производительностью до 4 TFLOPS при 20 Вт[16].

Компания Adapteva анонсировала процессор Epiphany V — 1024-ядерный 64-битный RISC-процессор, рассчитанный на достижение 75 GFLOPS/ватт[17][18], однако позже объявила проект маловероятным для коммерциализации.

Патент США № 10,020,436 (июль 2018) заявляет интервалы 100, 300, и 600 GFLOPS/ватт.

Энергоэффективность GPU

Рост мощности современных графических процессоров (GPU) продолжается, в то время как производители CPU всё больше уделяют внимания производительности на ватт. Высокопроизводительные GPU могут потреблять большое количество электроэнергии, поэтому разрабатываются различные методы управления их энергопотреблением. Показатель, такой как 3DMark2006 на ватт, может использоваться для оценки энергоэффективности видеокарт[19]. Однако подобные метрики не всегда точно отражают эффективность в реальных сценариях, когда чаще выполняются менее ресурсоёмкие задачи[20].

Для современных GPU энергопотребление является критическим ограничением, определяющим максимум вычислительной мощности. GPU обычно обладают высокой масштабируемостью, что позволяет объединять несколько чипов на одной плате или использовать несколько видеокарт параллельно. Пиковая производительность определяется именно пределами по питанию и отводу тепла. Поэтому высокая производительность на ватт в GPU непосредственно означает больший предел вычислительной мощности в применяемых системах.

Ввиду того, что графические процессоры могут использоваться и в общих вычислениях, иногда их производительность измеряется такими же метриками, как и для CPU, например, FLOPS/ватт.

Проблемы и ограничения

Хотя производительность на ватт — полезный показатель, абсолютные требования к мощности также важны. Иногда заявления об улучшенной производительности на ватт используются для маскировки общего роста потребления энергии. Например, новые поколения GPU могут демонстрировать бо́льшую производительность на ватт, но рост абсолютной производительности сводит на нет это увеличение эффективности, и итоговое энергопотребление продолжает расти[21].

Бенчмарки, регистрирующие энергию только под полной нагрузкой, недостаточно характеризуют реальную энергоэффективность. Например, 3DMark тестирует пики 3D производительности, однако большинство времени система работает с простыми задачами (2D-графика, видео, простой). Поэтому простое энергопотребление не менее важно для оценки общей эффективности. Аналогично, для систем, часто находящихся в режиме ожидания или soft-off, также сложно оценить эффективность только по нагрузочным тестам. Для учёта этого фактора стандарт SPECpower предполагает измерения на разных уровнях нагрузки[22].

Эффективность некоторых электронных компонентов (например, стабилизаторов напряжения) ухудшается с ростом температуры, поэтому итоговое энергопотребление может возрастать в процессе нагрева. Блоки питания, материнские платы, видеокарты подвержены этому эффекту, и при измерениях необходимо учитывать температурные условия[23][24].

Обычно метрика производительность на ватт не учитывает затраты полного жизненного цикла. Производство компьютеров энергозатратно, а срок их службы относительно короткий, поэтому значительную долю энергозатрат и экологического вреда создают этапы производства, дистрибуции, утилизации и переработки[25][26].

Энергия, затрачиваемая на климат-контроль окружающей среды, как правило, не включается в расчёты, хотя может быть весьма значительной[27].

Другие меры энергоэффективности

SWaP (англ. space, wattage and performance) — метрика Sun Microsystems для оценки центров обработки данных с учётом площади и энергопотерь:

Производительность измеряется любым подходящим бенчмарком, пространство — физическими размерами системы[28].

В космических вычислениях снижение энергопотребления, массы и объёма — также важнейший приоритет[3].

Примечания

  1. Performance per Watt Is the New Moore's Law (англ.). Arm Blueprint (12 июля 2021). Дата обращения: 16 июля 2021.
  2. Power could cost more than servers, Google warns (англ.). CNET (2006). Дата обращения: 27 июня 2024.
  3. 1 2 D. J. Shirley; M. K. McLelland. The Next-Generation SC-7 RISC Spaceflight Computer (англ.). Utah State University 1–2. Дата обращения: 27 июня 2024.
  4. Fujitsu Develops Multi-core Processor for High-Performance Digital Consumer Products (англ.). Fujitsu (7 февраля 2020). Дата обращения: 8 августа 2020. Архивировано 25 марта 2019 года.
  5. FR-V Single-Chip Multicore Processor:FR1000 (англ.). Fujitsu. Дата обращения: 27 июня 2024. Архивировано 2 апреля 2015 года.
  6. Green500 List for June 2016 (англ.). Дата обращения: 27 июня 2024.
  7. The Green500 List (англ.). Green500. Дата обращения: 27 апреля 2026. Архивировано 3 июля 2012 года.
  8. Top500 Supercomputing List Reveals Computing Trends (англ.) (20 июля 2010). Дата обращения: 27 июня 2024.
  9. IBM Research A Clear Winner in Green 500 (англ.) (18 ноября 2010). Дата обращения: 27 июня 2024.
  10. Government unveils world's fastest computer (англ.), CNN. Архивировано 10 июня 2008. Дата обращения: 27 июня 2024.
  11. IBM Roadrunner Takes the Gold in the Petaflop Race (англ.). Дата обращения: 27 апреля 2026. Архивировано 13 июня 2008 года.
  12. Intel squeezes 1.8 TFlops out of one processor (англ.). TG Daily. Дата обращения: 27 апреля 2026. Архивировано 3 декабря 2007 года.
  13. Teraflops Research Chip (англ.). Intel Technology and Research. Дата обращения: 27 июня 2024.
  14. Joel Adams. Microwulf: Power Efficiency (англ.). Microwulf: A Personal, Portable Beowulf Cluster. Дата обращения: 27 июня 2024.
  15. MPPA MANYCORE - Many-core processors - KALRAY - Agile Performance (англ.). Дата обращения: 27 июня 2024.
  16. Kalray announces the Tape-Out of Coolidge on TSMC 16NM process technology (англ.). Kalray (31 июля 2019). Дата обращения: 12 августа 2019.
  17. Olofsson, Andreas Epiphany-V: A 1024-core 64-bit RISC processor (англ.). Дата обращения: 6 октября 2016.
  18. Olofsson, Andreas Epiphany-V: A 1024 processor 64-bit RISC System-On-Chip (англ.). Дата обращения: 6 октября 2016.
  19. Atwood, Jeff Video Card Power Consumption (англ.) (18 августа 2006). Дата обращения: 26 марта 2008. Архивировано 8 сентября 2008 года.
  20. Video card power consumption (англ.). Xbit Labs. Дата обращения: 27 июня 2024. Архивировано 4 сентября 2011 года.
  21. Tim Smalley. Performance per What? (англ.). Bit Tech. Дата обращения: 21 апреля 2008.
  22. SPEC launches standardized energy efficiency benchmark (англ.). ZDNet. Дата обращения: 27 апреля 2026. Архивировано 16 декабря 2007 года.
  23. Mike Chin. Asus EN9600GT Silent Edition Graphics Card (англ.). Silent PC Review 5. Дата обращения: 21 апреля 2008.
  24. Mike Chin. 80 Plus expands podium for Bronze, Silver & Gold (англ.). Silent PC Review (19 марта 2008). Дата обращения: 21 апреля 2008.
  25. Mike Chin. Life Cycle Analysis and Eco PC Review (англ.). Eco PC Review. Дата обращения: 27 июня 2024. Архивировано 4 марта 2008 года.
  26. Eric Williams (2004). “Energy intensity of computer manufacturing: hybrid assessment combining process and economic input-output methods”. Environ. Sci. Technol. [англ.]. 38 (22): 6166—74. Bibcode:2004EnST...38.6166W. DOI:10.1021/es035152j. PMID 15573621.
  27. Wu-chun Feng (2005). “The Importance of Being Low Power in High Performance Computing”. CT Watch Quarterly [англ.]. 1 (5).
  28. Greenhill, David SWaP Space Watts and Power (англ.). US EPA Energystar. Дата обращения: 14 ноября 2013.

Литература

Ссылки