Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 16 ноября 2016 года; проверки требуют 14 правок.
Текущая версия страницы пока не проверялась опытными участниками и может значительно отличаться от версии, проверенной 16 ноября 2016 года; проверки требуют 14 правок.
Вычислительная мощность компьютера (производительность компьютера) — это количественная характеристика скорости выполнения определённых операций на компьютере. Чаще всего вычислительная мощность измеряется во флопсах (количество операций с плавающей запятой в секунду), а также производными от неё.
На данный момент принято причислять к суперкомпьютерам системы с вычислительной мощностью более 10 терафлопсов (10*1012 или десять триллионов флопсов; для сравнения - среднестатистический современный настольный компьютер имеет производительность порядка 0,1 терафлопса). Одна из наиболее мощных на тесте HPL компьютерных систем — китайский Sunway TaihuLight — имеет производительность, превышающую несколько десятков петафлопсов[1].
Существует несколько сложностей при определении вычислительной мощности суперкомпьютера. Во-первых, следует иметь в виду, что производительность системы может сильно зависеть от типа выполняемой задачи. В частности, отрицательно сказывается на вычислительной мощности необходимость частого обмена данных между составляющими компьютерной системы, а также частое обращение к памяти. В связи с этим выделяют пиковую вычислительную мощность — гипотетически максимально возможное количество операций над числами с плавающей запятой в секунду, которое способен произвести данный суперкомпьютер.
Важную роль играет также разрядность значений, обрабатываемых программой (обычно имеется в виду формат чисел с плавающей запятой). Так, например, у графических процессоровNVIDIA Tesla первых двух поколений максимальная производительность в режиме одинарной точности (32 бит) составляет порядка 1 терафлопса, однако при проведении вычислений с двойной точностью (64 бит) она в 10 раз ниже (так, в микросхемах серии GF200 в 10 раз меньше блоков с поддержкой вычислений с двойной точностью[2]).
Оценка реальной вычислительной мощности производится путём прохождения специальных тестов (бенчмарков) — набора программ, специально предназначенных для проведения вычислений и измерения времени их выполнения. Обычно оценивается скорость решения системой большой системы линейных алгебраических уравнений, что обусловливается, в первую очередь, хорошей масштабируемостью этой задачи.
Наиболее популярным тестом производительности является Linpack benchmark. В частности, HPL (высокопараллельная реализация Linpack с применением MPI)[3] используется при составлении списка TOP500 суперкомпьютеров в мире[4].
Roadrunner — располагается в США в Лос-Аламосской национальной лаборатории. Первый суперкомпьютер, пиковая производительность которого превысила уровень 1 петафлопса[7]. Создан компанией IBM. Особенностью является использование гибридной архитектуры, в которой основная вычислительная мощность обеспечивается процессорами Cell.
↑http://www.ixbt.com/video3/cuda-1.shtmlАрхивная копия от 23 апреля 2012 на Wayback Machine "для поддержки FP64 вычислений в NVIDIA решили сделать выделенные вычислительные блоки. И в GT200 их в десять раз меньше, чем блоков FP32 (по одному блоку двойной точности на каждый мультипроцессор)."