Пирамидальная сортировка

Пирамидальная сортировка (англ. Heapsort, «Сортировка кучей»[1]) — алгоритм сортировки, работающий в худшем, в среднем и в лучшем случае (то есть гарантированно) за операций при сортировке элементов.[2] Алгоритм работает «на месте» — количество задействованной служебной памяти O(1), то есть фиксированное[1].

Может рассматриваться как усовершенствованная сортировка пузырьком, в которой элемент всплывает (min-heap) / тонет (max-heap) по многим путям.

История создания

Пирамидальная сортировка была предложена Дж. Уильямсом в 1964 году.[1]

Алгоритм

Файл:Сортирующее дерево развёрнутое в массив.svg
структура хранения данных сортирующего дерева

Сортировка пирамидой использует бинарное сортирующее дерево. Сортирующее дерево — это такое дерево, у которого выполнены условия:

  1. Каждый лист имеет глубину либо , либо ,  — максимальная глубина дерева.
  2. Значение в любой вершине не меньше (другой вариант — не больше) значения её потомков.

Удобная структура данных для сортирующего дерева — такой массив Array, что Array[0] — элемент в корне, а потомки элемента Array[i] являются Array[2i+1] и Array[2i+2].

Алгоритм сортировки будет состоять из двух основных шагов:

1. Выстраиваем элементы массива в виде сортирующего дерева[источник не указан 3350 дней]:

при .

Этот шаг требует операций.

2. Будем удалять элементы из корня по одному за раз и перестраивать дерево. То есть на первом шаге обмениваем Array[0] и Array[n-1], преобразовываем Array[0], Array[1], … , Array[n-2] в сортирующее дерево. Затем переставляем Array[0] и Array[n-2], преобразовываем Array[0], Array[1], … , Array[n-3] в сортирующее дерево. Процесс продолжается до тех пор, пока в сортирующем дереве не останется один элемент. Тогда Array[0], Array[1], … , Array[n-1] — упорядоченная последовательность.

Этот шаг требует операций.

Достоинства и недостатки

Достоинства

  • Имеет доказанную оценку худшего случая .
  • Сортирует на месте, то есть требует всего дополнительной памяти (если дерево организовывать так, как показано выше).

Недостатки

  • Неустойчив — для обеспечения устойчивости нужно расширять ключ.
  • На почти отсортированных массивах работает столь же долго, как и на хаотических данных.
  • На одном шаге выборку приходится делать хаотично по всей длине массива — поэтому алгоритм плохо сочетается с кэшированием и подкачкой памяти[1].
  • Методу требуется доступ к произвольному элементу структуры; не работает на связанных списках и других структурах памяти последовательного доступа.
  • Не распараллеливается.

Сортировка слиянием при расходе памяти быстрее ( с меньшей константой) и не подвержена деградации на неудачных данных.

Из-за сложности алгоритма выигрыш получается только на больших . На небольших (до нескольких тысяч) быстрее сортировка Шелла.

Применение

Алгоритм «пирамидальная сортировка» активно применяется в ядре Linux.

Примечания

Литература

Ссылки

Править
Используя этот сайт интернет-энциклопедии «РУВИКИ», я соглашаюсь с Условиями использования и Политикой конфиденциальности и даю согласие на обработку своих пользовательских данных (файлов cookies), необходимых для корректного функционирования сайта.
Аналитические и рекламные файлы cookies обрабатываются с помощью системы веб-аналитики «Яндекс.Метрика» и/или иных систем веб-аналитики на условиях, указанных в Политике конфиденциальности, и могут быть изменены в настройках браузера.