快速排序的时间和空间复杂度

09/27 2015

Wikipedia: 快速排序是由东尼霍尔所发展的一种排序算法。在平均状况下，排序n个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较，但这种状况并不常见。事实上，快速排序通常明显比其他Ο(n log )算法更，因为它的内部循环（inner loop）可以在大部分的架构上很有效率地被实现出来。

快速排序是每个程序员都应当掌握的排序算法。当然我们接触的第一个排序算法可能是插入排序或者冒泡排序，但数据量一旦超过几万，插入和冒泡的性能会非常差。这时时间复杂度的渐进优势就表现出来了。平均情况下快速排序的时间复杂度是$\Theta(n\lg n)$，最坏情况是$n^2$，但通过随机算法可以避免最坏情况。由于递归调用，快排的空间复杂度是$\Theta(\lg n)$。

快排的思路

快速排序算法其实很简单，采用分治策略。步骤如下：

选取一个基准元素（pivot）
比pivot小的放到pivot左边，比pivot大的放到pivot右边
对pivot左边的序列和右边的序列分别递归的执行步骤1和步骤2

伪码表示也很直观：

QUICKSORT(A, p, r)
    if p < r    
        q = PARTITION(A, p, r)
        QUICKSORT(A, p, q-1)
        QUICKSORT(A, q+1, r)

//将数组分为两部分，返回临界值下标
PARTITION(A, p, r)
    x = A[r]    //以最后一个数为主元（pivot element）
    i = p-1 //小于主元子数组的下标上限
    for j = p to r-1
        if A[j] <= x
            i = i+1 //增加小于主元子数组的大小
            exchange A[i] with A[j] //将A[j]加入小于主元的子数组
    exchange A[i+1] with A[r]   //将主元从数组末尾移动至子数组之间
    return i + 1

其实有比上述伪码更简单的算法，直接申请O(n)的空间，把左右两部分放到申请的空间中。但上述算法维护了一个$[0, i]$的数组，其中所有元素都小于pivot。这使得空间占用从O(n)降到了O(lgn)，见下文。

C++实现

按照上述PARTITION过程，实现quicksort方法，用来排序数组v中的$[ begin, end )$部分。

void quicksort(vector<int>& v, int begin, int end){
    if(end - begin<=1) return;
    int pivot = v[end-1], less_end = begin;

    for(int i=begin; i<end-1; i++)
        if(v[i]<pivot) swap(v[i], v[less_end++]);

    swap(v[end-1], v[less_end]);
    quicksort(v, begin, less_end);
    quicksort(v, less_end + 1, end);
}

实现思路是这样的：

当只有一个元素时，它总是已经排好序的直接返回。
取最后一个为pivot，比pivot小的元素存储在$[ 0, lessend )$中。
遍历$[ begin, end-1 )$，如果它小于pivot就把它添加到$[ 0, lessend )$中，同时让less_end++。
将pivot放到$[ 0, lessend )$的结尾。
为$[ begin, lessend )$排序，此时less_end处的元素是pivot；同样为右边的$[ lessend + 1, end )$也排序。

上述quicksort是C++的实现方式，遵循STL风格。所有区间都是前闭后开的，它的调用方法也是STL风格的：

quicksort(vec, 0, vec.size());

复杂度

平均情况下快速排序的时间复杂度是$\Theta(n\lgn)$，最坏情况是$\Theta(n^2)$。

当划分产生的两个子问题分别包含 n-1 和 0 个元素时，最坏情况发生。划分操作的时间复杂度为$\Theta(n)$，$T(0)=\Theta(1)$，这时算法运行时间的递归式为 $T(n) = T(n-1) + T(0) + \Theta(n) = T(n-1) + \Theta(n)$，解为$T(n) = \Theta(n^2)$。

当划分产生的两个子问题分别包含$\lfloor n/2 \rfloor$和$\lceil n/2 \rceil-1$个元素时，最好情况发生。算法运行时间递归式为 $T(n) = 2T(n/2) + \Theta(n)$，解为$T(n) = \Theta(n\lg n)$。

事实上只要划分是常数比例的，算法的运行时间总是$O(n\lg n)$。假设按照 9:1 划分，每层代价最多为 cn，递归深度为 $\log_{10/9}n = \Theta(\lg n)$，故排序的总代价为$O(n\lg n)$。

平均情况下，比如一次坏的划分接着一次好的划分，坏的划分那一项可以合并到好的划分里，统计上来讲平均情况下的时间复杂度仍然是$\Theta(n\lg n)$。更详细的平均情况下的讨论参见：算法导论-排序和顺序统计量。

快排的空间复杂度是$\Theta(\lgn)$，因为快排的实现是递归调用的，而且每次函数调用中只使用了常数的空间，因此空间复杂度等于递归深度$\Theta(\lgn)$。

随机算法

可以通过在算法中引入随机性，使得算法对所有输入都能获得较好的期望性能。比如我们随机地选择pivot，这样上述的最坏情况就很难发生。伪码描述是这样的：

//新的划分程序，只是在真正进行划分前进行一次交换
RANDOMIZED-PARTITION(A, p, r)
	i = RANDOM(p, r)
	exchange A[r] with A[i]
	return PARTITION(A, p, r)

C++实现也很简单，只需要在排序前随机去一个元素和末端元素交换。

void rand-quicksort(vector<int>& v, int begin, int end){
    if(end-begin<=1) return;

    int pindex = rand()%(end-begin) + begin;
    swap(v[end-1], v[pindex]);

    quicksort(v, begin, end);
}

随机算法保证了对任何的输入而言，都可以保证$\Theta(n\lg n)$的时间复杂度。

本文采用知识共享署名 4.0 国际许可协议（CC-BY 4.0）进行许可，转载注明来源即可： https://www.harttle.com/2015/09/27/quick-sort.html。如有疏漏、谬误、侵权请通过评论或邮件指出。