十一. 排序

排序就是重新排列表中的元素，使表中的元素满足按关键字有序的过程。

排序算法评价指标：

时间复杂度
空间复杂度
算法稳定性：指表中相同元素先后位置，经过排序后有没有相对的变动。
注意：稳定排序算法并不一定比不稳定的算法优秀，主要看实际需求。

排序算法分类：

内部排序：数据都在内存中。更关注算法时间和空间复杂度
$/$ 写磁盘次数更少。

1. 插入排序

主要分为：直接插入排序、折半插入排序、希尔排序

1.1 插入排序

算法思想：每次将一个待排序的记录按其关键字大小插入到前面已排好序的子序列中，直到全部记录插入完成。

动画演示：

算法实现及分析

排序从第二个元素开始，默认当前排序元素左边已经有序。只要比当前元素大的都往后移动，直到碰到比当前元素小(相等)的。

代码实现：


1
//直接插入排序
2
void InsertSort(int A[],int n){
3
    int i,j, temp;
4
    for(i=1;i<n;i++)            //将各元素插入已排好序的序列中
5
        if(A[i]<A[i-1]){        //若A[i]关键字小于前驱
6
            temp=A[i];          //用temp暂存A[i]
7
            for(j=i-1;j>=0 && A[j]>temp;--j) //检查所有 前面已排好序的元素
8
                A[j+1]=A[j];    //所有大于temp的元素都向后挪位
9
            A[j+1]=temp;        //复制到插入位置
10
        }
11
}

带哨兵实现方法：

代码实现：


xxxxxxxxxx
11
1
//直接插入排序(带哨兵)
2
void InsertSort(int A[],int n){
3
    int i,j;
4
    for(i=2;i<=n;i++)           //依次将A[2]~A[n]插入到前面已排序序列
5
        if(A[i]<A[i-1]){        //若A[i]关键码小于其前驱，将A[i]插入有序表
6
            A[0]=A[i];          //复制为哨兵，A[0]不存放元素
7
            for(j=i-1;A[0]<A[j];--j)//从后往前查找待插入位置
8
                A[j+1]=A[j];    //向后挪位
9
            A[j+1]=A[0];        //复制到插入位置
10
        }
11
}

带哨兵排序步骤：

$1$ $A[0]$ 位置。
$j+1$ 的位置。

$j\ge0$

算法效率分析：

$O(1)$
$n$ $n-1$ 趟处理
$n-1$ $1$ $O(n)$
$O(n^2)$ 。
$O(n^2)$
算法稳定性：相同两个元素，排序后相对位置不会改变，所以稳定。
适用性：可用于链表，也可用于顺序表。

算法优化

思路：之前都是用顺序查找方式移动元素，实际可用折半查找找到应该插入的位置，再移动元素

$55$ 之前元素已经有序，则优化插入排序步骤：

首先low=20;high=80，则mid=(low+high)/2=4mid $50$ 元素。
$55>50$ $55$ $50$ 元素的右边区间内。low=mid+1;mid=(low+high)/2=6mid $70$
$70>55$ $55$ $70$ 元素左边区间。high=mid-1;mid=(low+high)/2=5mid $60$
$60>55$ $55$ $60$ 元素左边区间。high=mid-1;，此时low>high，故折半查找停止，应将[low, i-1]内的元素全部右移，并将A[0]复制到low所指位置。
$60,90,10$ 同上，但要注意，当mid指向的元素和被查找元素相等时，不应该停止查找，为了算法稳定性，当元素相等时，我们应该在这个元素右边区间内查找。

代码实现：


xxxxxxxxxx
16
1
//折半插入排序
2
void InsertSort(int A[],int n){
3
    int i,j,low,high,mid;
4
    for(i=2;i<=n;i++){          //依次将A[2]~A[n]插入前面的已排序序列
5
        A[0]=A[i];              //将A[i]暂存到A[0]
6
        low=1;high=i-1;         //设置折半查找的范围
7
        while(low<=high){       //折半查找(默认递增有序)
8
            mid=(low+high)/2;   //取中间点
9
            if(A[mid]>A[0]) high=mid-1; //查找左半子表
10
            else low=mid+1;     //查找右半子表
11
        }
12
        for(j=i-1;j>=high+1;--j)
13
            A[j+1]=A[j];        //统一后移元素，空出插入位置
14
        A[high+1]=A[0];         //插入操作
15
    }
16
}

算法效率：

$O(n^2)$

$O(n^2)$ $O(n^2)$

1.2 希尔排序

希尔排序是对插入排序的优化。对于插入排序来说，如果要排序的元素基本有序，那么排序效率会高很多。而希尔排序核心思想是：先追求表中的元素部分有序，再逐渐逼近全局有序。

实现大致步骤：

$L[i,i+d,i + 2d,\cdots,i + kd]$ 的特殊子表。
再对各个子表分别进行直接插入排序
$d$ $d=1$ 为止。

动画演示：

例如：将下列表中元素进行升序排列

步骤：

$d_1=\frac{n}{2}=4$ $n$ $d(4)$ 的元素视为同一子表。
对上面四个子表进行直接插入排序。
$d_2=\frac{d_1}{2}=2$ $d(2)$ 的元素视为同一子表。
对上面各个子表进行直接插入排序。
$d_3=\frac{d_2}{2}=1$ ，此时所有元素都会划分为同一个子表。
整个表此时已呈现出基本有序，对整体再进行一次直接插入排序

$d$ 缩小一半。这要是建议的做法。

代码实现：


xxxxxxxxxx
12
1
//希尔排序
2
void ShellSort(int A[] ,int n){
3
    int d,i,j;                      //A[0]只是暂存单元,不是哨兵,当j<=0时,插入位置已到
4
    for(d=n/2; d>=1; d=d/2)         //步长变化
5
        for(i=d+1; i<=n; ++i)
6
            if(A[i]<A[i-d]){        //需将A[i]插入有序增量子表
7
                A[0]=A[i];          //暂存在A[0]
8
                for(j= i-d; j>0 && A[0]<A[j]; j-=d)
9
                    A[j+d]=A[j];    //记录后移，查找插入的位置
10
                A[j+d]=A[0];        //插入
11
            }//if
12
}

++i $d$ 为间隔的子表轮流切换排序。

算法性能分析：

$O(1)$
$d_i$ 不同会受到影响目前无法用数学手段证明确切的时间复杂度。
$d=1$ $O(n^2)$
$n$ $O(n^{1.3})$
稳定性：不稳定
适用性：仅适用于线性表，不能用于链表。

2. 交换排序

主要有：冒泡排序和快速排序

2.1 冒泡排序

冒泡排序和快速排序一样属于交换排序的一种。

交换排序：根据序列中两个元素关键字的比较结果来对换这两个记录在序列中的位置。

代码实现：


xxxxxxxxxx
19
1
//交换
2
void swap(int &a，int &b){
3
    int temp = a;
4
    a=b;
5
    b = temp;
6
}
7
//冒泡排序
8
void BubbleSort(int A[],int n){
9
    for(int i=0;i<n-1;i++){
10
        bool flag=false;            //表示本趟冒泡是否发生交换的标志
11
        for(int j=n-1;j>i;j--)      //一趟冒泡过程
12
            if(A[j-1]>A[j]){        //若为逆序
13
                swap(A[j-1],A[j]);  //交换
14
                flag=true;  
15
            }
16
        if(flag==false)
17
            return;                 //本趟遍历后没有发生交换，说明表已经有序
18
    }
19
}

注意：如果某一趟排序过程中未发生"交换"则算法可提前结束。

算法效率分析：

$O(1)$
时间复杂度：
$O(n)$
$O(n^2)$
$O(n^2)$
稳定性：稳定
适用性：链表，顺序表都可用

2.2 快速排序

算法实现思路：

在待排序表中任取一个元素作为枢轴(通常取首元素)。通过一趟排序，将待排序表划分为独立的两个部分。这两部分中，左半部分所有元素都小于枢轴元素；右半部分都大于枢轴元素，则枢轴元素确定其最终元素位置。这个过程称为一次划分。然后分别递归地对两个子表重复上述过程，直至每部分内只有一个元素或空为止，即所有元素放在最终位置上，完成排序。

动画演示如下：

代码如下：


x
1
//默认low=0,high=arr.length-1
2
int partition(int arr[],int low,int high) {
3
    int tempA=arr[low];                 //枢轴元素
4
    while(low<high) {                   //用low、high搜索枢轴的最终位置
5
        while(low<high&&arr[high]>=tempA) high--;//从右开始,比枢轴小的元素移动到左端,即low所指位置
6
        arr[low]=arr[high];
7
        while(low<high&&arr[low]<=tempA) low++;//从左边开始,比枢轴大的元素移动到右端,即high所指位置
8
        arr[high]=arr[low];
9
    }
10
    arr[low]=tempA;                     //确定枢轴元素存放到最终位置
11
    return low;                         //返回存放枢轴的最终位置
12
}
13

14
void quickSort(int arr[],int low,int high) {
15
    if(low<high) {
16
        int p=partition(arr,low,high);  //划分确定枢轴元素位置
17
        quickSort(arr,low,p-1);         //枢轴左边表进行递归确定位置
18
        quickSort(arr,p+1,high);        //右表确定位置
19
    }
20
}

效率分析：

$O(n)$ $O(n*递归层数)$

$O(递归层数)$

可以看出对于快速排序时间与空间复杂度分析必须要研究递归层数：

$n$ 个元素组织成二叉树，二叉树的层数就是递归调用的层数。所以可以将问题转换为二叉树高度求法。

$n$ $=\lfloor\log_2n\rfloor+1$ $=n$ 。

$=\lfloor\log_2n\rfloor+1$ $=n$ 。即

$O(n\log_2n)$ ；
$O(n^2)$
$O(\log_2n)$
$O(n)$

快速排序是不稳定地算法。

注意：若每一次选中的枢轴元素将待排序序列划分为均匀的两个部分，则递归深度最小，算法效率最高。若初始序列有序或逆序，则快速排序的性能最差(因为每次选择的都是最靠边的元素)。

基于上面分析，快速排序算法优化思路：尽量选择可以把数据中分的枢轴元素。如：

选头、中、尾三个位置的元素，取中间值作为枢轴元素
随机选一个元素作为枢轴元素

在实际应用当中快速排序是所有内部排序算法中平均性能最优的排序算法。

3. 选择排序

主要有：简单选择排序和堆排序

3.1 简单选择排序

选择排序：每一趟在待排序元素中选取关键字最小(或最大)的元素加入有序子序列

选择排序分类：简单选择排序和堆排序。

算法思路：每一趟在待排序元素中选取关键字最小的元素加入有序子序列

动画演示：

实现代码：


xxxxxxxxxx
18
1
//交换
2
void swap(int &a,int &b){
3
    a=a-b;
4
    b=a+b;
5
    a=b-a;
6
    
7
}
8

9
//简单选择排序
10
void SelectSort(int A[],int n){
11
    for(int i=0;i<n-1;i++){             //一共进行n-1趟
12
        int min=i;                      //记录最小元素位置
13
        for(int j=i+1;j<n;j++)          //在A[i...n-1]中选择最小的元素
14
            if(A[j]<A[min]) min=j;      //更新最小元素位置
15
        if(min!=i)
16
            swap(A[i],A[min] );         //封装的swap()函数移动元素
17
    }
18
}

算法效率分析：

$n-1$ $=O(n^2)$
$O(1)$
稳定性：不稳定

适用性：即可用于顺序表，也可以用于链表。

3.2 堆排序

堆排序的实现需要用到堆这种数据结构。堆这种数据结构又可以进一步划分为大根堆和小根堆。

堆结构和二叉树的顺序存储类似：

二叉树顺序表中存储结构：

几个重要操作：

$i$ $2i$
$i$ $2i+1$
$i$ $\lfloor i/2\rfloor$
$i$ $\lceil\log_2(n+1)\rceil或\lfloor\log_2n\rfloor+1$

$n$ 个结点，则：

$i$ $2i\le n?$
$i$ $2i+1\le n?$
$i$ $/$ $\lfloor i>n/2\rfloor?$

堆排序实现

堆结构也可以看作是一颗完全二叉树在顺序表存储结构：

上图左边是存储结构，右边是逻辑结构。可以观察到大根堆就是在完全二叉树中， $\ge$ 左右子树。

所以堆排序步骤：

$\ge$ 左右子树特点，将表转换为大根堆结构
$\ge$ 左右子树这一特性，若不满足，与当前结点更大的孩子交换。
由于大根堆表中第一个元素一定是最大元素，所以将其移动至表尾
接着对剩下的表中元素再次进行大根堆结构恢复操作。
依次循环上面三个步骤，直到所有最后表中只剩一个元素，排序结束

例子：给定以下序列表进行升序排序

排序步骤：

$i\le\lfloor\frac{n}{2}\rfloor$ $\frac{8}{2}=4$ $9$ 元素。
$9$ $32>9$ ，所以交换位置
$3$ $78$ $65,87>78$ $78$ $87$ 位置
$2$ $17$ $32,45$ $45$ 交换
$1$ $53$ $87$ 小，所以交换
$53$ $53$ $78$ 交换
此时，整个二叉树已经称为标准的大根堆结构，将序列表第一个元素换至表尾
接着将剩下元素重新恢复大根堆结构。恢复后结构如下：
$n-1$ 趟处理，将序列表变为有序表：

注意：基于大根堆的堆排序，得到是递增序列，而基于小根堆得到的是递减序列。

实现代码：


xxxxxxxxxx
29
1
//将以k为根的子树调整为大根堆
2
void HeadAdjust(int A[],int k,int len){
3
    A[0]=A[k];                  //A[0] 暂存子树的根结点
4
    for(int i=2*k;i<=len;i*=2){ //沿key较大的子结点向下筛选
5
        if(i<len&&A[i]<A[i+1])
6
            i++;                //取key较大的子结点的下标
7
        if(A[0]>=A[i]) break;   //筛选结束
8
        else{
9
            A[k]=A[i];          //将A[i]调整到双亲结点上
10
            k=i;                //修改K值，以便继续向下筛选
11
        }
12
    }
13
    A[k]=A[0];                  //被筛选结点的值放入最终位置
14
}
15

16
//建立大根堆
17
void BuildMaxHeap(int A[],int len){
18
    for(int i=len/2;i>0;i--)    //从后往前调整所有非终端结点
19
        HeadAdjust(A,i,len);
20
}
21

22
//堆排序的完整逻辑
23
void HeapSort(int A[],int len){
24
    BuildMaxHeap(A,len);        //初始建堆
25
    for(int i=len;i>1;i--){     //n-1趟的交换和建堆过程
26
        swap(A[i],A[1]);        //堆顶元素和堆底元素交换
27
        HeadAdjust(A,1,i-1);    //把剩余的待排序元素整理成堆
28
    }
29
}

算法效率分析：

由于所有操作都是基于HeadAdjust()这个函数的，所以要分析该函数效率：

$h$ $i$ $h-i$ $2(h-i)$ $n$ $h=\lfloor \log_2n\rfloor|+1$ 。

$i$ $2^{i-1}$ $1\sim (h-1)$ 层的结点才有可能需要下坠调整。将整棵树调整为大根堆，关键字对比次数不超过：

\begin{aligned} \sum_{i = h - 1}^{1} 2^{i - 1} 2 (h - i) = \sum_{i = h - 1}^{1} 2^{i} (h - i) \\ = \sum_{j = 1}^{h - 1} 2^{h - j} j \leq 2 n \sum_{j = 1}^{h - 1} \frac{j}{2^{j}} \leq 4 n \end{aligned}

$4n$ $=O(n)$ 。

而HeapSort()for $n-1$ $2$ $O(h)=O(\log_2n)$ $O(n\log_2n)$ 。

$=O(n\log_2n)+O(n)=O(n\log_2n)$
$=O(1)$
稳定性：不稳定

堆的插入

假设以小根堆为例，对于小根堆，新元素放到表尾，与父节点对比，若新元素比父节点更小，则将二者互换。新元素就这样一路上升，直到无法继续上升(根结点比新元素小)为止。

$13$

$13$ $\lfloor\frac{9}{2}\rfloor=4$ $32$ $32>13$ ，所以互换
$17$ $13$ 更小，交换
$9$ $9<13$ ，所以不用交换结束，小根堆符合条件。

$3$ 次。

堆的删除

首先从序列表中将被删除元素删除，接着将表尾元素替换到被删除元素位置，再进行小根堆恢复：被删除的元素用堆底元素替代，然后让该元素不断下坠，直到无法下坠为止。

$13$ 元素

$13$ $46$ $13$ $2$ 的位置
$46$ $17$ $46$ 交换
$46<32$ ，继续交换
最后小根堆恢复

$4$ 次。

4. 归并排序

归并：把两个或多个已经有序的序列合并成一个。

首先开辟一个能放入上面两个数组的更大的数组。

$i$ $j$ $k$ $(i/j)$ $k$ $i、j$ 指针中有一个超出数组下标，则说明一个子表已经排序完毕，还剩一个子表未合并，可以将该表中剩余元素全部加到总表。

上面的归并称为二路归并，即每次选出一个子表中最小的元素插入新的排序序列中，这种每次选出一个元素 $1$ 次关键字。

同样还有四路归并：

$p1$ $p2$ $p3$ $p4$ $k$ $4$ $3$ 次。

结论： $m$ $m-1$ 次。

归并排序模拟：给定以下序列，每个序列都是独立集合。

首先第一趟可以将初试序列，两两归并：
第二趟同样将第一趟归并后的序列再次两两归并：
第三趟归并，将第二趟序列做最后一次合并即可：

通过上面步骤可以得到归并排序核心操作：把数组内的两个有序序列归并为一个。

代码实现：


xxxxxxxxxx
25
1
//辅助数组B
2
int *B=(int *)malloc(n*sizeof(int));
3

4
//A[low.mid]和A[mid+1...high]各自有序,将两个部分归并
5
void Merge(int A[],int low,int mid,int high){
6
    int i,j,k;
7
    for( k=low; k<=high;k++)
8
        B[k]=A[k];              //将A中所有元素 复制到B中
9
    for(i=low, j=mid+1,k=i; i<=mid&&j<=high;k++){
10
        if(B[i]<=B[j])
11
            A[k]=B[i++];        //将较小值复制到A中
12
        else
13
            A[k]=B[j++];
14
    }//for
15
    while(i<=mid)  A[k++]=B[i++];
16
    while(j<=high) A[k++]=B[j++];
17
}
18
void MergeSort(int A[],int Low,int high){
19
    if(low<high){
20
        int mid=(low+high)/2;       //从中间划分
21
        MergeSort(A,low,mid);       //对左半部分归并排序
22
        MergeSort (A,mid+1,high);   //对右半部分归并排序
23
        Merge(A,low,mid,high);      //归并
24
    }//if
25
}

算法效率分析：

可以看到上面MergeSort()函数使用了递归进行排序。所有也可以认为二路归并是一棵倒立的二叉树。可以利用二叉树特性分析二路归并排序的算法效率。分治法递归树如下：

更详细图解：

$h-1$ $h$ $2^{h-1}$ $h$ $n\le2^{h-1}$ $n$ $h-1=\lceil\log_2n\rceil$ 。

对上面算法例子进行归并分析：

$\le n-1$ $O(n)$ $\frac{n}{2}$ $O(n)$ $O(n)$ 这样的数量级。

$O(n)$ $B$ $\lceil\log_2n\rceil$ 这个数量级，所以递归栈的空间复杂度忽略不计。

$n$ $=\lceil\log_2n\rceil$ 。 $O(n)$ $O(n\log_2n)$ 。并且归并排序是一个稳定的算法。其排序效率可以和堆排序、快速排序达到同样的优秀程度。

归并排序总结：

5. 基数排序

$n$ $a_j$ $d$ $(k_j^{d-1},k_j^{d-2},k_j^{d-3},\cdots,k_j^{1},k_j^{0})$ $k^{d-1}_j$ $k^0_j$ 表示最低位关键字。其中

0 \leq k_{j}^{i} \leq r - 1 (0 \leq j \leq n, 0 \leq i \leq d - 1)

$r$ $0\sim9$ $10$ 。

基数排序得到递减序列的过程如下：

$r$ $Q_{r-1},Q_{r-2}\cdots Q_0$ 。
$>$ $>$ $d$ 个关键字位分别做"分配"和"收集"。
$=x$ $Q_x$ 队列的队尾。
$Q_{r-1},Q_{r-2}\cdots Q_0$ 各个队列中的结点依次出队并链接。

基数排序模拟：假设给定以下序列，要求得到关键字递减的有序序列：

$r=10$ $10$ 个辅助队列。

$520$ $0$ $Q_0$ $i$ $Q_i$ 队列。
$Q_9$ 开始收集。
第一趟"收集"结束：得到按"个位"递减排序的序列。
$438$ $3$ $Q_3$ $i$ $Q_i$ 队列。
收集结果如下：
第二趟"收集"结束：得到按"十位"递减排序的序列，"十位"相同的按"个位"递减排序。
$996$ $9$ $Q_9$ $i$ $Q_i$ 队列。
收集结果如下：
第三趟按"百位"分配、收集：得到一个按"百位"递减排列的序列，若"百位"相同则按"十位"递减排列，若"十位"还相同则按"个位"递减排列。

由此可以看出基数排序不是基于"比较"的排序算法。

基数排序实现：基数排序大都基于链式存储结构实现。


xxxxxxxxxx
9
1
typedef struct LinkNode{
2
    ElemType data;
3
    struct LinkNode *next;
4
}LinkNode,*LinkList;
5

6
//队列是链式队列
7
typedef struct{
8
    LinkNode *front,*rear; //队列的队头和队尾指针
9
}LinkQueue; //LinkQueue Q[10]

算法效率分析：

$r$ $=O(r)$ 。

$O(n)$ $O(r)$ $d$ $=O(d(n+r))$ $O(1)$ 时间复杂度。收集队列核心代码如下：


xxxxxxxxxx
4
1
//收集Q5队列
2
p->next = Q[5].front;
3
Q[5].front=NULL;
4
Q[5].rear=NULL;

同时也可以看出基数排序具有稳定性。

$10000$ $1991\sim2005$ $1\sim12$ $1\sim31$ $日<月<年$ ，所以根据基数排序要按照权重递增次序进行分配收集。

$O(d(n+r))=O(3(10000+31)=O(30000)$ $d$ $3$ $n$ $10000$ $r=\max\{31,12,15\}$ $O(n\log_2n)\approx=140000$ 。

基数排序擅长解决的问题：

$d$ $d$ $5$ $d=18$ $n=5$ )
$r$ $d=2/3/4/$ $r=\infty$ 因为姓氏很多)
$n$ $d=18$ $n=十亿$ ，此时相对来说仍能得到很高的效率。

基数排序总结：

6. 外部排序

$/$ 写以"块"为单位，数据读入内存后才能被修改。修改完了还要写回磁盘。

$3$ 块大小的缓冲区即可对任意大的文在进行排序。这里三个缓冲区大小相等。

6.1 外部排序实现

假如在内存中开辟以下三个缓冲区：

$1kb$

$16$ $3$ 个记录关键字。现在要对磁盘中的记录关键字进行递增排序。

$1,2$ ，进行内部排序。
$1$ 中关键字放入输出缓冲区
再通过输出缓冲区写回磁盘
$2$ 数据放入输出缓冲区，再放回磁盘中。
此时磁盘块前两个空间内的数据有序。这样的有序初试序列称为归并段。同样的将磁盘后面的块进行两两有序的内部排序。
$8$ $16$ $32$ $读/写$ 操作。
之后用上面的初始归并段进行排序，首先进行第一趟归并
将两个归并段中更小的归并段先放入缓冲区，之后进行归并排序，排序方法是依次将两个输入缓冲区中最小的放入输出缓冲区。
由于输出缓冲区与两个输入缓冲区大小一致，所以只能放入三个记录关键字，当记录关键字填满了输出缓冲区之后，输出缓冲区会将数据写回磁盘块。
接着继续对输入缓冲区中的记录关键字进行归并，当某一个输出缓冲区空时，需要将对应的归并段下一块补上。
$1$ $1$ 。
$2$ $2$ 下一块补齐。
之后继续进行归并，直到两个归并段合并
之后可以用与之上面类似方法对后面三组(每组两个)进行归并。归并后这一趟归并结束，结果如下：
$8$ $4$ 个。
接着进行第二趟归并，将这四个归并段，分别进行两两归并。
$i$ $i$ 内的下一块记录关键字补上。
最后如上图可以将这两个归并段归并为一个。两外一组进行归并方法一样，结果如下：
完成了这一趟的归并后得到两个归并段。
$16$ 块记录关键字变为递增序列。

$i$ $i$ 的下一块记录关键字放入，接着继续进行归并排序。

外部排序时间开销分析如下：

通过上图不难发现 $=$ $+$ $+$ 内部归并所需时间。

$32$ $3$ $32$ $32+32*2=128$ 次。可以看出读写外存时间占比很大。显然上面文件要排序块数是无法改变的，但是可以通过缩短归并趟数达到优化效果。

6.2 外部排序优化

优化方法是使用多路归并。

这里以四路归并举例，如果是四路归并，就需要在内存中开辟四个输入缓冲区。之后将四个归并段中的内容读入缓冲区。

将四个归并段中第一块记录关键字块放入对应的输入缓冲区。

$i$ $i$ 的下一块记录关键字块补全。

这样在一趟归并完成后就得到两个归并段

之后再需要一趟二路归并即可。

效率分析：

$4$ $=32+32*2= 96$ 次。

重要结论 $I/O$ $r$ $k$ $k$ $h$ $=h-1=\lceil\log_kr\rceil$ 。

$k$ $h$ $k^{h-1}$ $r\le k^{h-1}$ $(h-1)_{最小}=\lceil\log_kr\rceil$ $k$ $r$ 越小，归并趟数越少，读写，磁盘次数越少。

$k$ $k$ $k$ 路归并带来的负面影响：

$k$ $k$ 个输入缓冲区，内存开销增加。
$(k-1)$ 次，内部归并所需时间增加。

$k$ $r$ $k$ $r$ 越小，归并趟数越少，读写，磁盘次数越少。

外部排序总结：

$N$ $L$ $r= N/L$ $k$ $k$ $-$ 选择排序进一步减少初始归并段的数量。

$k$ $k$ 路平衡归并条件如下：

$k$ 个段归并为一个
$m$ $\lceil m/k\rceil$ 个新的归并段

$8$ $3$ $8$ $\lceil 8/4\rceil=2\ne3$ 。四路平衡归并树如下：

6.3 败者树

$k$ $k$ 个归并段中挑出最小关键字对比次数更少。

$k$ 个叶节点分别是当前参加比较的元素，非叶子结点用来记忆左右子树中的失败者，而让胜者往上继续进行比较，一直到根节点。

败者树在多路平衡归并中的应用：

有如上图所示的八个归并段。要从这八个归并段中每次选出最小的记录关键字。传统方式，每次都需要进行七次对比才能得到一个最小关键字，而采用败者树方式如下：

将每个归并段的第一个元素放入叶子结点。接着就需要构造一棵败者树。构造方法是：每次底部两个叶子结点进行对比，较小的晋级到父结点，但是这里晋级到父结点后并不是记录这个关键字的值，而是记录更小关键字来自哪个归并段。

第一趟对比如下：

$3$ $1$ 最小。

$3$ $6$ 补齐叶子结点：

$6$ $4$ $4$ $17$ $2$ $12$ $5$ $2$ 对比，失败，受的败者树如下：

$5$ $2$ 最小，所以胜出。本次对比进行三次。

$5$ $3$ 补齐叶子结点，继续进行上述对比即可

$k$ $k-1$ 次 $\lceil\log_2k\rceil$ 次即可。

代码实现：

$8$ $1$ $0$ 号数组下标对应冠军结点。这里要注意上面的叶子结点是虚拟结点，实际结构中不存在的。

$k$ $/$ $k-1$ $\lceil\log_2k\rceil$ 。

$k$ $k$ 个归并段中当前参加比较的元素，非叶子结点用来记忆左右子树中的"失败者"，而让胜者往上继续进行比较，一直到根结点。

$5$ $ls[5]$ $1\sim4$ $0$ $b0\sim b1$ $ls$ 数组如下：

$\lceil\log_2k\rceil=3$ $b0、b1、b2$ 三个结点上。

6.4 置换-选择排序

$k$ $S$ $S=\lceil\log_kr\rceil$ $r$ 减少，则外部排序效率可以进一步提升。可以用置换-选择排序进一步减少初始归并段数量。

$l$ $3$ $l$ $n$ $r=n/l$ 。可以用置换-选择排序扩大内存工作区。

$FI$ $FO$ $WA$ $FO$ $WA$ $WA$ $w$ 个记录。置换选择算法的步骤如下：

$FI$ $w$ $WA$ 。
$WA$ $MINIMAX$ 记录。
$MINIMAX$ $FO$ 中去。
$FI$ $FI$ $WA$ 中。
$WA$ $MINIMAX$ $MINIMAX$ 记录。
$3\sim5$ $WA$ $MINIMAX$ $FO$ 中去。
$2\sim6$ $WA$ 为空。由此得到全部初始归并段。

实现模拟：假设有以下待排序文件：

$3$ 个记录。按照递增顺序排序：

$WA$ 中
$4$ $FO$ $MINIMAX=4$ 变为当前输出值。
$FI$ $WA$ $FO$ $MINIMAX$ 值为每次置换出去的值。
$10$ $10<MINIMAX=13$ $10$ 不可能输出，标记为红色。
$WA$ $1$ 置换结束。
$WA$ $WA$ $MINIMAX$ 小的关键字置换出去。
$WA$ $2$ 置换结束。
$3$ 置换步骤同上，结果如下：