排序算法 =========== 比较排序 - 插入排序 - 选择排序 - 冒泡排序 - 快速排序 - 堆排序 - 归并排序 - 希尔排序非比较排序 - 计数排序 - 桶排序 - 基数排序 .. image:: ./07_sort.jpg :width: 900px :align: center - **稳定性** ：键值相同的元素在排序之后仍能保持原来的相对顺序。 - **空间复杂度** ：算法的额外内存开销，不包括输入所占空间。 - **in-place** ：原位运算，直接在输入数组/链表的基础上修改。 - **k** ：计数排序/桶排序，桶的个数；基数排序，关键字位数。插入排序 ------------- .. image:: ./07_insertion.gif :width: 800px :align: center | .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: template void insertionSort(T* arr, int len) { for(int i = 1; i < len; ++i) { int j = i; int tmp = arr[i]; while (j > 0 && arr[j-1] > tmp) { arr[j] = arr[j-1]; --j; } arr[j] = tmp; } } 选择排序 ----------- .. image:: ./07_selection.gif :width: 800px :align: center | .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: template void selectionSort(T* arr, int len) { if(!arr) return; for(int i = 0; i < len - 1; ++i) { int k = i; for(int j = i+1; j < len; ++j) { if(arr[j] < arr[k]) k = j; } swap(arr[i], arr[k]); } } 冒泡排序 ---------- .. image:: ./07_bubble.gif :width: 800px :align: center | .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: // 下起泡：大的数下沉 template void bubbleSort(T* arr, int len) { if(!arr) return; for(int i = 1; i < len; ++i) { for(int j = 0; j < len - i; ++j) { if(arr[j] > arr[j+1]) swap(arr[j], arr[j+1]); } } } .. code-block:: cpp :linenos: // 上起泡：小的数上浮 template void bubbleSort(T* arr, int len) { if(!arr) return; for(int i = 0; i < len - 1; ++i) { for(int j = len - 1; j > i; --j) { if(arr[j] < arr[j-1]) swap(arr[j], arr[j-1]); } } } 快速排序 ---------- .. image:: ./07_quick.gif :width: 800px :align: center | .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: // 全闭区间 [start, end] template int partion(T* arr, int start, int end) { T p = arr[start]; // pivot int left = start; int right = end + 1; while(true) { while(arr[++left] < p && left < end); while(arr[--right] > p); if(left >= right) break; swap(arr[left], arr[right]); } swap(arr[start], arr[right]); return right; } template void quickSort(T* arr, int start, int end) { if(!arr || start >= end) return; int p = partion(arr, start, end); if(p > start + 1) quickSort(arr, start, p-1); if(p < end - 1) quickSort(arr, p+1, end); } 快速排序的空间复杂度是 :math:`\mathcal{O}(\log n)` ，用于保存递归的函数栈，最差情况下为 :math:`\mathcal{O}(n)` 。堆排序 -------- .. image:: ./07_heap.gif :width: 800px :align: center 建堆，从 **最后一个非叶子节点** 开始调整，使其成为大顶堆；将堆顶元素放到数组末尾；最后一个叶子节点放到堆顶，重新调整堆；...。 .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: // 调整堆。区间 [start, end]，除了 start 不满足大顶堆的性质之外，其他节点都满足。 template void heapAdjust(T* arr, int start, int end) { T tmp = arr[start]; for(int i = 2*start+1; i <= end; i = 2*i + 1) { if(i < end) i = arr[i] > arr[i+1] ? i: i+1; if(arr[i] < tmp) break; arr[start] = arr[i]; start = i; } arr[start] = tmp; } // 某节点下标为 i，则其左右子节点的下标分别为：2*i+1，2*i+2 。 template void heapSort(T* arr, int len) { if(!arr) return; for(int k = (len-1-1)/2; k >= 0; --k) heapAdjust(arr, k, len-1); for(int i = 1; i <= len; ++i) { swap(arr[0], arr[len-i]); heapAdjust(arr, 0, len-1-i); } } 初始建立大顶堆的时间复杂度为 :math:`\mathcal{O}(n \log n)` ；每次取出堆的最大元素并重新调整堆也要用 :math:`\mathcal{O}(\log n)` 时间。归并排序 ----------- .. image:: ./07_merge.gif :width: 800px :align: center | .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: // 把有序表 from: [start, mid] 和 from: [mid+1, end] 合并到临时数组 to: [start, end]。 template void merge(T* from, T* to, int start, int mid, int end) { int i, j, k; for(i = start, j = mid+1, k = start; i <= mid && j <= end; ++k) { if(from[i] < from[j]) to[k] = from[i++]; else to[k] = from[j++]; } for(;i <= mid; ) to[k++] = from[i++]; for(;j <= end; ) to[k++] = from[j++]; } template void mergeSort(T* arr, T* atmp, int start, int end) { if(start == end) return; int mid = start + (end - start) / 2; mergeSort(arr, atmp, start, mid); mergeSort(arr, atmp, mid+1, end); merge(arr, atmp, start, mid, end); for(int i = start; i <= end; ++i) arr[i] = atmp[i]; } template void mergeSort(T* arr, int start, int end) { if(!arr) return; T* atmp = new T[MAX_LEN]; // 申请临时空间 fill(atmp, atmp + MAX_LEN, -1); mergeSort(arr, atmp, start, end); delete[] atmp; } .. code-block:: cpp :linenos: /* 非递归形式：2-路归并 */ // 依次把相邻的两个长度为 gap 的子数组合并为长度为 2*gap 的数组（调用 merge 函数） template void mergePass(T* arr, T* atmp, int n, int gap) { int start = 0; while (start + 2 * gap < n) { merge(arr, atmp, start, start + gap - 1, start + 2 * gap - 1); start += 2 * gap; } if (start + gap - 1 < n - 1) merge(arr, atmp, start, start + gap - 1, n - 1); // 最后的两个子数组不等长，一个长为 gap ，一个长小于 gap else // 只剩下一个子数组 { for (int j = start; j < n; ++j) atmp[j] = arr[j]; } } template void mergeSort(T* arr, int n) { if (!arr || n <= 1) return; T* atmp = new T[n]; int gap = 1; while (gap < n) { mergePass(arr, atmp, n, gap); for (int i = 0; i < n; ++i) arr[i] = atmp[i]; gap *= 2; } delete[] atmp; } 希尔排序 ----------- .. image:: ./07_shell.gif :width: 800px :align: center 缩小增量排序法：对于每一个增量（步长），利用插入排序方法进行排序。如果序列是基本有序的，使用直接插入排序效率非常高。 .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: template void insertSort(T* arr, int start, int gap, int len) { for(int i = start + gap; i < len; i += gap) { int j = i; while(j >= gap && arr[j] > arr[j - gap]) { swap(arr[j], arr[j - gap]); j -= gap; } } } template void shellSort(T* arr, int len) { if(!arr) return; for(int gap = len/2; gap >= 1; gap /= 2) { for(int start = 0; start < gap; ++ start) insertSort(arr, start, gap, len); } } 计数排序 ----------- .. image:: ./07_counting.gif :width: 800px :align: center | .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: // 空间复杂度 O(n+k) void Sort(vector &arr, int maxVal) { int len = arr.size(); if (len < 1) return; vector count(maxVal + 1, 0); vector tmp(arr); for (auto x : arr) count[x]++; partial_sum(count.begin(), count.end(), count.begin()); for (int i = len - 1; i >= 0; --i) { int val = tmp[i]; arr[count[val] - 1] = val; count[val]--; } } // 空间复杂度 O(k) void Sort(vector &arr, int maxVal) { int len = arr.size(); if (len < 1) return; vector count(maxVal + 1, 0); for (auto x : arr) count[x]++; int i = 0; for (int x = 0; x <= maxVal; ++x) { while (count[x]-- > 0) arr[i++] = x; } } 桶排序 ------------ .. image:: ./07_bucket.gif :width: 800px :align: center 参考：https://blog.csdn.net/developer1024/article/details/79770240 .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: #include #include #include #include #include using namespace std; const int BUCKET_NUM = 10; struct ListNode { explicit ListNode(int i=0): mNext(NULL), mData(i){} ListNode* mNext; int mData; }; ListNode* insert(ListNode* head, int val) { ListNode dummyNode; ListNode *newNode = new ListNode(val); ListNode *pre, *curr; dummyNode.mNext = head; pre = &dummyNode; curr = head; while(NULL != curr && curr->mData <= val) { pre = curr; curr = curr->mNext; } newNode->mNext = curr; pre->mNext = newNode; return dummyNode.mNext; } ListNode* merge(ListNode *head1, ListNode *head2) { ListNode dummyNode; ListNode *dummy = &dummyNode; while(NULL != head1 && NULL != head2) { if(head1->mData <= head2->mData) { dummy->mNext = head1; head1 = head1->mNext; } else { dummy->mNext = head2; head2 = head2->mNext; } dummy = dummy->mNext; } if(NULL != head1) dummy->mNext = head1; if(NULL != head2) dummy->mNext = head2; return dummyNode.mNext; } void bucketSort(int n, int arr[]) { vector buckets(BUCKET_NUM,(ListNode*)(0)); auto p = minmax_element(arr, arr + n); int min_ele = *p.first; int max_ele = *p.second; int num_per_bucket = ceil((float)(max_ele - min_ele + 1) / BUCKET_NUM); // 插入桶中 for(int i=0; imData; head = head->mNext; } } 时间复杂度对于 :math:`n` 个待排数据， :math:`k` 个桶，平均每个桶 :math:`\frac{n}{k}` 个数据，桶内排序复杂度为 :math:`\mathcal{O}(\frac{n}{k} \log \frac{n}{k})` ，总体平均时间复杂度为： .. math:: \mathcal{O}(n) + \mathcal{O}(k * \frac{n}{k} \log \frac{n}{k}) = \mathcal{O}(n + n(\log n - \log k)). 当 :math:`n = k` ，每个桶只有一个数据，时间复杂度为 :math:`\mathcal{O}(n)` 。基数排序 -------------- .. image:: ./07_radix.gif :width: 800px :align: center | .. container:: toggle .. container:: header :math:`\color{darkgreen}{Code}` .. code-block:: cpp :linenos: // digit 表示关键字位数 void radixSort(int* arr, int len, int digit) { if(!arr) return; vector> radix(10, vector{}); int order = 1; while(digit--) { for(int i = 0; i < len; ++i) { int idx = (arr[i] / order) % 10; radix[idx].emplace_back(arr[i]); } int k = 0; for(int i = 0; i < 10; ++i) { int j = 0; while (j < radix[i].size()) arr[k++] = radix[i][j++]; while (j--) radix[i].pop_back(); } order *= 10; } } 总结 ------------- - 从平均时间来看，**快速排序** 是效率最高的，但快速排序在最坏情况下的时间性能不如堆排序和归并排序。 - 在 :math:`n` 较大时 **归并排序** 使用时间较少，但使用辅助空间较多。 - 当序列基本有序或 :math:`n` 较小时，直接 **插入排序** 是好的方法，因此常将它和其他的排序方法（如快速排序、归并排序等）结合在一起使用。 - **选择排序** 、 **堆排序** 、 **快速排序** 、 **希尔排序** 是不稳定的排序方法。 - **基数排序** 适用于 :math:`n` 较大而关键字位数较少的情况。 - **计数排序** 适用于 :math:`n` 较大而数值分布区间较小的情况。 - 如果我们只希望找到数组中前 :math:`k` 大的元素，且 :math:`k` 很小，则 **堆排序** 速度较快。参考资料 ------------ 1. 十大经典排序算法（动图演示） https://www.cnblogs.com/onepixel/p/7674659.html 2. 十大经典排序算法 https://zhuanlan.zhihu.com/p/41923298 3. 10大经典排序算法动图演示 https://www.cnblogs.com/zhuqi7758258/articles/10643262.html