堆排序基础讲解(代码+注释)
首先,推荐一下《算法导论》的第六章—堆排序,在网上找了很多资料,发现还是这本圣经最给力。大家学堆排序一定要去看看,不然是一种浪费。如果大家没有,可以去网上下载英文版(chm版)的,既清晰又适合阅读。 其实堆排序的讲解网上很多,而且基本都一样,不过我还是把一些基本概念写出来: 堆:(二叉)堆数据结构是一种数组对象。它可以被视为一棵完全二叉树,树中每个结点与数组中存放该结点值的那个元素对应。 二叉堆有两种:最大堆和最小堆(小根堆)。 最大堆:所有节点的子节点比其自身小的堆。 堆排序:堆排序利用了大根堆(或小根堆)堆顶记录的关键字最大(或最小)这一特征,使得在当前无序区中选取最大(或最小)关键字的记录变得简单 在堆排序算法中,使用的是最大堆,最小堆通常在构造优先级队列时使用。 再次提醒大家,去看看《算法导论》里的第六章-堆排序。因为书上讲的太详细了,所以我也就不再多说。 这里我把《算法导论》上的伪代码用C/C++实现了,每个函数我都用自己的理解写出来了,如果大家还不懂,可以留言。
/* * Author: Tanky Woo * Blog: www.WuTianQi.com * Data: 2010.12.20 * Note: 堆排序(Heap Sort) */ #include <iostream> using namespace std; // 输出当前堆的排序状况 void PrintArray(int data[],int size) { for (int i=1; i<=size; ++i) cout <<data[i]<<" "; cout<<endl; } // 堆化,保持堆的性质 // MaxHeapify让a[i]在最大堆中"下降", // 使以i为根的子树成为最大堆 void MaxHeapify(int *a,int i,int size) { int lt = 2*i,rt = 2*i+1; int largest; if(lt <= size && a[lt] > a[i]) largest = lt; else largest = i; if(rt <= size && a[rt] > a[largest]) largest = rt; if(largest != i) { int temp = a[i]; a[i] = a[largest]; a[largest] = temp; MaxHeapify(a,largest,size); } } // 建堆 // 自底而上地调用MaxHeapify来将一个数组a[1..size]变成一个最大堆 // void BuildMaxHeap(int *a,int size) { for(int i=size/2; i>=1; --i) MaxHeapify(a,i,size); } // 堆排序 // 初始调用BuildMaxHeap将a[1..size]变成最大堆 // 因为数组最大元素在a[1],则可以通过将a[1]与a[size]互换达到正确位置 // 现在新的根元素破坏了最大堆的性质,所以调用MaxHeapify调整, // 使a[1..size-1]成为最大堆,a[1]又是a[1..size-1]中的最大元素, // 将a[1]与a[size-1]互换达到正确位置。 // 反复调用Heapify,使整个数组成从小到大排序。 // 注意: 交换只是破坏了以a[1]为根的二叉树最大堆性质,它的左右子二叉树还是具备最大堆性质。 // 这也是为何在BuildMaxHeap时需要遍历size/2到1的结点才能构成最大堆,而这里只需要堆化a[1]即可。 void HeapSort(int *a,int size) { BuildMaxHeap(a,size); PrintArray(a,size); int len = size; for(int i=size; i>=2; --i) { int temp = a[1]; a[1] = a[i]; a[i] = temp; len--; MaxHeapify(a,1,len); cout << "中间过程:"; PrintArray(a,size); } } int main() { int size; int arr[100]; cout << "Input the num of elements:n"; cin >> size; cout << "Input the elements:n"; for(int i=1; i<=size; ++i) cin >> arr[i]; cout << endl; HeapSort(arr,size); cout << "最后结果:"; PrintArray(arr,size); } 1.区别length[A]和heap-sort[A]。(P73)(这个在下一篇的优先级队列中将会具体区别) 2.总体上看堆排序由三个函数组成:①.MAX-HEAPIFY ②.BUILD-MAX-HEAP ③.HEAP-SORT 另外,在这里给大家补充一点个人经验,有时理论难以理解,代码难以理解,这个时候,就要靠秘诀了:拿起手中的笔和纸,自己给出一组输入,按照书上的代码,自己去模拟这组输入的执行过程。(这个过程人人都知道,但并不是人人都去做了!学算法,就要自己去模拟,去画图,去推!怎么样容易理解就怎么去做!) 所以这也是我喜欢《算法导论》的原因,接下来,就要强烈推荐大家看《算法导论》上非常非常给力的堆排序实现图了—图6-4。 总结:本章最基础也是最重要的就是理解堆这种结构! 堆是什么?来看看《算法导论》上的图6-1:
图(a)是一个最大堆,图(b)是最大堆的数组表示。可以看到堆的数组并不是已排序好的。 让我们来回忆下最大堆的定义(P74): 在最大堆中,最大堆特性是指除了根以外的每个结点i,有A[PARENT(i)] >= A[i]。这样,堆的最大元素就存放在根结点中。 对,堆排序就是利用的这个特性—“堆的最大元素就存放在根结点中” 每次堆化,这样就找到了当前堆的最大元素。 所以说,理解了其本质特征,堆排序其实很简单的。 最后,给大家推荐我在网上看到的写的不错的几篇堆排序文章: 1.http://blog.csdn.net/super_chris/archive/2009/09/22/4581900.aspx ? 这一篇讲得很细致。 2.http://blog.csdn.net/made_in_chn/archive/2010/04/12/5473871.aspx ? 大家可以看看文章里的图,注意那是最小堆实现的图。 3.http://blog.csdn.net/midgard/archive/2009/04/14/4070074.aspx ? 同样讲的很细致的一篇。 4.http://student.zjzk.cn/course_ware/data_structure/web/paixu/paixu8.4.2.2.htm ?? 这是网站很给力,有flash模拟堆排序,大家可以实际去看看。 转自:http://www.wutianqi.com/?p=1820 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |