前言
在我们生活的这个世界中到处都是被排序过的东东。站队的时候会按照身高排序,考试的名次需要按照分数排序,网上购物的时候会按照价格排序,电子邮箱中的邮件按照时间排序……总之很多东东都需要排序,可以说排序是无处不在。现在我们举个具体的例子来介绍一下排序算法。
桶排序
首先出场的是我们的主人公小哼,上面这个可爱的娃就是啦。期末考试完了老师要将同学们的分数按照从高到低排序。小哼的班上只有 5 个同学,这 5 个同学分别考了 5分、3 分、5 分、2 分和 8 分,哎,考得真是惨不忍睹(满分是 10 分) 。接下来将分数进行从大到小排序,排序后是 8 5 5 3 2。你有没有什么好方法编写一段程序,让计算机随机读入 5个数然后将这 5 个数从大到小输出?请先想一想,至少想 15 分钟再往下看吧(*^__^*) 。
我们这里只需借助一个一维数组就可以解决这个问题。请确定你真的仔细想过再往下看哦。 首先我们需要申请一个大小为 11 的数组 int a[11]。OK,现在你已经有了 11 个变量,编号从 a[0]~a[10]。刚开始的时候,我们将 a[0]~a[10]都初始化为 0,表示这些分数还都没有人得过。例如 a[0]等于 0 就表示目前还没有人得过 0 分,同理 a[1]等于 0 就表示目前还没人得过 1 分……a[10]等于 0 就表示目前还没有人得过 10 分。
下面开始处理每一个人的分数,第一个人的分数是 5 分,我们就将相对应的 a[5]的值在原来的基础增加 1,即将 a[5]的值从 0 改为 1,表示 5 分出现过了一次。
第二个人的分数是 3 分,我们就把相对应的 a[3]的值在原来的基础上增加 1,即将 a[3]的值从 0 改为 1,表示 3分出现过了一次。
注意啦!第三个人的分数也是 5 分,所以 a[5]的值需要在此基础上再增加 1,即将 a[5]的值从 1 改为 2,表示 5分出现过了两次。
按照刚才的方法处理第四个和第五个人的分数。最终结果就是下面这个图啦。
你发现没有,a[0]~a[10]中的数值其实就是 0 分到 10 分每个分数出现的次数。接下来,我们只需要将出现过的分数打印出来就可以了,出现几次就打印几次,具体如下。
a[0]为 0,表示“0”没有出现过,不打印。 a[1]为 0,表示“1”没有出现过,不打印。 a[2]为 1,表示“2”出现过 1 次,打印 2。 a[3]为 1,表示“3”出现过 1 次,打印 3。 a[4]为 0,表示“4”没有出现过,不打印。 a[5]为 2,表示“5”出现过 2 次,打印 5 5。 a[6]为 0,表示“6”没有出现过,不打印。 a[7]为 0,表示“7”没有出现过,不打印。 a[8]为 1,表示“8”出现过 1 次,打印 8。 a[9]为 0,表示“9”没有出现过,不打印。 a[10]为 0,表示“10”没有出现过,不打印。
最终屏幕输出“2 3 5 5 8” ,完整的代码如下。
#include int main() { int a[11],i,j,t; for(i=0;i<=10;i++) a[i]=0; //初始化为0 for(i=1;i<=5;i++) //循环读入5个数 { scanf("%d",&t); //把每一个数读到变量t中 a[t]++; //进行计数 } for(i=0;i<=10;i++) //依次判断a[0]~a[10] for(j=1;j<=a[i];j++) //出现了几次就打印几次 printf("%d ",i); getchar();getchar(); //这里的getchar();用来暂停程序,以便查看程序输出的内容 //也可以用system("pause");等来代替 return 0; }
输入数据为:
5 3 5 2 8
仔细观察的同学会发现,刚才实现的是从小到大排序。但是我们要求是从大到小排序,这该怎么办呢?还是先自己想一想再往下看哦。
其实很简单。 只需要将 for(i=0;i<=10;i++)改为 for(i=10;i>=0;i–)就 OK啦, 快去试一试吧。
这种排序方法我们暂且叫它“桶排序” 。因为其实真正的桶排序要比这个复杂一些,以后再详细讨论,目前此算法已经能够满足我们的需求了。
这个算法就好比有 11 个桶,编号从 0~10。每出现一个数,就在对应编号的桶中放一个小旗子,最后只要数数每个桶中有几个小旗子就 OK了。例如 2 号桶中有 1 个小旗子,表示2 出现了一次;3 号桶中有 1 个小旗子,表示 3 出现了一次;5 号桶中有 2 个小旗子,表示 5出现了两次;8 号桶中有 1 个小旗子,表示 8出现了一次。
现在你可以尝试一下输入 n 个 0~1000 之间的整数,将它们从大到小排序。提醒一下,如果需要对数据范围在 0~1000 的整数进行排序,我们需要 1001 个桶,来表示 0~1000 之间每一个数出现的次数,这一点一定要注意。另外,此处的每一个桶的作用其实就是“标记”每个数出现的次数,因此我喜欢将之前的数组 a 换个更贴切的名字 book(book 这个单词有记录、标记的意思) ,代码实现如下。
#include int main() { int book[1001],i,j,t,n; for(i=0;i<=1000;i++) book[i]=0; scanf("%d",&n);//输入一个数n,表示接下来有n个数 for(i=1;i<=n;i++)//循环读入n个数,并进行桶排序 { scanf("%d",&t); //把每一个数读到变量t中 book[t]++; //进行计数,对编号为t的桶放一个小旗子 } for(i=1000;i>=0;i--) //依次判断编号1000~0的桶 for(j=1;j<=book[i];j++) //出现了几次就将桶的编号打印几次 printf("%d ",i); getchar();getchar(); return 0; }
可以输入以下数据进行验证。
10 8 100 50 22 15 6 1 1000 999 0
运行结果是:
1000 999 100 50 22 15 8 6 1 0
最后来说下时间复杂度的问题。代码中第 6 行的循环一共循环了 m次(m为桶的个数),第 9 行的代码循环了 n 次(n 为待排序数的个数) ,第 14 行和第 15 行一共循环了 m+n 次。所以整个排序算法一共执行了 m+n+m+n 次。我们用大写字母 O来表示时间复杂度,因此该算法的时间复杂度是 O(m+n+m+n)即 O(2*(m+n))。我们在说时间复杂度的时候可以忽略较小的常数,最终桶排序的时间复杂度为 O(m+n)。还有一点,在表示时间复杂度的时候,n 和 m通常用大写字母即 O(M+N)。
这是一个非常快的排序算法。桶排序从 1956 年就开始被使用,该算法的基本思想是由E.J. Issac 和 R.C. Singleton 提出来的。之前我说过,其实这并不是真正的桶排序算法,真正的桶排序算法要比这个更加复杂。但是考虑到此处是算法讲解的第一篇,我想还是越简单易懂越好,真正的桶排序留在以后再聊吧。需要说明一点的是:我们目前学习的简化版桶排序算法,其本质上还不能算是一个真正意义上的排序算法。为什么呢?例如遇到下面这个例子就没辙了。
现在分别有 5 个人的名字和分数: huhu 5 分、 haha 3分、 xixi 5 分、 hengheng 2 分和 gaoshou 8 分。 请按照分数从高到低, 输出他们的名字。 即应该输出 gaoshou、 huhu、 xixi、 haha、 hengheng。
发现问题了没有?如果使用我们刚才简化版的桶排序算法仅仅是把分数进行了排序。 最终输出的也仅仅是分数,但没有对人本身进行排序。也就是说,我们现在并不知道排序后的分数原本对应着哪一个人!这该怎么办呢?下篇文章将介绍——冒泡排序。