0


<数据结构与算法>八大排序万字详解(Java实现).插入排序、希尔排序、堆排序、快速排序、归并排序、计数排序...

一.插入排序

(一).直接插入排序

1.思路:

直接插入排序,先假定前end个是有序的,把第end+1个插入到前end个元素当中,插入完之后end++。那么怎么插入呢?当然是从后往前一个一个比的呀,判断这个数是否小于前面这end个,如果小于,就把前面的数挪到后一个,然后这个数比完了就end--;如果大于,就把这个数放到end+1的位置上。一个数就插完啦

2.代码:

    public static void insertSort(int[] array) {
        for (int i = 0; i < array.length-1; i++) {
            int end = i;   //因为end每次放完一个,要往后走所以要循环++
            int tmp = array[end+1];//先将要比较的这个数字保存起来
            while(end >= 0){       //如果end没走完队头就继续向前比
                if(tmp<=array[end]){//如果tmp小,就把这个元素往后挪
                    array[end+1] = array[end];
                    end--;         //然后继续向前比
                }else{
                    break; //因为end可能是走到头了出循环,也可能
                }          //是tmp找到了自己的位置出循环,无论如何都要
            }              //放在end+1的位置上,所以直接break
            array[end+1] = tmp;//出了循环放tmp
        }
    }

3.时间复杂度

直接插入排序的时间复杂度是多少呢?

最坏的情况下:如果数组本身是逆序,你要排成升序,则次数为1+2+3+...+n-1=(n*(n-1))/2

                     所以时间复杂度为O(N2)

(二)希尔排序

1.思路:

希尔排序,是在直接插入排序基础上的优化。就是先进行分组直接插入排序(预排序),然后随着分组的越来越细,数组也越来越接近于有序。

多组间隔为gap的预排序,gap由大变小。gap越大,大的数越快的到后面,小的数越快的到前面。gap越大,排完越不接近于有序;gap越小,排完越接近于有序。当gap==1时,就变成了直接插入排序。

2.代码:

    public static void shellSort(int[] array){
        int gap = array.length;
        while(gap > 0){
            gap/=2;//间隔每次/2  也可以gap=gap/3+1;
            //把间隔为gap的多组数据同时插入排序(把1换成gap)
            for (int i = 0; i < array.length - gap; i++) {
                int end = i;
                int tmp = array[end+gap];
                while(end >= 0){
                    if(tmp < array[end]){
                        array[end+gap] = array[end];
                        end-=gap;
                    }else{
                        break;
                    }
                }
                array[end+gap] = tmp;
            }
        }
    }

3.时间复杂度

    public static void shellSort(int[] array){
        int gap = array.length;
        while(gap > 0){//这个循环的时间复杂度为logN 因为每次都除2
            gap/=2;
            //如果gap特别大,此循环时间复杂度为O(N)
            //如果gap特别小,此时数组已经块接近有序了,所以时间复杂度还是O(N)
            for (int i = 0; i < array.length - gap; i++) {
                int end = i;
                int tmp = array[end+gap];
                while(end >= 0){
                    if(tmp < array[end]){
                        array[end+gap] = array[end];
                        end-=gap;
                    }else{
                        break;
                    }
                }
                array[end+gap] = tmp;
            }
        }
    }

所以,时间复杂度为:O(NlogN) 或者 O(Nlog3N)

平均的时间复杂度是O(N^1.3)

二.选择排序

(一).直接选择排序(优化版)

1.思路:

普通的直接选择排序是遍历一遍选出最大(小)的数放在最后(前)边,然后再遍历一遍,再选出次大的数,依次往下走...

优化版的的直接选择排序是遍历一次选出两个(一个最大值,一个最小值),然后begin++,end--

再次遍历选出次大,次小的数,依次往下走...

2.代码:

    public static void selectSort(int[] array){
        int begin = 0;
        int end = array.length - 1;
        while(begin < end){
            int mini = begin;
            int maxi = begin;
            for (int i = begin; i <= end; i++) {
                if(array[i] < array[mini]){
                    mini = i;
                }
                if(array[i] > array[maxi]){
                    maxi = i;
                }
            }
            //交换最小值和begin,使得最小值在前
            int tmp = array[mini];
            array[mini] = array[begin];
            array[begin] = tmp;
            if(maxi == begin){//如果刚刚被交换的begin刚好是最大值
                maxi = mini;  //那么需要调整一下
            }
            //交换最大的和end,使得最大值在后
            tmp = array[maxi];
            array[maxi] = array[end];
            array[end] = tmp;
            begin++; //找完一遍,begin++ end--
            end--;
        }
    }

3.时间复杂度

N N-2 N-4 N-6...

所以,时间复杂度为:O(N^2)

由此可见,直接选择排序的效率最低

(二).堆排序

1.堆的铺垫

(借用一张图)

如图所示,堆的逻辑结构是一颗完全二叉树。堆的物理结构是一个数组。

通过下标访问父子关系的结点,下标关系如下:

leftchild = parent*2 + 1

rightchild = parent*2 + 2

parent = (child - 1) / 2

大堆要求:树中所有的父亲都大于等于孩子 ——>根是最大的

小队要求:树中所有的父亲都小于等于孩子 ——>根是最小的

2.向下调整算法(建小堆为例)

前提:如果小堆的向下调整算法,前提左右子树必须都是小堆才能使用—>最多调整高度次,

** 时间复杂度为O(logN)**

思路:从根节点开始,选出左右孩子中小的那个,跟父亲比较,如果比父亲小就交换。然后在继续往下调,调到叶子结点或都比父亲大就终止

代码:

    //向下调整算法
    public static void adjustDown(int[] array ,int n ,int root){
        int parent = root;
        int child = parent *2 + 1;//默认是左孩子小
        while(child < n){
            //选出左右孩子中小的那个
            if(child+1 < n && array[child+1]<array[child]){
                child++;//因为是连续空间,所以++child就为右孩子
            }
            //孩子与父亲比较
            if(array[child] < array[parent]){
                //孩子小,交换父子值
                int tmp = array[child];
                array[child] = array[parent];
                array[parent] = tmp;
                //此时的父亲向下走,孩子也跟着走
                parent = child;
                child = parent *2 + 1;
            }else{ //孩子比父亲大,说明排完序了
                break;
            }
        }
    }

3.建堆

思路:用向下调整算法就可以进行排序,但是如果左右子树不是小堆就不能用向下调整算法了。怎么办?

所以,我们想出了对策,倒着从最后一颗子树开始调(即根从下往上走),这样就可以保证,从下往上依次都是小堆。

再分析倒着走,叶子没有孩子不需要调,所以我们从最后一个非叶子子树开始调(即最后一个元素的父亲),下标为 (n-1-1) / 2,然后root依次变小

代码:

    public static void heapSort(int[] array,int n){
        //建堆
        for (int i = (n-1-1)/2; i >= 0; i--) {
            adjustDown(array,n,i);//根从下往上走(变小)
        }
    }

时间复杂度:O(N)

** 建堆的时间复杂度(计算次数)计算是个很复杂的过程,要列出公式错位相减,**

** 最后推出t(n)=N-logN , 所以其时间复杂度为O(N)**

注:如果建大堆,就把向下调整算法中,选孩子中小的改为大的,然后孩子大于父亲才交换,就可以了。

4.排升序建大堆还是建小堆?

排升序要建大堆!!!!!

因为每次建大堆的根为最大的数,把他放到最后面,然后n--,把前n-1个数继续向下调整,找出次大的数,在把他放到倒数第二的位置上,以此类推...时间复杂度可以为O(N*logN)

如果要建小堆,那么你第一个根虽然是最小的,但是你除去第一个数,后面的n-1个数怎么找出最小的数呢?还是得重新建堆,那么时间复杂度就是O(N^2)了,效率很低

5.排升序整体代码

    //向下调整算法 建大堆
    public static void adjustDown(int[] array ,int n ,int root){
        int parent = root;
        int child = parent *2 + 1;//默认是左孩子大
        while(child < n){
            //选出左右孩子中大的那个
            if(child+1 < n && array[child+1]>array[child]){
                child++;//因为是连续空间,所以++child就为右孩子
            }
            //孩子与父亲比较
            if(array[child] > array[parent]){
                //孩子大,交换父子值
                int tmp = array[child];
                array[child] = array[parent];
                array[parent] = tmp;
                //此时的父亲向下走,孩子也跟着走
                parent = child;
                child = parent *2 + 1;
            }else{ //孩子比父亲小,说明排完序了
                break;
            }
        }
    }
    public static void heapSort(int[] array,int n){
        //建堆
        for (int i = (n-1-1)/2; i >= 0; i--) {
            adjustDown(array,n,i); //先建一个大堆,选出最大的数
        }
        int end = n - 1; //end表示进入下一次堆排序的元素个数,也表示最后的下标
        while(end > 0){
            int tmp = array[0];//先把最大的数挪到最后
            array[0] = array[end];
            array[end] = tmp;
            adjustDown(array,end,0);//再继续向下调整,元素个数为end个
            --end; //进堆的个数--
        }
    }

6.整体时间复杂度:

     堆的时间复杂度主要是有两部分组成:初始化建堆(O(N))+排序重建堆(N*O(logN))

三.交换排序

(一).冒泡排序

1.思路:

冒泡排序的思路非常简单,就是从头把第i个数与第i+1个数比较,如果比他大就交换位置,然后i++。以此类推,就把最大的数放到了最后面。然后再继续从头一个一个比较,到倒数第二个数停,这时次大的数就被交换到这个位置了,依次类推...

2.代码:

    public static void bubbleSort(int[] array){
        for (int i = 0; i < array.length - 1; i++) {//冒泡排序的趟数
            int exchange = 0;//作为某一趟是否交换的标志
            for (int j = 0; j < array.length - 1 - i; j++) {//每趟要比较多少次
                if(array[j] > array[j+1]){
                    int tmp = array[j];
                    array[j] = array[j+1];
                    array[j+1] = tmp;
                    exchange = 1;
                }
            }
            if(exchange == 0){//说明这一趟没交换
                break;
            }
        }
    }

3.时间复杂度:

N-1 N-2 N-3 N-4 ...

所以时间复杂度为:O(N^2)

4.冒泡与直接插入排序相比谁更优?

先说结果,直接插入排序更强

他俩对于一般的都是O(N^2),但是对于有序、接近有序或局部有序,插入排序的适应性更强

例:1 2 3 5 4 6

冒泡:N+1 + N+2 插入排序:N

(二).快速排序

单趟排序的不同方法

1.挖坑法

a.思路:

先拿一趟说思路,一个数怎么才能找到自己排完序时的位置呢?我们可以想到,当排完序时,一个数的左边都是比他小的数,右边都是比他大的数。所以我们可以让一个数的左边都是小于它的,右边都是大于它的,来找到它应该在的位置。那么应该怎样做到呢?我们可以先排第一个数,把第一个数设为key,此时这个位置就可以被覆盖,即挖了个坑。让end从右边往左找比他小的,找到了放到坑里,end作为新的坑。让begin从左边找比他大的,找到了放到右边的坑里,形成新的坑,以此类推下去...最终当begin==end时,此时的坑就是key应该在的位置,key就找到了自己的位置。

那么这是一个数找到了位置,我们怎么排下去呢?这就用到了分治算法(递归)。我们可以把key左边看成一段新的数组,右边看成一段新的数组。继续找新的key...直到不能再分下去为止...

如图所示:

(借用一张图)

b.代码:

    public static void quickSort(int[] array,int left,int right){
        if(left>=right){//如果只剩1个,就不用再分
            return;
        }
        int begin = left;
        int end = right;
        int pivot = begin;
        int key = array[begin];
        while(begin < end){//如果begin小于end才继续
            //从右往左找比key小的
            while(begin<end && array[end]>=key){//因为循环里面begin与end也会改变,所以需要再次判断
                end--;//如果不比key小end就--
            }
            array[pivot] = array[end];//比key小就放到坑里
            pivot = end; //end形成新的坑
            //从左往右找比key大的
            while(begin<end && array[begin]<=key){
                begin++;
            }
            array[pivot] = array[begin];
            pivot = begin;
        }
        array[pivot] = key;
        //[left,right]——>[left,pivot-1] pivot [pivot+1,right]
        //所以递归下去
        quickSort(array,left,pivot-1);
        quickSort(array,pivot+1,right);
    }

c.时间复杂度:

其单趟排序,虽然是两个while,但是只遍历一遍,所以是O(N)

那么快排要排几趟呢?最理想的情况下就是pivot每次都把数组二分

那么就需要logN次

所以,整体的时间复杂度是:O(N*logN)

d.快排什么情况下最坏?

答:有序的情况下。因为如果数组有序,那么快排每趟排序只将一个数与数组分离,只安排好了一个数。此时的时间复杂度为O(N^2)

e.三数取中

我们刚刚发现,如果快排的key总取最值的话,会使快排退化到O(N^2),所以我们采取一种解决方式:三数取中

思路:我们让key等于下标为left,right和mid这三个数的中间值。这样可以保证key每次都取不到最值

f.优化快排

三数取中快排代码:

    //三数取中
    public static int getMid(int[] array,int left,int right){
        int mid = (left + right)/2;
        if(array[left]>array[mid]){
            if(array[right]>array[left]){
                return left;
            }else if(array[mid]>array[right]){
                return mid;
            }else{
                return right;
            }
        }else{//array[left]<array[mid]
            if(array[mid]<array[right]){
                return mid;
            }else if(array[left]>array[right]){
                return left;
            }else{
                return right;
            }
        }
    }

    public static void quickSort(int[] array,int left,int right){
        if(left>=right){//如果只剩1个,就不用再分
            return;
        }
        //得到中数下标
        int mid = getMid(array,left,right);
        //交换一下第一个数和中间值,使得begin取的数是中间值
        if(mid!=left) {
            int tmp = array[mid];
            array[mid] = array[left];
            array[left] = tmp;
        }
        int begin = left;
        int end = right;
        int pivot = begin;
        int key = array[begin];
        while(begin < end){//如果begin小于end才继续
            //从右往左找比key小的
            while(begin<end && array[end]>=key){//因为循环里面begin与end也会改变,所以需要再次判断
                end--;//如果不比key小end就--
            }
            array[pivot] = array[end];//比key小就放到坑里
            pivot = end; //end形成新的坑
            //从左往右找比key大的
            while(begin<end && array[begin]<=key){
                begin++;
            }
            array[pivot] = array[begin];
            pivot = begin;
        }
        array[pivot] = key;
        //[left,right]——>[left,pivot-1] pivot [pivot+1,right]
        //所以递归下去
        quickSort(array,left,pivot-1);
        quickSort(array,pivot+1,right);
    }

g.小区间优化:

我们知道递归调用每次把数据分段,如果调到最后几层,会把1000000个数分成好多份,会产生大量的递归调用。我们主要的递归调用次数就是在最后几层。所以我们采用小区间优化的方法

思路:就是如果区间小于某一值我们就不用递归排序,而是选择直接插入排序排这几个数

代码:

鄙人还没有能力用Java写出小区间优化,所以只能用C顶一下(个_个)

2.左右指针法

a.思路:单趟排序的第二种方法,左右指针法。与挖坑法有一些相同之处,也是先定一个key,然后begin找大,end找小。只不过,当begin和end找到时直接把他俩交换。因为一开始begin这边就少一个数(key),根据一一对应的原则,当end与begin相遇时,这里的值一定小于key。所以直接把key与begin的值交换一下

b.代码:

    //左右指针法    
    public static int partSort2(int[] array,int left,int right){
        //得到中数下标
        int mid = getMid(array,left,right);
        //交换一下第一个数和中间值,使得begin取的数是中间值
        if(mid!=left) {
            int tmp = array[mid];
            array[mid] = array[left];
            array[left] = tmp;
        }
        int begin = left;
        int end = right;
        int keyi = begin;
        int key = array[begin];
        while(begin<end){
            //end找小
            while(begin<end && array[end]>=key){
                end--;
            }
            //begin找大
            while(begin<end && array[begin]<=key){
                begin++;
            }
            //左右一交换
            int tmp = array[end];
            array[end] = array[begin];
            array[begin] = tmp;
        }
        //begin与keyi的值一交换
        int tmp = array[begin];
        array[begin] = array[keyi];
        array[keyi] = tmp;
        return begin;
    }

    public static void quickSort(int[] array,int left,int right){
        if(left>=right){//如果只剩1个,就不用再分
            return;
        }
        int keyIndex = partSort2(array,left,right);
        //[left,right]——>[left,keyIndex-1] keyIndex [keyIndex+1,right]
        //所以递归下去
        quickSort(array,left,keyIndex-1);
        quickSort(array,keyIndex+1,right);
    }

3.前后指针法

a.思路:同样的先定一个key。然后定义两个变量prev,cur做下标,cur从头开始找比key小的。在cur找的过程中,cur与prev中间间隔的数字就是比key大的。cur找到了,prev++,然后他俩交换。如果没找到cur就继续++。只到走到头,这时候prev的值是比key小的,所以把keyi与prev的值交换。

b.代码:

    public static int partSort3(int[] array,int left,int right){
        //得到中数下标
        int mid = getMid(array,left,right);
        //交换一下第一个数和中间值,使得begin取的数是中间值
        if(mid!=left) {
            int tmp = array[mid];
            array[mid] = array[left];
            array[left] = tmp;
        }
        int keyi = left;
        int prev = left;
        int cur = left+1;
        while(cur <= right){
            if(array[cur]<array[keyi] && ++prev!=cur){//如果prev++之后还是cur                                
                int tmp = array[prev];       //++肯定要++,但是自己和自己交换没意义
                array[prev] = array[cur];
                array[cur] = tmp;
            }
            cur++;
        }
        int tmp = array[keyi];
        array[keyi] = array[prev];
        array[prev] = tmp;
        return prev;
    }
    public static void quickSort(int[] array,int left,int right){
        if(left>=right){//如果只剩1个,就不用再分
            return;
        }
        int keyIndex = partSort3(array,left,right);
        //[left,right]——>[left,keyIndex-1] keyIndex [keyIndex+1,right]
        //所以递归下去
        quickSort(array,left,keyIndex-1);
        quickSort(array,keyIndex+1,right);
    }

四.归并排序

(一).归并排序

1.思路:

先假设一个前提,把一个数组分成两半区间,如果左半区间有序,右半区间有序。那么我们就可以采用归并算法,依次对比取小的放到新的临时数组中。然后再拷贝回来。

那么再归并之前,左右子区间没有序怎么办?那就先递归分到区间只剩一个元素的时候,再合并,在left和right新的数组下标内排序。最后一起拷贝到array中

逻辑类似于二叉树的后序

2.代码:

#include<stdlib.h>
void _mergeSort(int* a, int left, int right, int* tmp)
{
    if (left >= right)
        return;
    int mid = (left + right) >> 1;//相当于/2
    //把数组二分进行递归
    //把数组分为[left,mid]和[mid+1,right]两个区间
    _mergeSort(a, left, mid, tmp);
    _mergeSort(a, mid + 1, right, tmp);
    //分好 进行归并
    int begin1 = left, end1 = mid;
    int begin2 = mid + 1, end2 = right;
    int index = left;
    //一个个比较在tmp里排序
    while (begin1 <= end1 && begin2 <= end2)
    {
        if (a[begin1] < a[begin2])
        {
            tmp[index++] = a[begin1++];
        }
        else
        {
            tmp[index++] = a[begin2++];
        }
    }
    //有一个走完,把另一个全部拷过去
    while (begin1 <= end1)
    {
        tmp[index++] = a[begin1++];
    }
    while (begin2 <= end2)
    {
        tmp[index++] = a[begin2++];
    }
    //所有数已经在tmp内排完啦,最后把tmp拷贝到a中
    for (int i = left; i <= right; i++)
    {
        a[i] = tmp[i];
    }
}
void mergeSort(int array[], int n)
{
    int* tmp = (int*)malloc(sizeof(int) * n);//动态开辟一个数组,把数拷贝到这里交换
    //因为如果在这个函数里递归,那么就会动态开辟很多个数组,所以要另一个子函数
    _mergeSort(array, 0, n - 1, tmp);//把两个数组给它,还有数组的下标
    free(tmp);
}

3.对文件中的数据排序:

归并排序又叫外排序。可以对文件中的数据进行排序。因为文件中数据的读取不支持随机访问,所以别的排序失效。

问题:假设10G的数据放在硬盘的文件中,要排序,如何排呢?(可能内存不够,假设有1G内存可以用)

思路:把10G的文件切分成10个1G的文件,用归并排序把这些1G的文件排有序。最后再磁盘上将这些1G的文件进行归并

五.非递归的归并排序与快排

此内容有待开发...过段时间会补上的!!!

六.计数排序

(一).计数排序

1.思路:

计数排序是一种非比较排序,顾名思义就是先malloc一块新的数组,然后每个数字对应一个位置,这个位置存放数字出现的次数,利用相对映射,再讲array中的数重新输入。

2.代码:

void countSort(int a[], int n)
{
    int min = a[0];
    int max = a[0];
    for (int i = 0; i < n; i++)//找出最大值和最小值
    {
        if (a[i] > max)
        {
            max = a[i];
        }
        if (a[i] < min)
        {
            min = a[i];
        }
    }
    int range = max - min + 1;//算出范围 用于动态申请和相对映射
    int* count = (int*)malloc(sizeof(int) * range);
    memset(count, 0, sizeof(int) * range);//初始化数组为0
    //开始计数
    for (int i = 0; i < n; i++)
    {
        count[a[i] - min]++;//相对映射
    }
    //开始将计数转化成数
    int j = 0;
    for (int i = 0; i < range; i++)
    {
        while (count[i]--)
        {
            a[j++] = i + min;
        }
    }
}

3.时间/空间复杂度:

时间复杂度:O(N+range) 说明它适用于集中一组整形数据排序

空间复杂度:O(range)

七.七大排序的总结对比

(借用一张图)

注:快排带有三数取中的时候最坏情况基本不会出现

   稳定性: 如果你排序的数据中有相同的数字,当排完序之后这两个相同的数字相对顺序不会变,就是稳定的;否则就是不稳定的。(假设要求成绩相同时,先提交的在前,这时候就得用稳定的排序了)

本文转载自: https://blog.csdn.net/weixin_63895720/article/details/124532426
版权归原作者 .峰峰 所有, 如有侵权,请联系我们删除。

“<数据结构与算法>八大排序万字详解(Java实现).插入排序、希尔排序、堆排序、快速排序、归并排序、计数排序...”的评论:

还没有评论