今天要和大家一起步入一个新的数据结构--二叉树。在学习了解二叉树之前我们先来了解什么是树。
以下是本篇的主要内容及目录
1.树的概念及其结构
1.1树的概念
在之前我们所学习的顺序表,链表等都是线性结构,而树是一种典型的非线性结构,它是由n(n>=0)个有限结点组成的一个具有层次关系的集合。把它叫做树是因为它的结构看起来像一个倒挂的树,也就是说它是根朝上,叶子朝下的。
1.有一个特殊的结点,称为根节点,根节点没有前驱结点。
2.除根节点外,*其余结点被分成*M(M>0)个互不相交的集合T1*、T2、……、*Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继。
3.因此,树是递归定义的。
** 需要注意的是,在树形结构中,子树与子树之间不能有交集,否则就不是树形结构。例如如下这个就不是树形结构,正是因为子树之间存在交集。**
因此我们需要知道:
子树是不能相交的。如果这个不好理解我们可以看树形图,如果在树形图中构成了回路,也就是封闭的环形结构,就不是树形结构(如下图这个例子所示)。
1.2树的相关概念(重点*)
节点的度:一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
叶节点或终端节点:度为0的节点称为叶节点; 如上图:B、C、H、I...等节点为叶节点
非终端节点或分支节点:度不为0的节点; 如上图:D、E、F、G...等节点为分支节点
双亲节点或父节点:若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点
兄弟节点:具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
树的度:一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
节点的层次:从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度:树中节点的最大层次; 如上图:树的高度为4
堂兄弟节点:双亲在同一层的节点互为堂兄弟;如上图:H、I互为堂兄弟节点
节点的祖先:从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
子孙:以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙。
森林:由m(m>0)棵互不相交的树的集合称为森林。
这些相关概念是比较重要的因此我们需要记性理解记忆。
其中由概念我们可以得到以下两个规律:
1.除了根节点外,每个结点有且仅有一个父节点。
2.一颗N个结点的树有N-1条边(解释:由于两个节点之间有且仅有一个边连接,可以使用递推想法,3个节点有2条边相连,4个节点有3条边相连.....N个节点有N-1条边相连)。
1.3树的表示
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间 *的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的*孩子兄弟表示法。
typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};
我们通过画图分析更好的理解一下。
2.二叉树概念及结构
2.1概念
一棵二叉树是结点的一个有限集合,该集合:
或者为空
由一个根节点加上两棵别称为左子树和右子树的二叉树组成
从上图可以看出:
二叉树不存在度大于2的结点
二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
** 注意:对于任意的二叉树都是由以下几种情况复合而成的:**
我们举一个现实生活中的小例子:
2.2特殊的二叉树
满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是 说,如果一个二叉树的层数为K,且结点总数是2^k -1 ,则它就是满二叉树。
完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K 的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
满二叉树节点总数N:
结点总数N(等比数列求和)
2.3二叉树的性质(重要*)
- 若规定根节点的层数为1,则一棵非空二叉树的*第i*层上最多有 2^(i-1)**个结点(排满时).
2.若规定根节点的层数为1,则深度为h的二叉树的最大结点数是2^h -1(满二叉树).
- 对任何一棵二叉树, *如果度为0*其叶结点个数为n0 **, 度为2**的分支结点个数为n2 ****,**则有
n0 =n2 +****1.
- 若规定根节点的层数为1,具有n个结点的满二叉树的深度,h= log2(n+1).(log2(n+1)表示log以2为底数,n+1为对数)。
5.对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
a. 若i > 0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点
b. 若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子
c. 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子
2.4练习题
- 某二叉树共有 399 个结点,其中有 199 个度为 2 的结点,则该二叉树中的叶子结点数为(B)
A. 不存在这样的二叉树
B. 200
C. 198
D. 199
解:根据二叉树性质3:对任何一棵二叉树, *如果度为0其叶结点个数为n0 **, 度为2**的分支结点个数为n2 **,则有n0 =n2 +**1.*** **
题目中说度为2的节点有199个,因此n2=199,因此根据公式n0=n2+1得到n0=200.因此叶子结点数n0=200.
2.下列数据结构中,不适合采用顺序存储结构的是(A)
A 非完全二叉树
B 堆
C 队列
D 栈
3.在具有 2n 个结点的完全二叉树中,叶子结点个数为(A)
A n
B n+1
C n-1
D n/2
解:
4.一棵完全二叉树的节点数位为531个,那么这棵树的高度为(B)
A 11
B 10
C 8
D 12
解:在完全二叉树中,假设该树的高度为h,则完全二叉树的h-1层都是满的,因此完全二叉树的节点数范围为2^(h-1)-1 ~ 2^h -1。因此我们将10代入时,范围是 511~1023。
**2.5 ****二叉树的存储结构 **
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
1. 顺序存储
顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,二叉树顺****序存储在物理上是一个数组,在逻辑上是一颗二叉树。
2.链式存储
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链。
a)二叉链
typedef int BTDataType;
//二叉链
typedef struct BinaryTreeNode
{
struct BinaryTreeNode* left; //左子树
struct BinaryTreeNode* right;//右子树
BTDataType data; //值
}BTNode;
b)三叉链
// 三叉链
struct BinaryTreeNode
{
struct BinTreeNode* _pParent; // 指向当前节点的双亲
struct BinTreeNode* _pLeft; // 指向当前节点左孩子
struct BinTreeNode* _pRight; // 指向当前节点右孩子
BTDataType _data; // 当前节点值域
};
3.二叉树的顺序结构及实现
**3.1 **二叉树的顺序结构
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结 构存储。现实中我们通常把堆**(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。**
3.2堆概念及其结构
3.2.1堆的实现
堆的相关知识我总结成了一篇独立的博客,大家可以点击这个哦~
[ 数据结构-C实现 ] 堆、堆排序的分析及实现
3.2.2堆的时间复杂度
[ 数据结构- C语言 ] 堆排序的优化算法 中就包括了堆的时间复杂度分析以及优化算法哦~
3.3堆的应用之Top-K问题
[ 数据结构-C实现 ] 用堆解决TopK问题 中详细陈述了Top-K问题的实现哦~
4.二叉树链式结构的实现
4.1说明
在学习二叉树的基本操作前,需先要创建一棵二叉树,然后才能学习其相关的基本操作。由于现在我们对二叉树结构掌握还不够深入,手动快速创建一棵简单的二叉树,快速进入二叉树操作学习,等二叉树结构了解的差不多时,我们反过头再来研究二叉树真正的创建方式。
4.1.1二叉树的创建
//手动构建二叉树
BTNode* CreateBinaryTree()
{
BTNode* node1 = BuyBTNode(1);
BTNode* node2 = BuyBTNode(2);
BTNode* node3 = BuyBTNode(3);
BTNode* node4 = BuyBTNode(4);
BTNode* node5 = BuyBTNode(5);
BTNode* node6 = BuyBTNode(6);
node1->left = node2;
node1->right = node4;
node2->left = node3;
node4->left = node5;
node4->right = node6;
return node1;
}
我们所创建的二叉树结构如图所示
从概念中可以看出,二叉树定义是递归式的,因此后序基本操作中基本都是按照该概念实现的。
*4.2***二叉树的遍历 **
**4.2.1 **前序、中序以及后序遍历
学习二叉树结构,最简单的方式就是遍历。所谓二叉树遍历**(Traversal)****是按照某种特定的规则,依次对二叉 **树中的节点进行相应的操作,并且每个节点只操作一次。访问结点所做的操作依赖于具体的应用问题。 遍历是二叉树上最重要的运算之一,也是二叉树上进行其它运算的基础。
按照规则,二叉树的遍历有:前序**/中序/**后序的递归结构遍历:
**1. 前序遍历(Preorder Traversal 亦称先序遍历)——访问根结点的操作发生在遍历其左右子树之前。 **
**2. 中序遍历(Inorder Traversal)——访问根结点的操作发生在遍历其左右子树之中(间)。 **
3. 后序遍历(Postorder Traversal)——访问根结点的操作发生在遍历其左右子树之后。
由于被访问的结点必是某子树的根,所以N(Node)、L(Left subtree)和R(Right subtree)又可解释为****根、根的左子树和根的右子树。NLR、LNR和LRN分别又称为先根遍历、中根遍历和后根遍历。
// 二叉树前序遍历
void PreOrder(BTNode* root);
// 二叉树中序遍历
void InOrder(BTNode* root);
// 二叉树后序遍历
void PostOrder(BTNode* root);
下面主要分析前序递归遍历,中序与后序图解类似
前序遍历递归图解:
由规则我们得知前序遍历先访问根节点再访问左孩子再访问右孩子。
因此如果要用前序遍历方法遍历我们所创建的这个二叉树,完整的递归图如下:
*前序遍历结果:***1 2 3 4 5 6 **
*中序遍历结果:***3 2 1 5 4 6 **
*后序遍历结果:***3 1 5 6 4 1 **
实现代码:
//前序遍历
void PrevOrder(BTNode* root)
{
if (root == NULL)
{
printf("NULL ");
return;
}
printf("%d ", root->data);
PrevOrder(root->left);
PrevOrder(root->right);
}
//中序遍历
void InOrder(BTNode* root)
{
if (root == NULL)
{
printf("NULL ");
return;
}
InOrder(root->left);
printf("%d ", root->data);
InOrder(root->right);
}
//后序遍历
void PostOrder(BTNode* root)
{
if (root == NULL)
{
printf("NULL ");
return;
}
PostOrder(root->left);
PostOrder(root->right);
printf("%d ", root->data);
}
实现结果:
4.3 节点的个数
4.3.1 二叉树节点个数 -- BTreeSize
一个二叉树都可以分成根节点,左子树,右子树三个部分。因此我们要求一个二叉树节点的总个数,只需要求根节点,左子树,右子树的节点个数再相加即可。这个思想是分治思想。
我们可以举一个生活中的例子:
加入某个学校的校长想查一下学校有多少名学生,校长当然不会去一个一个数,这样不仅效率低,还容易出错,可谓出力不讨好。因此校长将这个人任务分配到每个院,让每个院的院长来向他汇报他们院有多少人,校长只需要将每个院的人数加起来即可算出总人数。同理,院长可以将这个任务分派给每个年纪,让年纪组长汇报每个年级有多少人,再将每个年级的人数加起来即可。同理,年级组长将这个任务分配给每个班的班长,然后将每个班的人数加起来即可。当然,每个班的班长当然是知道自己班的学生人数的。因此通过这样一种分治的思想。不仅提高了效率,而且清楚明了。
实现代码:
int BTreeSize(BTNode* root)
{
return root == NULL ? 0 :
BTreeSize(root->left)
+ BTreeSize(root->right) + 1;
}
递归图:
运行结果: size : 6
4.3.2 二叉树叶子节点个数 -- BTreeLeafSize
思想依旧是分治--使用递归 一个二叉树的叶子节点个数为左子树的叶子节点+右子树的叶子节点。
根据叶子节点的定义:度为0
因此判断节点是不是叶子节点,只需要判断这个节点的左孩子和右孩子同时为空。
int BTreeLeafSize(BTNode* root)
{
if (root == NULL)
return 0;
if (root->left == NULL && root->right == NULL)
return 1;
return BTreeLeafSize(root->left) + BTreeLeafSize(root->right);
}
运行结果:
4.3.3 二叉树第k层节点个数 -- BTreeKLevelSize
思想:依旧是分治--使用递归 一个二叉树的第K层节点个数为左子树的第k-1层节点个数+右子树的第k-1层节点个数。
由于我们根节点算一层,因此如果是找第k层,但k=1是就要返回1,而不是当k=0返回1。
因此我们把K分为三种情况:
1.k = 0,返回0;
2.k = 1,返回1;
3.k > 1,继续往下遍历。
//第K层的节点的个数,k>=1
int BTreeKLevelSize(BTNode* root, int k)
{
assert(k >= 1);
if (root == NULL)
return 0;
if (k == 1)
return 1;
else
return BTreeKLevelSize(root->left, k - 1) + BTreeKLevelSize(root->right, k - 1);
}
运行结果:
4.4 树的高度 -- BTreeDepth
思想:依旧是分治--使用递归 一个二叉树的高度看作是左子树和右子树的高度的较大值+1(+1是加上根节点的一层)
int BTreeDepth(BTNode* root)
{
if (root == NULL)
return 0;
int leftDepth = BTreeDepth(root->left);
int rightDepth = BTreeDepth(root->right);
return leftDepth > rightDepth ? leftDepth + 1 : rightDepth + 1;
}
运行结果:
4..5二叉树查找值为x的节点 -- BinaryTreeFind
思想:依旧是分治--使用递归 要在一个二叉树中查找值为x的节点,我们在二叉树的根节点,左子树,右子树中找。
1.先判断根节点的值是不是x
2.如果根节点不是再进行单边查找:先左 后右
3.如果左边没空则向右找,不为空则向下递归查找。
// 二叉树查找值为x的节点
BTNode* BinaryTreeFind(BTNode* root, BTDataType x)
{
if (root == NULL)
return NULL;
if(root->data == x)
return root;
//单边查找: 先左 后右
if (BinaryTreeFind(root->left, x))//如果左边为空则向右查找
return BinaryTreeFind(root->left, x); //不为空则向下递归查找
else
return BinaryTreeFind(root->right, x);
}
运行结果:
二叉树的层序遍历,创建和销毁以及基础OJ题会在以后的博客中持续更新,还望大家持续关注,谢谢大家的支持~
(本篇完)
版权归原作者 小白又菜 所有, 如有侵权,请联系我们删除。