【前言】树的遍历,根据访问自身和其子节点之间的顺序关系,分为前序,后序遍历。对于二叉树,每个节点至多有两个子节点(特别的称为左,右子节点),又有中序遍历。由于树自身具有的递归性,这些遍历函数使用递归函数很容易实现,代码也非常简洁。借助于数据结构中的栈,可以把树遍历的递归函数改写为非递归函数。
在这里我思考的问题是,很显然,循环可以改写为递归函数。递归函数是否借助栈这种数据结构改写为循环呢。因为函数调用中,call procedure stack 中存储了流程的 context,调用和返回相当于根据调用栈中的 context 进行跳转。而采用 stack 数据结构时,主要还是一个顺序循环结构,主要通过 continue 实现流程控制。
首先,给出遍历二叉树的序的定义:
(1)前序遍历:当前节点,左子节点,右子节点;
(2)中序遍历:左子节点,当前节点,右子节点;
(3)后序遍历:左子节点,右子节点,当前节点。
对二叉查找树 BST 来说,中序遍历的输出,是排序结果。所以这里我以一个 BST 的中序遍历为主要例子说明问题。一个简单的 BST 如下图所示(为了保证美观精确,下图由我临时编写的一个 VC 窗口程序绘制为样本进行加工得到的):
其中序遍历的输出为:1,2,3,4,5,6,7,8,9;
首先给出中序遍历的递归函数,代码如下:
1 typedef struct tagNODE
2 {
3 int nVal;
4 int bVisited; //是否被访问过
5 struct tagNODE *pLeft;
6 struct tagNODE *pRight;
7 } NODE, *LPNODE;
8
9 //中序遍历二叉树(递归版本)
10 void Travel_Recursive(LPNODE pNode)
11 {
12 if(pNode != NULL)
13 {
14 Travel_Recursive(pNode->pLeft);
15 _tprintf(_T("%ld, "), pNode->nVal);
16 Travel_Recursive(pNode->pRight);
17 }
18 }
很明显,对应于前面给出的定义,只需要调整上述代码中行号为 14,15,16 的顺序,就可以得到相应的遍历序。
现在,引入栈数据结构,它是一个元素为节点指针的数组,将上面的递归函数改写为非递归函数。中序遍历的基本方法是:
(1)将根节点 push 入栈;
(2)当栈不为空时,重复(3)到(5)的操作:
(3)偷窥栈顶部节点,如果节点的左子节点不为 NULL,且没有被访问,则将其左子节点 push 入栈,并跳到(3)。
(4)当被偷窥的节点没有左子树,pop 该节点出栈,并访问它(同时标记该节点为已访问状态)。
(5)当该节点的右子节点不为空,将其右子节点 push 入栈,并跳到(3)。
根据以上方法,给出非递归函数的中序遍历版本代码如下:
1 typedef struct tagNODE
2 {
3 int nVal;
4 int bVisited; //是否被访问过
5 struct tagNODE *pLeft;
6 struct tagNODE *pRight;
7 } NODE, *LPNODE;
8
9 //辅助数据结构
10 LPNODE g_Stack[256];
11 int g_nTop;
12
13 //遍历二叉树,借助于stack数据结构的非递归版本
14 void TravelTree()
15 {
16 //while the stack is not empty
17 while(g_nTop >= 0)
18 {
19 //peek the top node in stack;
20 LPNODE pNode = g_Stack[g_nTop];
21
22 //push left child;
23 if(pNode->pLeft != NULL && !pNode->pLeft->bVisited)
24 {
25 ++g_nTop;
26 g_Stack[g_nTop] = pNode->pLeft;
27 continue;
28 }
29
30 //pop and visit it;
31 _tprintf(_T("%ld, "), pNode->nVal);
32 pNode->bVisited = 1;
33 --g_nTop;
34
35 //push right child;
36 if(pNode->pRight != NULL && !pNode->pRight->bVisited)
37 {
38 ++g_nTop;
39 g_Stack[g_nTop] = pNode->pRight;
40 continue;
41 }
42 }
43 }
以前面的 BST 为例,在非递归函数中,栈状态的动态变化如下图所示(下图主要由 Excel 和 Photoshop 制作):
在上面的代码的 while 循环体内,可以分为三个小的代码块:
(1)pop 栈顶的节点,并访问此节点 (line 30 ~ 33);
(2)push 左子节点 (line 22 ~ 28);
(3)push 右子节点 (line 35 ~ 41);
只要调整 while 循环体中的这三个代码块的顺序,就可以分别实现三种遍历序。例如,前序:(1)(2)(3);后序:(2)(3)(1)。
从上面的代码中,有两点需要说明:
(1)最后一个代码块中的 continue 可以不需要写,但为了可以调整代码块的顺序,两个 continue 都是需要的。
(2)因为前序遍历的逻辑的简洁性,不借助于 bVisited 标记,也可以完成遍历,但为了通用,还是需要这个节点标记。
最后,补充上其他并不重要的方法,创建树,释放树,main 函数的代码如下(把已有所有代码拼在一起即构成完整的 Demo 程序):
//左右 Child 定义
#define LCHILD 0
#define RCHILD 1
typedef struct tagNODE
{
int nVal;
int bVisited; //是否被访问过
struct tagNODE *pLeft;
struct tagNODE *pRight;
} NODE, *LPNODE;
LPNODE g_Stack[256];
int g_nTop;
LPNODE InsertNode(LPNODE pParent, int nWhichChild, int val)
{
LPNODE pNode = (LPNODE)malloc(sizeof(NODE));
memset(pNode, 0, sizeof(NODE));
pNode->nVal = val;
if(pParent != NULL)
{
if(nWhichChild == LCHILD)
pParent->pLeft = pNode;
else
pParent->pRight = pNode;
}
return pNode;
}
//递归释放二叉树的内存
void FreeTree(LPNODE pRoot)
{
if(pRoot != NULL)
{
FreeTree(pRoot->pLeft);
FreeTree(pRoot->pRight);
//_tprintf(_T("freeing Node (%ld) ...\n"), pRoot->nVal);
free(pRoot);
}
}
int _tmain(int argc, _TCHAR* argv[])
{
//索引为 0 的元素不使用。
LPNODE pNodes[10] = { 0 };
pNodes[1] = InsertNode(pNodes[0], LCHILD, 7);
pNodes[2] = InsertNode(pNodes[1], LCHILD, 4);
pNodes[3] = InsertNode(pNodes[1], RCHILD, 9);
pNodes[4] = InsertNode(pNodes[2], LCHILD, 2);
pNodes[5] = InsertNode(pNodes[2], RCHILD, 6);
pNodes[6] = InsertNode(pNodes[3], LCHILD, 8);
pNodes[7] = InsertNode(pNodes[4], LCHILD, 1);
pNodes[8] = InsertNode(pNodes[4], RCHILD, 3);
pNodes[9] = InsertNode(pNodes[5], LCHILD, 5);
//push 根节点
g_nTop = 0;
g_Stack[g_nTop] = pNodes[1];
TravelTree();
_tprintf(_T("\n"));
Travel_Recursive(pNodes[1]);
_tprintf(_T("\n"));
FreeTree(pNodes[1]);
return 0;
}
可以看到,释放树(FreeTree)这个函数,就是按照后序遍历的顺序进行释放的。