动态规划之最优二叉搜索树（算法导论）

1、一些概念

二叉搜索树：在二叉树中，对任意的节点X其左子树的所有节点都不大于X.key，其右子树的所有节点都不小于X.key。满足此条件的二叉树称为二叉搜索树。对二叉搜索树进行中序遍历将会得到一个单调递增的数列。

最优二叉树：在二叉树中，不同的节点都有不同的访问频率。为了减少查找某个节点所需要遍历的次数，通过将访问频率最高的节点放在离根节点近的位置，这样就可以减少平均遍历次数。最优二叉树又称赫夫曼树。

最优二叉搜索树：就是满足二叉搜索树性质的最优二叉树。

2、问题描述

现在给定一组有序节点的查找概率，以及查找失败的概率。关键字k1,k2,k3,...,kn的查找的概率分别为p1,p2,p3,...,pn. 对于查找失败的伪关键字，有n+1个分别为：d0,d1,d2,d3,...,dn. 其分别对于的查找概率为：q0,q1,q2,...,qn。假设现在有五个节点，每个节点的概率为p1,p2,...,p5。qi表示伪关键字di的概率，分别为q0,q1,q2,...,q5。如下表：

动态规划之最优二叉搜索树（算法导论）

该表对应的图如下所示。

动态规划之最优二叉搜索树（算法导论）

3、问题解析

由于最优二叉搜索树需要满足节点之间连续有序，因而，对于任意满足条件的子树Ti..j，其节点分别为ki,ki+1,...,kj. 在这个子树中查找失败的伪关键字分别为di-1, di, di+1, ..., dj。

r[ i, j ]：表示子树Ti..j的根节点，用来构造满足条件的最优二叉搜索树；

w[ i, j ]：表示子树Ti..j中从节点i到节点j的访问概率之和，用来计算当子树Ti..j变成其他节点的子树时，这时该子树的所有节点的深度都增加了1，这时这颗子树所增加的代价就为这颗子树的所有节点的概率和包括伪关键字节点的概率。

w[ i, j ] = pi+p(i+1)+...+pj+q(i-1)+qi+q(i+1)+...+qj.

e[ i, j ]：表示对子树Ti..j进行一次访问的平均代价，当访问的平均代价越小，其性能越优；若kr为子树Ti..j的根节点，则有：

e[i, j] = pr+( e[i, r-1] + w[i, r-1] ) + ( e[r+1, j] + w[r+1, j])

而：w[i, j] = w[i, r-1] + pr + w[r+1, j]

所以e[ i, j ] = e[i, r-1] + w[i, j] + e[r+1, j]

于是有：

if j == i-1, then e[i, j] = q(i-1);

if i <= j, then e[i, j] = min{e[i, r-1]+e[r+1, j]+w[i, j] } ( i <= r <= j )

另外还有

w[i, j] = w[i, j-1]+pj+qj.

4、代码实现（感觉写得很混乱，o(╯□╰)o）