有左子树找到相应的节点值10:
不过二叉查找树有一些问题,当不断插入一些元素时,可能会出现不平横的情况,即如下图所示:
从这种情况可以看出,明显存在左子树和右子树深度相差过多,在使用平衡情况下的二叉查找树是时间复杂度为logn,而出现这种极端情况的话,想要查9的位置就需要每一次都遍历下一个右子树,很有可能时间复杂度变为n(与数组普通查询的时间复杂度相同)。
基于上述情况,引入了平衡二叉树,红黑树即为平衡二叉树(是一 棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。)和二叉查找树的结合。
2 红黑树红黑树是每个节点都带有颜色属性的二叉查找树:
2.1 节点是红色或黑色;
2.2 根节点一定是黑色;
2.3 每个叶节点都是黑色的空节点(NIL节点);
2.4 每个红节点的两个子节点都是黑色的(从每个叶子到根的所有路径上不能有两个连续的红节点,即对于每层来说,除了NIL节点,红黑节点是交替的,第一层是黑节点那么其下一层肯定都是红节点,反之一样);
2.5 从任一节点到其每个叶子节点的所有路径都包含相同数目的黑色节点;
这五条性质约束了红黑树,可以通过数学证明来证明,满足这五条性质的二叉树可以将查找、删除维持在对数时间内。
正是由于这些原因使得红黑树是一个平衡二叉树。
当我们进行插入或者删除操作时所作的一切操作都是为了调整树使之符合这五条性质(达到平衡,且符合二叉查找树的要求)。
这些约束强制了红黑树的关键性质:从根到叶子的最长的可能路径不多于最短的可能路径的两倍长。结果是这个树大致上是平衡的。因为操作比如插入、删除和查找某个值的最坏情况时间都要求与树的高度成比例,这个在高度上的理论上限允许红黑树在最坏情况下都是高效的,而不同于普通的二叉查找树。
要知道为什么这些特性确保了这个结果,注意到性质4导致了路径不能有两个毗连的红色节点就足够了。最短的可能路径都是黑色节点,最长的可能路径有交替的红色和黑色节点。因为根据性质5所有最长的路径都有相同数目的黑色节点,这就表明了没有路径能多于任何其他路径的两倍长。
红黑树在函数式编程中也特别有用,在这里它们是最常用的持久数据结构之一,它们用来构造关联数组和集合,在突变之后它们能保持为以前的版本。除了O(log n)的时间之外,红黑树的持久版本对每次插入或删除需要O(log n)的空间。
如下图就是一棵红黑树:
向红黑树中插入节点14(一般默认插入节点是红色的):