树的直径

图中所有最短路径的最大值即为「直径」,可以用两次 DFS 或者树形 DP 的方法在 O(n) 时间求出树的直径。

前置知识:树基础

例题

SPOJ PT07Z, Longest path in a tree

给定一棵 n 个节点的树,求其直径的长度。 1\leq n\leq 10^4

做法 1. 两次 DFS

首先对任意一个结点做 DFS 求出最远的结点,然后以这个结点为根结点再做 DFS 到达另一个最远结点。第一次 DFS 到达的结点可以证明一定是这个图的直径的一端,第二次 DFS 就会达到另一端。下面来证明这个定理。

但是在证明定义之前,先证明一个引理:

引理:在一个连通无向无环图中, x y z 是三个不同的结点。当 x y 的最短路与 y z 的最短路不重合时, x z 的最短路就是这两条最短路的拼接。

证明:假设 x z 有一条不经过 y 的更短路 \delta(x,z) ,则该路与 \delta(x,y) \delta(y,z) 形成一个环,与前提矛盾。

定理:在一个连通无向无环图中,以任意结点出发所能到达的最远结点,一定是该图直径的端点之一。

证明:假设这条直径是 \delta(s,t) 。分两种情况:

  • 当出发结点 y \delta(s,t) 时,假设到达的最远结点 z 不是 s,t 中的任一个。这时将 \delta(y,z) 与不与之重合的 \delta(y,s) 拼接(也可以假设不与之重合的是直径的另一个方向),可以得到一条更长的直径,与前提矛盾。
  • 当出发结点 y 不在 \delta(s,t) 上时,分两种情况:
    • y 到达的最远结点 z 横穿 \delta(s,t) 时,记与之相交的结点为 x 。此时有 \delta(y,z)=\delta(y,x)+\delta(x,z) 。而此时 \delta(y,z)>\delta(y,t) ,故可得 \delta(x,z)>\delta(x,t) 。由 1 的结论可知该假设不成立。
    • y 到达的最远结点 z \delta(s,t) 不相交时,定义从 y 开始到 t 结束的简单路径上,第一个同时也存在于简单路径 \delta(s,t) 上的结点为 x ,最后一个存在简单路径 \delta(y, z) 上的节点为 x' 。如下图。

那么我们可以列出一些式子如下:

\begin{array}{rcl} \delta(y, z)&=&\delta(y, x') + \delta(x', z)\\ \delta(y, t)&=&\delta(y, x') + \delta(x', x) + \delta(x, t)\\ \delta(s, t)&=&\delta(s, x) + \delta(x, t) \end{array}

那么根据假设,有 \delta(y, z) \ge \delta(y, t) \Longrightarrow \delta(x', x) + \delta(x, t) \ge \delta(x', z) 。既然这样子的话,那么 \delta(x, z) \ge \delta(x, t) ,和 \delta(s, t) 对应着直径这一前提不符,故 y 的最远节点 z 不可能在 s t 这个直径对应的路外面。

当 y 不在 s-t 上,且 z 也不在的情况

因此定理成立。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
const int N = 10000 + 10;

int n, c, d[N];
vector<int> E[N];

void dfs(int u, int fa) {
  for (int v : E[u]) {
    if (v == fa) continue;
    d[v] = d[u] + 1;
    if (d[v] > d[c]) c = v;
    dfs(v, u);
  }
}

int main() {
  scanf("%d", &n);
  for (int i = 1; i < n; i++) {
    int u, v;
    scanf("%d %d", &u, &v);
    E[u].push_back(v), E[v].push_back(u);
  }
  dfs(1, 0);
  d[c] = 0, dfs(c, 0);
  printf("%d\n", d[c]);
  return 0;
}

做法 2. 树形 DP

我们记录当 1 为树的根时,每个节点作为子树的根向下,所能延伸的最远距离 d_1 ,和次远距离 d_2 ,那么直径就是所有 d_1 + d_2 的最大值。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
const int N = 10000 + 10;

int n, d = 0;
int d1[N], d2[N];
vector<int> E[N];

void dfs(int u, int fa) {
  d1[u] = d2[u] = 0;
  for (int v : E[u]) {
    if (v == fa) continue;
    dfs(v, u);
    int t = d1[v] + 1;
    if (t > d1[u])
      d2[u] = d1[u], d1[u] = t;
    else if (t > d2[u])
      d2[u] = t;
  }
  d = max(d, d1[u] + d2[u]);
}

int main() {
  scanf("%d", &n);
  for (int i = 1; i < n; i++) {
    int u, v;
    scanf("%d %d", &u, &v);
    E[u].push_back(v), E[v].push_back(u);
  }
  dfs(1, 0);
  printf("%d\n", d);
  return 0;
}

习题


评论