Coxeter element

2013-10-11

Coxeter 元
Coxeter 平面
进一步改进
$E_8$ 的例子
References

如果你对 Lie 代数有所了解的话，相信很大概率你会见过下面的图案： ( 参考维基百科的 Lie algebra 词条 )

它展示的是 Lie 代数 $E_8$ 的根系图。$E_8$ 的根系由 8 维欧式空间 $\mathbb{R}^8$ 中的 240 个向量组成，将这 240 个向量投影到一个特殊的 2 维平面 ( 叫做 Coxeter 平面 ) 上就会呈现出一个具有旋转对称的图案。在上图中可以看到，240 个投影点分布在 8 个圆周上，每个圆周包含 30 个均匀分布的点，整个图案在角度为 $\frac{2\pi}{30}$ 的旋转下是不变的。$h=30$ 正是 $E_8$ 的 Coxeter 数。

本文目的是介绍 Coxeter 元的一些基础知识，然后教大家怎样在 Python 中编写一个程序绘制上面的投影图案。我主要参考了 (Humphreys 1990) 和 (Casselman 2017)。虽然这里面涉及的数学并不复杂，但是真正动手编程实现的时候会有一些魔鬼藏在细节中，而这些细节是仅凭念书很难发现的。

本文的代码在 Github 上。David Madore 也有一个很棒的交互式网页可以绘制 $E_8$ 的多种不同风格的图案。

Coxeter 元

在本文中，$(W,S)$ 总代表一个有限不可约 Coxeter 群，其中 $|S|=n$。$S$ 中的生成元满足关系

对任何 $s\in S$ 有 $s^2=1$。
对任何 $s_i,s_j\in S$ 有 $(s_is_j)^{m_{ij}}=1$。其中 $m_{ij}\geq 2$ 是正整数。

设 $V$ 是 $n$ 维实向量空间，$\Delta=\{\alpha_1,\ldots,\alpha_n\}$ 是 $V$ 的一组基，$\Delta$ 叫做一组单根。定义 $V$ 上的内积 $\bullet$ 如下： \[\alpha_i\bullet\alpha_j=-\cos\frac{\pi}{m_{ij}}.\] (Humphreys 1990, secs. 6.2–6.4) 中证明了 $( W,S )$ 是有限群当且仅当内积 $\bullet$ 是正定的。

矩阵 $A= ( a_{ij} )_{1\leq i,j\leq n}= ( \alpha_i\bullet\alpha_j )_{1\leq i,j\leq n}$ 叫做 Cartan 矩阵。

规定每个生成元 $s_i\in S$ 在 $V$ 上的作用为 \[s_i ( v ) = v - 2 ( v\bullet\alpha_i ) \alpha_i,\quad v\in V.\] 即 $s_i$ 是关于以 $\alpha_i$ 为法向量的超平面的反射。这个作用将 $W$ 同构地映射为 $O ( V )$ 的一个有限反射子群。

定义 1.1. 设 $\{i_1,i_2,\ldots,i_n\}$ 是集合 $\{1,2,\ldots,n\}$ 的一个置换，乘积 $s_{i_1}s_{i_2}\cdots s_{i_n}$ 叫做 Coxeter 元。

换句话说，Coxeter 元就是把 $W$ 的生成元 $s_1,\ldots,s_n$ 按照任意顺序排列，然后相乘得到的群元素。

定理 1.2 ((Humphreys 1990, sec. 3.16)). 所有 Coxeter 元都是互相共轭的。

由于 Coxeter 元都是共轭的，所以它们有相同的阶、特征多项式和特征值。任一 Coxeter 元的阶叫做 $W$ 的 Coxeter 数，记作 $h$。

设 $\gamma$ 是一个 Coxeter 元，由于 $\gamma$ 满足 $\gamma^h=1$，所以 $\gamma$ 的特征值必然都是 $h$- 次单位根，而且复特征值成对共轭出现： \[\{\zeta^{m_1},\ldots,\zeta^{m_n},0\leq m_i<h\}.\] 其中 $\zeta$ 是本原 $h$- 次单位根。在 (Humphreys 1990, sec. 3.16) 中证明了 1 不可能是 $\gamma$ 的特征值，所以实际上每个指数 $1\leq m_i<h$。$\gamma$ 如果有实特征值的话只可能是 $-1$( 对应 $\zeta^{h/2}$ ) 。

我们选择一个特殊的 Coxeter 元如下：任取 $\Gamma$ 的一个顶点作为 $s_n$，将 $\Gamma$ 的顶点按照与 $s_n$ 的图距离分成两个不相交的集合 $\Gamma=I\sqcup J$：$I$ 由所有与 $s_n$ 的距离为偶数的顶点组成（包含 $s_n$）；$J$ 由所有与 $s_n$ 的距离为奇数的顶点组成。于是 $I$ 中的顶点两两不相邻，从而 $\{s_i,i\in I\}$ 中的生成元两两交换。$J$ 也是如此。记 \[x=\prod_{i\in I}s_i,\quad y=\prod_{j\in J}s_j.\] 取 Coxeter 元 $\gamma=xy$。我们下面对 $\gamma$ 进行分析。

Coxeter 平面

设 $\{\omega_i\}_{i=1}^n$ 是 $\{\alpha_i\}_{i=1}^n$ 在内积 $\bullet$ 下的对偶基： \[(\alpha_i\bullet\omega_j)=\delta_{ij}.\] ${\bf A}$ 是把每个 $\omega_i$ 映射为 $\alpha_i$ 的线性变换： \[{\bf A}\omega_i=\alpha_i,\quad \forall 1\leq i\leq n.\] 则 ${\bf A}$ 在 $\{\omega_i\}_{i=1}^n$ 这组基下的矩阵就是 Cartan 矩阵 $A$。

在 (Humphreys 1990, sec. 2.6) 中证明了矩阵 $A$ 的极小特征值 $c>0$ 的重数是 1，并且对应的特征向量 ${\bf c}=(c_1,\ldots,c_n)$ 的所有分量都是正的。于是 \[{\bf A}\sum_{i=1}^nc_i\omega_i = c\left(\sum_{i=1}^nc_i\omega_i\right).\] 特征向量 $\sum_{i=1}^nc_i\omega_i$ 可以写成两个向量 $\lambda,\mu$ 的和，其中 \[\lambda=\sum_{i\in I} c_i\omega_i,\quad \mu=\sum_{j\in J}c_j\omega_j.\] (Humphreys 1990, sec. 3.17) 中证明了 $\lambda,\mu$ 张成一个二维子空间 $P$，$x$ 和 $y$ 限制在 $P$ 上分别是保持直线 $\mathbb{R}\mu$ 和 $\mathbb{R}\lambda$ 不动的反射，从而 $\gamma=xy$ 限制在 $P$ 上是一个旋转，并且这个旋转的角度就是 $2\pi/h$。由于 $\gamma$ 置换根系 $\Phi$，所以如果我们把 $\Phi$ 投影到 $P$ 上，就会看到一个具有 $h$ 阶旋转对称性的图案。

不过直接使用上面 $\lambda,\mu$ 的定义来计算 $P$ 是很不方便的，因为其中涉及了对偶基 $\{\omega_i\}$。我们可以绕开对偶基的计算，这一点其实隐藏在 (Humphreys 1990, 78) 中，那里证明了 \[\begin{aligned} (c-1)\mu+\lambda &=\sum_{i\in I}c_i\alpha_i,\\ (c-1)\lambda+\mu &=\sum_{j\in J}c_j\alpha_j. \end{aligned}\]

由于 $c\ne 1$（1 不是 Coxeter 元的特征值），上式告诉我们 \[P=\mathop{\mathrm{span}}\{\lambda,\,\mu\}=\mathop{\mathrm{span}}\left\{\sum_{i\in I}c_i\alpha_i,\,\sum_{j\in J}c_j\alpha_j\right\}.\tag{$\ast$}\label{eq:alpha}\] 所以我们完全可以通过特征向量 ${\bf c}$ 和 $\Delta$ 得出 $P$ 的一组基。

进一步改进

如果你去看 Github 代码的话，会发现那里并不是完全按上面的逻辑写的。这是怎么回事呢？

前面的计算有个美中不足之处，就是我们需要显式地将 $S$ 的划分为两个不相交的子集 $S=I\sqcup J$，使得 $I,J$ 各自的生成元之间互相交换。这一步是可以避免的，下面的方法我是从 (Casselman 2017) 中学到的。

我们仍然用 $\gamma$ 表示 $\gamma$ 在 $\{\omega_i\}_{i=1}^n$ 这组基下的矩阵。

命题 3.1 ((Casselman 2017, lemma. 3.3)). $2I + \gamma + \gamma^{-1}= ( 2I-A )^2$。

根据这个结论，如果 $V_s,V_{\bar{s}}$ 分别是 $\gamma$ 的一对共轭的复特征值 $s=e^{i\theta}$ 和 $\bar{s}=e^{-i\theta}$ 对应的特征子空间，记 $U=V_s\oplus V_{\bar{s}}$，则对 $v\in U$ 有 \[( 2I-A )^2 ( v ) = ( 2+e^{i\theta}+e^{-i\theta} ) v= ( 4\cos^2\frac{\theta}{2} ) v.\] 即 $v$ 是 $( 2I-A )^2$ 的特征值为 $4\cos^2\frac{\theta}{2}$ 的特征向量。

这看起来好像可以说，$v$ 是 $2I-A$ 的特征值为 $\pm 2\cos\frac{\theta}{2}$ 的特征向量？但是我们不知道 $\pm 2\cos\frac{\theta}{2}$ 是否都会出现，以及如果都出现的话重数是不是相等。

Casselman 论证了这确实是成立的：

命题 3.2 ((Casselman 2017, lemma. 3.5)). $2I-A$ 和 $A-2I$ 有同样的特征多项式。

这个命题告诉我们，若 $\lambda$ 是 $A-2I$ 的特征值，则 $-\lambda$ 也是，并且二者对应的特征子空间的维数相同。

我们已经看到 $U=V_s\oplus V_{\bar{s}}$ 是 $( 2I-A )^2$ 的特征值为 $4\cos^2\frac{\theta}{2}$ 的特征子空间。我们断言

命题 3.3. $U$ 是 $2I-A$ 的特征值为 $\pm2\cos\frac{\theta}{2}$ 的特征子空间的直和。特征值 $\pm2\cos\frac{\theta}{2}$ 都出现并且它们对应的特征子空间维数相等。

证明：设 $U'$ 是 $2I-A$ 的特征值为 $\pm2\cos\frac{\theta}{2}$ 的特征子空间的直和，我们要证明 $U=U'$。显然 $U'\subseteq U$，只要再证明反向包含。

$U$ 当然是 $2I-A$ 的不变子空间。由于 $2I-A$ 是可对角化的，从而 $U$ 是 $2I-A$ 的特征子空间的直和。显然 $2I-A$ 在 $U$ 上的特征值只有可能是 $\pm 2\cos\frac{\theta}{2}$，从而 $U\subseteq U'$。根据命题 3.2 $\pm 2\cos\frac{\theta}{2}$ 都出现并且维数相等。$\blacksquare$

下面的推论是显然的。

推论 3.4. $U$ 是 $A$ 的特征值为 $2\pm2\cos\frac{\theta}{2}$ 的特征子空间的直和。

一般来说 $U$ 的维数未必是 2，所以 $U$ 未必是一个平面。但是假设 $c_\min=2-2\cos\frac{\theta_0}{2}$ 是 $A$ 的极小特征值，我们知道 $c_\min$ 的重数是 1，从而 $A$ 的极大特征值 $c_\max=2+2\cos\frac{\theta_0}{2}$ 的重数也是 1，这时 $U$ 是二维平面。$\gamma$ 在 $U$ 上的作用是角度为 $\theta_0$ 的旋转。这个 $U$ 就是 Coxeter 平面 $P$。

于是计算 $P$ 归结为计算线性变换 ${\bf A}$ 的极小和极大特征值对应的特征向量。设 $(c_1,\ldots,c_n)$ 和 $(c_1',\ldots,c_n')$ 分别是矩阵 $A$ 对应 $c_\min,c_\max$ 的特征向量，不难验证 $\sum_{i=1}^nc_i\alpha_i$ 和 $\sum_{i=1}^nc_i'\alpha_i$ 分别是 ${\bf A}$ 对应 $c_\min,c_\max$ 的特征向量，比如 \[{\bf A}\left(\sum_{i=1}^nc_i\alpha_i\right)={\bf A}\cdot{\bf A}\left(\sum_{i=1}^nc_i\omega_i\right)={\bf A}\left(c_\min\sum_{i=1}^nc_i\omega_i\right)=c_\min\sum_{i=1}^nc_i\alpha_i.\] 所以 \[P=\mathop{\mathrm{span}}\left\{\sum_{i=1}^nc_i\alpha_i,\,\sum_{i=1}^nc_i'\alpha_i\right\}.\] 这样我们就找到了只用 Cartan 矩阵和 $\Delta$ 计算 $P$ 的方法。

$E_8$ 的例子

$E_8$ 的 Coxeter 图如下：

单根系 $\Delta$ 的选择不是唯一的，我们采用如下的选择，使得 $\bullet$ 就是 Euclidean 标准内积： \[\Delta=\begin{bmatrix}1&-1&0&0&0&0&0&0\\0&1&-1&0&0&0&0&0\\0&0&1&-1&0&0&0&0\\0&0&0&1&-1&0&0&0\\0&0&0&0&1&-1&0&0\\0&0&0&0&0&1&1&0\\-\frac{1}{2}&-\frac{1}{2}&-\frac{1}{2}&-\frac{1}{2}&-\frac{1}{2}&-\frac{1}{2}&-\frac{1}{2}&-\frac{1}{2}\\0&0&0&0&0&1&-1&0\end{bmatrix}.\] Coxeter 图中编号为 $i$ 的顶点对应的单根 $\alpha_i$ 是矩阵的第 $i$ 行。注意每个单根的长度是 $\sqrt{2}$，并不是单位向量，这样主要是为了书写代码更方便。

Cartan 矩阵 $A$ 由单根之间两两内积给出： \[A=(\alpha_i\bullet\alpha_j)_{1\leq i,j\leq 8}=\begin{pmatrix}2&-1&0&0&0&0&0&0\\-1&2&-1&0&0&0&0&0\\0&-1&2&-1&0&0&0&0\\0&0&-1&2&-1&0&0&0\\0&0&0&-1&2&-1&0&-1\\0&0&0&0&-1&2&-1&0\\0&0&0&0&0&-1&2&0\\0&0&0&0&-1&0&0&2\end{pmatrix}.\]

用代码来写的话，就是

import numpy as np

# A set of simple roots listed by rows of 'delta'
delta = np.array([
    [1, -1, 0, 0, 0, 0, 0, 0],
    [0, 1, -1, 0, 0, 0, 0, 0],
    [0, 0, 1, -1, 0, 0, 0, 0],
    [0, 0, 0, 1, -1, 0, 0, 0],
    [0, 0, 0, 0, 1, -1, 0, 0],
    [0, 0, 0, 0, 0, 1, 1, 0],
    [-0.5, -0.5, -0.5, -0.5, -0.5, -0.5, -0.5, -0.5],
    [0, 0, 0, 0, 0, 1, -1, 0]
])

# The cartan matrix:
cartan = np.dot(delta, delta.transpose())

所有单反射 $\{s_i\}_{i=1}^8$ 生成的群 $W$ 叫做 $E_8$ 的 Weyl 群，这个群包含 696729600 个元素。单根系在 $W$ 作用下生成的集合 $\Phi = \{w\cdot\alpha\,|\, w\in W, \alpha\in\Delta\}$ 叫做 $E_8$ 的根系，$\Phi$ 中包含 240 个不同的向量，$W$ 置换 $\Phi$ 中的向量。

$\Phi$ 中的向量从形式上看分为两类：

第一类包含 $(\pm1,\pm1,0,0,0,0,0,0)$ 的所有置换，即有两个分量是 $+1$ 或者 $-1$，其余６个分量都是 0 的向量。这样的向量有 112 个。
第二类包含所有形如 $1/2\times(\pm1,\pm1,\cdots,\pm1)$ 的向量，其中 $-1$ 的个数是偶数。这样的向量有 128 个。

为了编程方便，我们可以把所有根都乘以 2，使得它们都是整数向量。于是生成根系 $\Phi$ 的代码可以这样写：

import itertools

roots = []

# Roots of the form (+-1, +-1, 0, 0, 0, 0, 0, 0),
# signs can be chosen independently and the two non-zeros can be anywhere.
for i, j in combinations(range(8), 2):
    for x, y in product([-2, 2], repeat=2):
        v = np.zeros(8)
        v[i] = x
        v[j] = y
        roots.append(v)

# Roots of the form 1/2 * (+-1, +-1, ..., +-1), signs can be chosen
# indenpendently except that there must be an even numer of -1s.
for v in product([-1, 1], repeat=8):
    if sum(v) % 4 == 0:
        roots.append(v)
roots = np.array(roots).astype(int)

# Connect a root to its nearest neighbors,
# two roots are connected if and only if they form an angle of pi/3.
edges = []
for i, r in enumerate(roots):
    for j, s in enumerate(roots[i + 1 :], i + 1):
        if np.sum((r - s) ** 2) == 8:
            edges.append([i, j])

我们来计算 Coxeter 平面 $P$ 的一组基。

eigenvals, eigenvecs = np.linalg.eigh(cartan)
u = eigenvecs[:, 0]
v = eigenvecs[:, -1]

u = np.dot(u, delta)
v = np.dot(v, delta)

其中 eigenvals 返回 Cartan 矩阵的特征值，按照从小到大排列；eigenvecs 的列向量是 Cartan 矩阵的特征向量，也是按照特征值递增的顺序排列，第一列 u = eigenvecs[:, 0] 和最后一列 v = eigenvecs[:, -1] 就是最小和最大特征值对应的特征向量。

把 eigenvals 中的特征值打印出来：

1	`[0.01095621 0.51371035 1.18652671 1.58417662 2.41582338 2.81347329 3.48628965 3.98904379]`

可以看到最小的特征值 \[0.01095621 \approx 2-2\cos\frac{\theta_0}{2},\quad \theta_0\approx 2\arccos0.994521895\approx\frac{2\pi}{30}.\] 所以我们验证了 $\gamma$ 在 $P$ 上的作用是一个 30 阶的旋转，即 $W$ 的 Coxeter 数是 30。

根据上一节末尾的介绍，$\sum_{i=1}^8u_i\alpha_i$ 和 $\sum_{i=1}^8v_i\alpha_i$ 构成 $P$ 的一组基。作为对称矩阵 $A$ 的不同特征值对应的特征向量，它们在 $\bullet$ （即标准内积）下是正交的。把它们归一化为单位向量，然后计算根系 roots 到 $P$ 的投影：

u /= np.linalg.norm(u)
v /= np.linalg.norm(v)

roots_2d = [(np.dot(u, x), np.dot(v, x)) for x in roots]

剩下的就是具体的绘图过程了，这里不再赘述。

References

Casselman, Bill. 2017. “Coxeter Elements in Finite Coxeter Groups” Essays on Coxeter groups. https://personal.math.ubc.ca/~cass/research/pdf/Element.pdf.

Humphreys, James E. 1990. Reflection Groups and Coxeter Groups. Cambridge Studies in Advanced Mathematics. Cambridge University Press. https://doi.org/10.1017/CBO9780511623646.

上一篇：Coupling from the past

下一篇：Birkhoff 遍历定理

Coxeter element

Coxeter 元

Coxeter 平面

进一步改进

\(E_8\) 的例子

References