General Theory of Relativity

Posted by Z on September 1, 2022

前言

I was sitting in a chair in the patent office at Bern when all of a sudden a thought occurred to me: ‘If a person falls freely he will not feel his own weight.’ I was startled. This simple thought made a deep impression on me. It impelled me toward a theory of gravitation…Then there occurred to me the ‘glucklichste Gedanke meines Lebens’, which means the happiest thought of my life.
— A. Einstein

01

1921 年的 2 月 17 日,《Nature》期刊的整版几乎都贡献给了相对论。在那时,爱因斯坦已经享有了世界名誉,不仅是在物理学界,更是被广大公众所认可。它的开篇文章由爱因斯坦亲自撰写并在开头这样写道:“以尽可能简单的形式呈现一系列想法的演变是如此的令人着迷…”。不可否认的是,重大的科学进步也正是来自于对一些基本理论的重新辩证认识得到的。

1905 年诞生的狭义相对论,描述了物体在惯性参考系下的行为,使得牛顿运动定律能够和电动力学(麦克斯韦方程组)相结合,进而为物理学制造了一个全新的框架,它完全改变了时间和空间的概念。由此衍生的洛伦兹协变性,替代了伽利略协变性,成为管定理的定理,即成为审查和改造原有物理定律的标准。尽管从最初就争议不断,但是爱因斯坦知道其核心的问题有两点:第一,无法适当定义什么是惯性系;第二,当时已知两种自然界的基本力,电磁互相作用天然满足狭义相对论,而牛顿的万有引力确无法归纳进洛伦兹协变的 体系里。牛顿万有引力定律自问世以来被广泛接纳,因它成功地解释了物质之间的引力作用。在牛顿的描述中,引力来自大质量物质之间的相互吸引。虽然牛顿也不知道这种力的本质,但它在描述运动时却非常成功。牛顿引力论的基本方程是反映引力势 $\phi$ 和质量密度 $\rho$ 的泊松方程:

\[\Delta\Phi=4\pi G \rho\]

很明显它只有伽利略协变性而没有洛伦兹协变性(只包含空间导数,而与时间无关),需要修改。我们注意到,牛顿的万有引力定律形式上与静电库仑定律很相似,既然麦克斯韦能把静电学推广改造为如此漂亮的麦氏电磁理论,看来牛顿引力论也不难被改造为狭义相对论框架内的引力理论。情况却远非如此简单。关键在于,万有引力定律与库仑定律虽然很相似,却存在”符号差别”电荷有正负两种,同性相斥,异性相吸;质量则只正不负,虽然同性,却只吸不斥(万有引力嘛!)仿照电磁理论,的确可以构造一个在狭义相对论框架内的引力理论,根据这个理论,在引力有变化(有扰动)时将出现类似于电磁波的引力波,而且也以光速传播。不幸的是,由于上述符号差别,由引力波带走的能量竟是负的。这意味着系统在发射引力波时自身能量不降反增,从而发射强度变大,由此又会获得更多的能量。如此循环,必然导致物理上不可接受的后果。虽然无法绝对否定在狭义相对论框架内建立满意的引力理论的可能性,爱因斯坦还是独辟蹊径,从 1907 年开始于 1915 年位为止成功地创立了革命化的、崭新的、突破狭义相对论框架的引力理论,这就是广义相对论。有趣的是,后人在克服狭义相对论框架内的某种引力理论的困难的努力中,几经修改后所得到的竟然也是与爱因斯坦广义相对论实质相同的理论!

有两个原因促使了爱因斯坦创建了广义相对论,他曾说:“我对万有引力具有区别于电磁力的基本原理感到震惊”,第一是引力的普适性(universality)。引力的”普适性”包含两层含义:①任何物体在引力场中都受引力(电中性的物体在电场中却不受电力,故电力无普适性);②任意两个质点在引力场的同一点有相同的引力加速度。这虽然是司空见惯的事实,但为什么会这样?静电场中的两个点电荷就不这样。设点电荷 $q$ 的质量为 $m$,所在点的静电场强为 $\textbf{E}$,则它所受的电场力为 $\textbf{f}=q\textbf{E}$,获得的加速度为

\[\textbf{a}=\frac{\textbf{f}}{m}=\frac{q}{m}\textbf{E}\]

若在同一点放置质量为$m’$的另一点电荷$q’$,则其加速度为

\[\textbf{a'}=\frac{q'}{m'}\textbf{E}\]

$\textbf{a’}$ 和 $\textbf{a}$ 不等,除非两者的荷质比相同。在对引力做类似讨论时,不妨也把”荷”与”质”加以区别。质点的”引力荷”是其物质含量的量度,决定它在引力场中怎样受力,可称为引力质量(gravitational mass),记作 $m_g$; 质点的”质”则是其惯性的量度,决定它在力的作用下出现多大的加速度(对力的响应程度如何),可称为惯性质量(inertial mass),记作叫 $m_i$(即上式的 $m$)。仿照上述讨论不难导出质点在引力场中的引力加速度为

\[\textbf{a}=\frac{m_g}{m_i}\textbf{g}\]

其中$\textbf{g}$是该点的引力场强。如果不同质点有不同的引力荷质比 ${m_g}/{m_i}$,它们在引力场中同一点就不会有相同的引力加速度。然而无数的、一个比一个更精确的实验表明 ${m_g}/{m_i}$ 对任何质点都相同。从最初的伽利略的自由落体实验,到牛顿的单摆实验,再到 1900 年前后的Eötvös扭摆实验和 20 世纪 60 年代的迪克R.H.Dicke),最后到 1971 年布拉金斯基(V.B.Braginsky)和 1999 年的S.Basseler,误差被缩小至10-12的范围内,满足 ${m_g}={m_i}$,最新 2022 年 9 月 14 日法国萨克雷大学领衔的研究团队把精度提高到了10-15量级。这样的结果证明,引力场和惯性场动力学效应等效,被称作“等效原理”。这是一个极其非同寻常的实验事实,应该引起深思。引力的”荷”与”质”本是两个完全不同的概念,风马牛不相及,它们为什么相等?牛顿引力论恐怕不能回答这个问题。在牛顿引力论中,这是作为实验事实被承认的。然而,难道仅仅是一种巧合吗?难道就没有更深刻的原因藏在这个事实的背后吗?难道一定不存在一个更优雅的理论,在这个理论中 ${m_g}={m_i}$ 是可用推理来证明的吗?

第二是马赫原理。在狭义相对论那一篇文章里提到了牛顿的水桶实验,他论证了转动(即加速运动)的绝对性,只有相对于所谓绝对空间的加速才是真加速,才受惯性力。而马赫却认为,根本不存在绝对空间,转动不是绝对的而是相对的,产生惯性力的原因是水相对于全宇宙的物质(遥远星系)转动的结果,所以惯性力起源于物质间的相互作用,即受力物体相对于遥远星系的加速运动。

爱因斯坦敏锐地捕捉到了引力与所有其他力有这些实质性的差别,这强烈地暗示着引力是整个时空背景的内禀性质。他曾写道:“…它当时就使我认识到它的重要性。我为它的存在感到极为惊奇,并猜想其中必定有一把可以更加深入地了解惯性和引力的钥匙”。爱因斯坦根据牛顿力学借用电梯曾构思过一个思想实验,即爱因斯坦升降机实验。设想一个观测者处在封闭的升降机里,得不到升降机外部的任何信息,当他看到机内的一切物体都在自由下落,且下落加速度 $\textbf{a}$ 与物体大小及物质组成无关时,他无法判断自己处在下列哪种情况,(1)升降机静止在一个引力场强为 $\textbf{a}$ 的星球表面;(2)升降机在无引力的太空之中以加速度 $\textbf{a}$ 运动。当观测者感到自己和升降机内的一切物体处于失重状态时,他同样无法判定自己处于下列哪种情况,(1)升降机在引力场中自由下落;(2)升降机在无引力场的太空中做惯性运动。

然而我们必须要承认,引力场和惯性场还是有些许不同的。第一,引力场和惯性场的等效只存在于局部的,无穷小的时空范围,即在每一个时空点内等效;第二,引力场对时空有弯曲效应,而惯性场没有改变时空曲率;第三,引力产生于物体间相互作用,有反作用力,惯性力与物体间相互作用无关,没有反作用力。但不可否认地,之前惯性系的定义问题可以被解决,即费米后来证明,在引力场中自由下落的,无自转的,无穷小的参考系,从几何角度讲,就是沿测地线作费米移动的无穷小参考系,可以一直保持是一个局部惯性系。

上述的理论让爱因斯坦想到引力应该与惯性力一样起源于坐标的曲线性,于是他天才地猜想到狭义相对论推广出的新理论必须是一个几何理论,引力就是时空的弯曲效应,而其根源就是质量,反过来,弯曲的时空又会影响质量的运动。所以他觉得,新理论的方程应该有两个,一个描述质量如何使时空弯曲,另一个描述弯曲时空中质量如何运动。这种想法诞生后,下一步就是找到合适的数学工具,即当时已经发展起来的但不为物理学家熟知的——黎曼几何。

02

爱因斯坦在等效原理,马赫原理,广义相对性原理和光速不变原理的基础上,在 1913 年与格罗斯曼一起把黎曼几何引入引力研究,在 1915 年与希尔伯特讨论后,终于建立了广义相对论的场方程——爱因斯坦方程。

\[G_{\mu\nu}=R_{\mu\nu}-\frac{1}{2}g_{\mu\nu}R=\frac{8\pi G}{c^4}T_{\mu\nu}\]

其中,$G_{\mu\nu}$称为爱因斯坦张量,$R_{\mu\nu}$是从黎曼张量缩并而成的里奇张量,代表曲率项,$R$是从里奇张量缩并而成的纯量曲率(或曲率标量),$g_{\mu\nu}$是从 (3+1) 维时空的度规张量, $T_{\mu\nu}$是能量-动量-应力张量,$G$是牛顿重力常数,$c$是真空中光速。再加上爱因斯坦的设想,即自由质点(不受引力,惯性力之外的任何力作用的质点)的运动方程就是黎曼时空的测地线方程

\[\frac{\mathrm{d}^2 x^{\mu} }{\mathrm{d} s^2}+\Gamma^{\mu}_{\alpha\beta}\frac{\mathrm{d} x^{\alpha}}{\mathrm{d} s}\frac{\mathrm{d} x^{\beta}}{\mathrm{d} s}=0\]

其中,$\Gamma^{\mu}_{\alpha\beta}$是列维-奇维塔联络(levi civita connection)。这两个公式一起构成了其理论核心。值得一提的,爱因斯坦场方程的真空形式是

\[R_{\mu\nu}=0\]

因为在真空处,物质场的能动张量$T_{\mu\nu}$为零,它的迹$T=0$,而曲率标量$R=-\frac{8\pi G}{c^4}T=0$。但这些并不意味着曲率张量$R^{\rho}_{\lambda\mu\nu}$为零,也就是说时空区还是弯曲的。

Schwarzschild解

德国天体物理学家史瓦西(Karl Schwarzschild)给出了场方程的严格的静态球对称真空解。爱因斯坦方程发表时(1915 年 11 月)正值第一次世界大战,那时史瓦西正在对俄战争前线的德军服役,然而当他在《普鲁士科学院会议报告》中读到广义相对论时,寻求爱因斯坦方程解的强烈愿望让他几天之内就求得了史瓦西真空解。爱因斯坦收到史瓦西的论文时大喜过望,回信道:“我没有料到能得出方程的精确解,您对问题的解析处理令我极为满意。” 1916 年 1 月 13 日,爱因斯坦代表史瓦西在柏林普鲁士科学院的会议上作了报告。

所谓静态球对称真空解,是指存在于球对称引力源外部的不随时间变化的引力场。引力场即时空的弯曲,用度规张量来描述,解场方程就是求度规场。假定引力源是球对称的,然后求引力源外部的真空中的度规场。 从对称性的角度考虑,既然物质分布(引力源)是球对称的,真空区(引力源外部)的度规场应该也是球对称的。不难看出,如果令球坐标:$x^0=ct$,$x^1=r$,$x^2=\theta$,$x^3=\varphi$,则最一般的球对称真空度规应该写成

\[ds^2=b(r,t)c^2dt^2+a(r,t)dr^2+r^2(d\theta^2+\sin^2{\theta}d\varphi^2)\]

式中$a$和$b$是两个待定系数,并且当$a\to 1$,$b\to -1$时,上式就回归到四维闵可夫斯基(Minkowski)时空中的球对称度规

\[ds^2=-c^2dt^2+dr^2+r^2(d\theta^2+\sin^2{\theta}d\varphi^2)\]

这里需要提到 1927 年,伯克霍夫(George David Birkhoff)证明了一个定理,即真空球对称度规一定是静态的且渐近平坦的。我们可以理解为(1)只要引力源是球对称的,源外的度规场就一定是静态球对称的;(2)不管引力源是静态还是动态(比如作球对称膨胀,收缩,脉动等),只要源内物质分布始终是球对称的,源外的度规场就一定是静态球对称的。所以上式应化简成与时间$t$无关的函数

\[ds^2=b(r)c^2dt^2+a(r)dr^2+r^2(d\theta^2+\sin^2{\theta}d\varphi^2)\]

接着,为了求解方便,我们先把待定系数$a$和$b$写成新的形式$a(r)=e^{\mu(r)}$,$b(r)=-e^{\nu(r)}$,于是我们就有

\[ds^2=-e^{\nu(r)}c^2dt^2+e^{\mu(r)}dr^2+r^2(d\theta^2+\sin^2{\theta}d\varphi^2)\]

其中我们得到度规张量$g_{\mu\nu}$是

\[g_{00}=-c^2e^{\nu}\;\;\;g_{11}=e^{\mu}\;\;\;g_{22}=r^2\;\;\;g_{33}=r^2\sin^2{\theta}\;\;\;g_{\alpha\beta}=0\;\;(\alpha,\beta=0,1,2,3, \alpha\neq\beta)\]

易得该度规张量的行列式是

\[g=det\left| g_{\mu\nu}\right|=-c^2e^{\mu+\nu}r^4\sin^2{\theta}\]

根据协变度规张量与逆变度规张量的关系$g^{\alpha\beta}=\frac{\Delta^{\alpha\beta}}{g}$,其中$\Delta^{\alpha\beta}$是$g_{\alpha\beta}$的代数余子式:

\[g^{00}=-\frac{1}{c^2}e^{-\nu}\;\;\;g^{11}=e^{-\mu}\;\;\;g^{22}=\frac{1}{r^2}\;\;\;g^{33}=\frac{1}{r^2\sin^2{\theta}}\;\;\;g^{\alpha\beta}=0\;\;(\alpha,\beta=0,1,2,3, \alpha\neq\beta)\]

在根据克里斯多菲符号(Christoffel symbols),即$\Gamma^\alpha_{\mu\nu}=\frac{1}{2}g^{\alpha\lambda}(\frac{\partial g_{\mu\lambda}}{\partial \nu}+\frac{\partial g_{\nu\lambda}}{\partial \mu}-\frac{\partial g_{\mu\nu}}{\partial \lambda})$,再加上简写${\mu}'=\frac{\mathrm{d} {\mu}}{\mathrm{d} r}$和${\nu}'=\frac{\mathrm{d} {\nu}}{\mathrm{d} r}$,可以算得非零的克氏符

\[\left\{\begin{matrix} \Gamma^0_{01}=\Gamma^0_{10}=\frac{1}{2}{\nu}' & \Gamma^1_{11}=\frac{1}{2}{\mu}' & \Gamma^1_{00}=\frac{c^2}{2}e^{\nu-\mu}{\nu}' \\ \Gamma^1_{22}=-re^{-\mu} & \Gamma^1_{33}=-re^{-\mu}\sin^2{\theta} & \Gamma^2_{12}=\Gamma^2_{21}=\frac{1}{r} \\ \Gamma^2_{33}=-\sin{\theta}\cos{\theta} & \Gamma^3_{13}=\Gamma^3_{31}=\frac{1}{r} & \Gamma^3_{23}=\Gamma^3_{32}=\cot{\theta} \\ \end{matrix}\right.\]

原来64个联络系数中只有13个系数非零!我们已知里奇张量$R_{\mu\nu}$的表达式是

\[R_{\mu\nu}=R^{\lambda}_{\mu\lambda\nu}=\frac{\partial \Gamma^{\lambda}_{\mu\nu}}{\partial \lambda}-\frac{\partial \Gamma^{\lambda}_{\mu\lambda}}{\partial \nu}+\Gamma^{\lambda}_{\sigma\lambda}\Gamma^{\sigma}_{\mu\nu}-\Gamma^{\lambda}_{\sigma\nu}\Gamma^{\sigma}_{\mu\lambda}\]

所以算得里奇张量的非零分量为

\[\left\{\begin{matrix} R_{00}=-c^2e^{\nu-\mu}\left [ -\frac{\nu''}{2}-\frac{\nu'}{r}+\frac{\nu'}{4}(\mu'-\nu') \right ] & R_{11}=-\left [ \frac{\nu''}{2}-\frac{\mu'}{r}+\frac{\nu'}{4}(\nu'-\mu') \right ]\\ R_{22}=-e^{-\mu}\left [ 1-e^{\mu}+\frac{r}{2}(\nu'-\mu') \right ] & R_{33}=R_{22}\sin^2{\theta} \\ \end{matrix}\right.\]

到这里,我们知道里奇张量原本有16个分量,但因为原始度规张量的高度对称性($g_{\mu\nu}$为对角矩阵),所以可以发现只有4个非零的里奇张量。于是我们将其带入真空场方程$R_{\mu\nu}=0$,即让里奇张量的四个对角元都为0,故

\[\left\{\begin{matrix} \frac{\nu''}{2}+\frac{\nu'}{r}-\frac{\nu'}{4}(\mu'-\nu') = 0 \\ \frac{\nu''}{2}-\frac{\mu'}{r}+\frac{\nu'}{4}(\nu'-\mu') = 0 \\ 1-e^{\mu}+\frac{r}{2}(\nu'-\mu') = 0 \end{matrix}\right.\]

接着我们让前两个方程相减可得

\[\mu'+\nu'=0\]

将其带入第三个式子

\[1-e^{\mu}-r\mu'= 0\]

因为上面两个式子可以看做由真空场演化来的两个独立微分方程,所以我们可以知道

\[\mu+\nu=A\] \[e^{-\mu}=1-\frac{B}{r}\] \[e^{\nu}=e^{A-\mu}=e^{A}(1-\frac{B}{r})\]

其中$A$和$B$是两个常数,带入度规张量得$g_{00}=-c^2(1-\frac{B}{r})$,$g_{11}=(1-\frac{B}{r})^{-1}$。注意,$g_{00}$中的$e^A$项可以通过改变时间的尺度被吸收。将这个度规形式带入史瓦西线元可得

\[ds^2=-(1-\frac{B}{r})c^2dt^2+(1-\frac{B}{r})^{-1}dr^2+r^2(d\theta^2+\sin^2{\theta}d\varphi^2)\]

容易验证当$r\to\infty$时,该线元退化到平直时空下闵可夫斯基度规的形式。所以到此为止我们已经通过真空爱因斯坦方程定出了史瓦西度规的数学形式。关于度规里待定常数$B$的确定我们还得利用广义相对论的运动方程——测地线方程。我们的思路是:在低速静态弱场极限下测地线方程会退化到由牛顿第二定律和万有引力定律给出的运动方程。经过一番计算,在低速弱场近似下,求得$B=\frac{2GM}{c^2}$。

\[ds^2=-(1-\frac{2GM}{c^2r})c^2dt^2+(1-\frac{2GM}{c^2r})^{-1}dr^2+r^2(d\theta^2+\sin^2{\theta}d\varphi^2)\]

最后,自然单位制下($c=1$)的史瓦西度规形式为

\[ds^2=-(1-\frac{2GM}{r})dt^2+(1-\frac{2GM}{r})^{-1}dr^2+r^2(d\theta^2+\sin^2{\theta}d\varphi^2)\]

史瓦西度规是爱因斯坦引力场方程的第一个严格解,也是一个极其重要的解。它的物理内涵相当丰富,很多重要的时空情形都可以用它去精确描述。但我们应该注意容易混淆的定义:史瓦西时空的坐标量和固有量。坐标量无法由测量而得,是虚构出来的,仅在计算有理论意义,而固有量是真实可测量的量。比如,史瓦西时空下的固有时间$d\tau$和坐标时间$dt$的关系式为

\[d\tau=\frac{ids}{c}=\frac{1}{c}\sqrt{-g_{\mu\nu}dx^{\mu}dx^{\nu}}=\sqrt{-g_{00}}dt=(1-\frac{2GM}{c^2r})^{\frac{1}{2}}dt\]

可见,除去无穷远的情况($r\to\infty$),这两个时间都不相等,并且不同 $r$ 处的标准钟(固有)快慢也不相同,在相同的坐标时间间隔$\Delta t$内,不同处的标准钟将走过不同的固有时间间隔$\Delta\tau$。还有固有距离:

\[dl^2=\gamma_{ik}dx^{i}dx^{k}=(g_{ik}-\frac{g_{0i}g_{0k}}{g_{00}})dx^{i}dx^{k}\]

根据之前史瓦西度规中的参数没有时间$t$和方位角$\varphi$依赖,所以我们期待该度规有连续的时间平移不变性和关于方位角的旋转不变性,根据诺特定理,就会有两个守恒量,即能量和轨道角动量。从零测地线的变分原理,我们得到史瓦西度规下的拉格朗日量(Lagrangian),其中$\dot{x}^{\nu}=dx^{\nu}/d\lambda$是广义速度,$\lambda$是标量型参量。

\[L=-\frac{1}{2}g_{\alpha\beta}\dot{x}^{\alpha}\dot{x}^{\beta}=\frac{1}{2}[(1-\frac{2GM}{r})\dot{t}^2-(1-\frac{2GM}{r})^{-1}\dot{r}^2-r^2(\dot{\theta}^2-\sin^2{\theta}\dot{\varphi}^2)]\]

对于光子,不能选$\lambda$为$\tau$($ds=id\tau=0$),所以$L=0$,对于质点,选$\lambda$为$\tau$时,$L=\frac{1}{2}$。我们可以设一个$\eta=0(光子),1(质点)$,则$L=\eta/2$。史瓦西度规是静态球对称的,所以$\frac{\partial L}{\partial t}=\frac{\partial L}{\partial \varphi}=0$,则存在能量$E$和角动量$\tilde{L}$两个守恒量

\[E=\frac{\partial L}{\partial \dot{t}}=(1-\frac{2GM}{r})\frac{dt}{d\lambda}\] \[\tilde{L}=-\frac{\partial L}{\partial \dot{\varphi}}=r^2\sin^2{\theta}\frac{d\varphi}{d\lambda}\]

如果进一步假设行星的运行轨道是个落在赤道面的平面曲线,即$\theta=\pi/2$和$\dot{\theta}=0$,可化简角速度为$\tilde{L}=r^2\frac{d\varphi}{d\lambda}$。从这些式子可知

\[\left\{\begin{matrix} \frac{\mathrm{d} t}{\mathrm{d} \lambda}=E\cdot(1-\frac{2GM}{r})^{-1}\\ \frac{\mathrm{d} \varphi}{\mathrm{d} \lambda}=\frac{\tilde{L}}{r^2}\\ (\frac{\mathrm{d} r}{\mathrm{d} \lambda})^2=E^2-(1-\frac{2GM}{r})(\eta+\frac{\tilde{L}^2}{r^2}) \end{matrix}\right.\]

接下来,将着重介绍在史瓦西时空下,广义相对论预测的三大实验验证。

引力红移 (Gravitational redshift)

根据史瓦西度规的性质可知,$\frac{\partial g_{\mu\nu}}{\partial t}=0$,所以史瓦西时空是稳态的。假设在此时$P_1$和$P_2$两个空间点,$P_1$处的光源在坐标时刻$t_1$发出一个光信号,$P_2$处的观察者在坐标时刻$t_2$收到这个信号,定义时刻差$\delta t=t_2-t_1$。然后又再一次进行这个操作,有新的时刻差$\delta t’=t’_2-t’_1$。因为时空是稳态的,一定有$\delta t’=\delta t$,所以有$dt_2=t’_2-t_2=t’_1-t_1=dt_1$。然而这只是坐标时间相等,换做固有时间后,我们可得

\[\mathrm{d}{\tau_2}=\frac{\left.\sqrt{-g_{00}}\right|_{(2)}}{\left.\sqrt{-g_{00}}\right|_{(1)}} \mathrm{d}{\tau_1}\]

这就意味着,在$P_2$的观测者用静止的标准钟测量的固有时刻差不等,将史瓦西度规带入得

\[\mathrm{d} \tau_2=\sqrt{\frac{1-\frac{2 G M}{c^2 r_2}}{1-\frac{2 G M}{c^2 r_1}}} \mathrm{~d} \tau_1\]

当$r_1(太阳半径)<r_2(太阳到地球距离)$时,$d\tau_2>\tau_1$,即引力势大($r$小)的地方标准钟慢。比如,对于静止在太阳表面的标准钟来说,地球上的标准钟要走得快了许多。但是位于两地的钟,不能直接比较快慢,但可以用光谱线频率移动来验证钟速变化的理论。

原子发射的光谱线固有频率可类比为一个节拍器的振动,它的频率是$\nu=dN/d\tau$,$N$为振动次数。由于$P_1$和$P_2$测得振动次数是相同的,所以有$dN_1=\nu_1d\tau_1=\nu_2d\tau_2=dN_2$。加上上面的结论

\[\nu_2=\frac{\left.\sqrt{-g_{00}}\right|_{(2)}}{\left.\sqrt{-g_{00}}\right|_{(1)}}\nu_1=\sqrt{\frac{1-\frac{2 G M}{c^2 r_1}}{1-\frac{2 G M}{c^2 r_2}}}\nu_1\]

这个式子表明,由于稳态引力场中各个标准钟的速率不同,当光子从一点到另外一点时,两处观测者测得该光子的频率也不同,也就是说,引力会使光谱线进行红移或者蓝移。比如,静止于太阳表面的氢原子,发射的光子的固有频率应该与地球上的氢原子相同,但在地球上收到来自太阳的光子频率比地球上的要小,发生了红移。其原因归结于太阳表面的标准钟比地球的走得慢,移动的频率可以计算为,其中$\nu_0$是固有频率。

\[\Delta \nu=\nu-\nu_0=\nu_0\left[\left(1-\frac{2 G M}{c^2 r}\right)^{1 / 2}-1\right]\] \[Z=\frac{-\Delta\nu}{\nu_0}=\left[1-\left(1-\frac{2 G M}{c^2 r}\right)^{1 / 2}\right]\approx\frac{G M}{c^2 r}\]

该效应是广义相对论所预言的,但被各种天文观测和地面实验所证实。天文观测实验结果如下图,来源是 2011 年的《Nature》杂志

地面实验主要是利用穆斯堡尔(Mossbauer)效应的Pound–Rebka实验。具体做法是,把两个相同的放射源放置在同一垂线上,但高度不同,一个为$H_1$,另一个是$H_2$。从一个源发射$\gamma$射线,另一个源来吸收。二源的引力势差为$V=g(H_1-H_2)$,谱线的移动为

\[\frac{\Delta\nu}{\nu_0}=\frac{g}{c^2}\Delta H\]

当发射源位置低于吸收源($\Delta H<0$)时,$\nu<0$,得到红移。实验结果为,理论值为 4.92$\times$10-15,观测值为 4.92$\times$10-15$\times$(0.997$\pm$0.008)。接着,1976 年,通过一个在 10,000 公里高空的火箭里面的氢激光器,测试了引力红移精度到 0.007%。2018 年,同样的实验在欧洲伽利略偏心卫星上实现。2020 年,东京大学的一个小组在东京塔450米上,测量了两个锶87光学晶格钟的引力红移效应

光线偏折

光线偏折是爱因斯坦广义相对论给出的第一个预言,并很快在 1919 年由亚瑟·爱丁顿等人的日全食实验中得到了验证。实际上,从牛顿理论万有引力也可以得出光线偏折的结论,但预言值只有广义相对论的一半,而观测的结果支持了后者。下图为拍摄的 1919 年日食照片,1920 年刊登于论文当中。

从本章开头的守恒量可知,对于光子,$\eta=0$,所以有

\[\left\{\begin{matrix} \frac{\mathrm{d} t}{\mathrm{d} \lambda}=E\cdot(1-\frac{2GM}{r})^{-1}\\ \frac{\mathrm{d} \varphi}{\mathrm{d} \lambda}=\frac{\tilde{L}}{r^2}\\ (\frac{\mathrm{d} r}{\mathrm{d} \lambda})^2=E^2-(1-\frac{2GM}{r})(\frac{\tilde{L}^2}{r^2}) \end{matrix}\right.\]

联立后两个方程,根据链式求导法则($(\frac{dr}{d\lambda})^2=(\frac{dr}{d\varphi}\frac{d\varphi}{ d\lambda})=\tilde{L}^2\left [ \frac{\mathrm{d} }{\mathrm{d} \varphi}\frac{1}{r} \right ]^2$),可以得到光子在引力场中的轨道方程

\[\left [ \frac{\mathrm{d} }{\mathrm{d} \varphi}(\frac{1}{r}) \right ]^2=(\frac{E}{\tilde{L}})^2-\frac{1}{r^2}(1-\frac{2GM}{r})\]

然后方程两边让$u(\varphi)=1/r$,同时对$\varphi$求微分,于是方程简化为

\[2(\frac{\partial u}{\partial \varphi})(\frac{\partial^2 u}{\partial \varphi^2})=0-2u(\frac{\partial u}{\partial \varphi})+6GMu^2(\frac{\partial u}{\partial \varphi})\] \[\frac{\partial^2 u}{\partial \varphi^2}+u=3GMu^2\]

我们发现方程右边的$3GMu^2$是广义相对论的修正项,假定该方程的解分成两个$u=u_N+\tilde{u}$,其中$u_N$是不考虑广义相对论的经典解,$\tilde{u}$是考虑修正项后的微扰。所以$u_N$满足$\frac{\partial^2 u_N}{\partial \varphi^2}+u_N=0$,容易解得,$u_N=D\sin{\varphi}$和$r_N=\frac{1}{D\sin{\varphi}}=\frac{d}{\sin{\varphi}}$。其中$d=\frac{1}{D}$是光线与星体的距离,这恰好是极坐标下的水平直线方程。经典理论只假设物体通过质量这一内禀属性和外部引力场耦合到一起的,而光子质量是0,所以无法作用到万有引力里。下面考虑微扰$\tilde{u}$,注意到$\tilde{u}\ll u_N$

\[\frac{\partial^2 \tilde{u}}{\partial \varphi^2}+\tilde{u}\approx 3GMu_N^2=\frac{3GMD^2}{2}(1-\cos{2\varphi})\]

因为上述的微分方程已经线性形式,所以可以求得

\[\tilde{u}=\frac{3GMD^2}{2}(1+\frac{1}{3}\cos{2\varphi})\]

这样在考虑广义相对论修正后,总的解是

\[r(\varphi)=\frac{1}{u}\approx\frac{1}{D\sin{\varphi}+\frac{GMD^2}{2}(3+\cos{2\varphi})}\]

分母上的第二项破坏了光线直线传播的特性,因此光要走零短程线而不是直线,也就是光的传播路径会因太阳引力场而发生偏转。从下图可以看出,来自左侧遥远星系的红色光线,在路过原点附近时受到黑色星体引力场的作用,改变了成蓝色的偏折曲线。

下面我们就根据$r(\varphi)$的具体表达式定量地计算广义相对论的偏转角。第一步我们把上述的极坐标转化为直角坐标系下求解

\[1=Dy+\frac{GMD^2}{2}\sqrt{x^2+y^2}[3+\cos(2\tan^{-1}(\frac{y}{x}))]\]

为了求出从无穷远入射到无穷远出射这整个过程对应的偏转角,我们必须研究光线在正负无穷远处的渐进行为。因为在无穷远处的光线基本可以认为不受坐标原点引力场的影响,所以把它的传播轨迹近似成直线,即

\[y=kx+C,(x\to\pm\infty,\left| k \right| \ll 1)\]

其中$k$是直线斜率,因为广义相对论修正很微弱,$k$的值很小。把这个无穷远处的线性关系带入原来的式子可得,注意几个等价无穷小($\sqrt{1+x}\sim 1+\frac{1}{2}x$,$\tan^{-1}{x}=x$和$\cos{x}=1-\frac{x^2}{2}$)

\[1\approx Dkx+\frac{GMD^2}{2}(1+\frac{k^2}{2})\left| k \right|(4-2k^2)\]

解得$k\approx 2GMD=\frac{2GM}{d}$,而总偏转角为

\[\delta\theta=2\times k=\frac{4GM}{d}\Rightarrow \frac{4GM}{dc^2}\]

根据上述公式可以看出,当$d$最小时,偏转角$\delta\theta$的值最大,即偏转效应最明显。而$d$最小值只能取到星体的半径$R$,即光线恰好略过太阳表面的情形,否则它将被太阳吸收而无法观测到。代入已知的关于太阳的天文观测数据$R_{sun}=6.96\times10^5$km, $\frac{GM}{c^2}=1.48$km,计算可得

\[\delta\theta_{max}=\frac{4GM}{Rc^2}=4.873434\times 10^{-4} deg\approx 1.75''\]

1919 年时值日全食,因此能够观察到太阳附近的星星,由亚瑟·爱丁组织的两支观测队伍分别前往非洲几内亚海湾的普林西比岛和巴西北部的索布拉尔,非洲测出是$1.61’’$,而巴西是$1.98’’$,将理论预测值包含到区间里,而此后多年观测的平均值在$1.89’’$,与广义相对论基本符合。

水星近日点进动

在牛顿物理中,一个独立天体围绕一个带质量球体公转时,这二体系统会描绘出一个椭圆,带质量球体位于椭圆的焦点。两个天体最接近的那一点为近心点(围绕太阳的近心点为近日点),其位置固定。在太阳系中有若干效应导致行星的近日点有进动,围绕着太阳公转。这主要是因为行星不断对其他行星进行轨道上的摄动。另一个效应是因为太阳的扁椭球形状,但这只造成很小的影响。水星的实际轨迹和牛顿动力学所预测的有所偏差。水星轨道近日点的反常进动率最先于 1859 年由于尔班·勒威耶(Urbain Jean Joseph Le Verrier)在一个天体力学问题中发现。他分析了从 1697 年至 1848 年的水星凌日的时间纪录,并发现计算出的进动每100回归年便会和牛顿理论预测的相差 38 弧秒(之后由Simon Newcomb重新估计为 43 弧秒)。解释这偏差的一些论述通常都会带来更多的问题,比如可能存在另一个假设的行星,但这些最终都不能被学术界接受。而在广义相对论中,引力是由时空的弯曲造成的。这机制能够解释椭圆形轨道为什么会在轨道平面上改变取向,从而造成近日点的进动。爱因斯坦证明了广义相对论预测出的数值完全符合观测所得的近日点位移数值。这个有力的证据促使了广义相对论被学术界接受。我们注意到水星近日点的进动检测,其是$\frac{GM}{c^2r}$的二级效应,因此是广义相对论三大验证中最重要的那个。

与光子类似的三个守恒量,只不过对于质点来说$\eta=1$

\[\left\{\begin{matrix} \frac{\mathrm{d} t}{\mathrm{d} \lambda}=E\cdot(1-\frac{2GM}{r})^{-1}\\ \frac{\mathrm{d} \varphi}{\mathrm{d} \lambda}=\frac{\tilde{L}}{r^2}\\ (\frac{\mathrm{d} r}{\mathrm{d} \lambda})^2=E^2-(1-\frac{2GM}{r})(1+\frac{\tilde{L}^2}{r^2}) \end{matrix}\right.\]

与上一个同理,即让方程两边让$u(\varphi)=1/r$,同时对$\varphi$求微分,于是简化为整理得

\[2(\frac{\partial u}{\partial \varphi})(\frac{\partial^2 u}{\partial \varphi^2})=0-2u(\frac{\partial u}{\partial \varphi})-0+6GMu^2(\frac{\partial u}{\partial \varphi})+2(\frac{\partial u}{\partial \varphi})\frac{GM}{\tilde{L}^2}\] \[\frac{\partial^2 u}{\partial \varphi^2}+u=3GMu^2+\frac{GM}{\tilde{L}^2}\]

容易发现方程右边比光子的方程多了一项传统牛顿力学的$\frac{GM}{\tilde{L}^2}$项。如果我们像像牛顿一样只保留这一项的话,方程为

\[\frac{\partial^2 u}{\partial \varphi^2}+u=\frac{GM}{\tilde{L}^2}\]

它的解就是行星运动轨道的曲线,解得一个极坐标下的圆锥方程,偏心率是$e$,当$e=0$时对应圆轨道,当$0<e<1$时对应椭圆轨道,$e=1$时对应抛物线轨道,$1<e<\infty$时对应双曲线轨道。因为我们现在考虑的是一个稳定的行星运动轨道,所以只能取$0<e<1$,即一个封闭的椭圆轨道。这与牛顿引力理论和开普勒的行星运动定律给出的结论是完全一致的。

\[r=\frac{1}{u}=\frac{\tilde{L}^2}{GM}\frac{1}{1+e\cos{\varphi}}\]

下面考虑微扰$\tilde{u}$,注意到$\tilde{u}\ll u_N$

\[\frac{\partial^2 \tilde{u}}{\partial \varphi^2}+\tilde{u}\approx 3GMu_N^2=\frac{3G^3M^3}{\tilde{L}^4}(1+e\cos{\varphi})^2\]

化简整理得

\[\frac{\partial^2 \tilde{u}}{\partial \varphi^2}+\tilde{u}=\frac{3G^3M^3}{\tilde{L}^4}[(1+\frac{e^2}{2})+2e\cos{\varphi}+\frac{e^2}{2}\cos{2\varphi}]\]

注意到方程右端由平方展开后的交叉项$\cos{\varphi}$将导出水星轨道进动效应!因为上述微分方程是二阶非齐次线性微分方程的形式,所以可以利用叠加原理得到上述微分方程的解是

\[\tilde{u}=\frac{3G^3M^3}{\tilde{L}^4}[(1+\frac{e^2}{2})+e\varphi\sin{\varphi}-\frac{e^2}{6}\cos{2\varphi}]\]

所以在考虑了广义相对论修正后,总的解$u$是牛顿解$u_N$和微扰$\tilde{u}$之和:

\[u=u_N+\tilde{u}\approx\frac{GM}{\tilde{L}^2}(1+e\cos{\varphi})+\frac{3G^3M^3}{\tilde{L}^4}[(1+\frac{e^2}{2})+e\varphi\sin{\varphi}-\frac{e^2}{6}\cos{2\varphi}]\]

根据和角公式和三角函数的泰勒展开,忽略高阶项($e^2$和$(\frac{3G^2M^2}{\tilde{L}^2}\varphi$)^2)可以得到

\[u\approx\frac{GM}{\tilde{L}^2}[1+e\cos{((1-\frac{3G^2M^2}{\tilde{L}^2})\varphi)}]=\frac{GM}{\tilde{L}^2}+\frac{GMe}{\tilde{L}^2}[\cos{\varphi}(1-\frac{1}{2}(\frac{3G^2M^2}{\tilde{L}^2}\varphi)^2)+\frac{3G^2M^2}{\tilde{L}^2}\varphi\sin{\varphi}]\]

所以极坐标下的轨道方程为

\[r(\varphi) \approx \frac{\tilde{L}^2 / G M}{1+e \cos \left(\left(1-\frac{3 G^2 M^2}{\tilde{L}^2}\right) \varphi\right)}\]

根据公式我们知道,行星轨道上任一点转动$\varphi=2\pi$后,都回不到相对应的“原位置”上,而必须再转过一个小角度,因为$u$的周期$T$不再是$\varphi=2\pi$,而是$T=\frac{2\pi}{1-\frac{3 G^2 M^2}{\tilde{L}^2}}$。对它进行作图如下,静止的是原先牛顿引力理论下行星围绕恒星运动的封闭椭圆轨道和移动的黄线是广义相对论下行星围绕恒星运动的类椭圆轨道近日点的进动。可以看出此时的轨道并不是封闭曲线!

下面我们根据$r(\varphi)$的具体表达式定量地计算轨道近日点的进动角。在轨道近日点处,行星离恒星的径向距离$r(\varphi)$最小,所以:

\[\left(1-\frac{3 G^2 M^2}{\tilde{L}^2}\right) \varphi=2 n \pi, n=0,1,2, \cdots\]

所以相邻两个周期间近日点的进动角度是:

\[\delta \varphi=\varphi_{n+1}-\varphi_n-2 \pi \approx 2 \pi\left(1+\frac{3 G^2 M^2}{\tilde{L}^2}\right)-2 \pi=\frac{6 \pi G^2 M^2}{\tilde{L}^2}\]

然后利用牛顿引力理论里封闭椭圆轨道角动量的结果,a是椭圆半长轴。

\[\tilde{L}^2=G M\left(1-e^2\right) a\]

代入上面进动角的公式得到

\[\delta \varphi=\frac{6 \pi G M}{(1-e^2)a}\Rightarrow \frac{6 \pi G M}{(1-e^2)ac^2}\]

根据上述公式可以看出:离太阳较近($a$较小)且离心率$e$较大的行星对应的进动角值较大便于观测。所以下面我们选择离太阳最近的水星为例计算一下每100年(一个世纪)由广义相对论效应带来的水星轨道近日点的进动角。将如下已知的关于水星和太阳的天文观测数据代入上述进动角的公式

\[a=5.79\times 10^{12} cm, e=0.2056, \frac{GM_{sun}}{c^2}=1.48\times 10^{5} cm\]

求得水星绕太阳一圈的进动角:

\[\delta \varphi=5.030855\times 10^{-7} rad/orbit=2.883468\times 10^{-5} deg/orbit=0.103769''/orbit\]

根据天文观测,水星每88天就会绕太阳一圈。所以我们容易换算出每个世纪(100年)水星的进动角是:

\[\delta \varphi=0.103769''\times \frac{365}{88}\times 100/century=43.04048''/century\]

所以我们最终得出广义相对论效应会导致水星轨道近日点每100年(一个世纪)约进动$43’‘$的角度,理论上终于解决了这个遗留许久的难题。爱因斯坦在算出与观测值精确相符的进动值后,欣喜若狂,他在给朋友的信中写道:“方程给出的水星近日点的正确数字,你可以想象我有多么高兴!有好些天,我高兴得不知怎样才好。”

Reference

  1. 《Subtle Is the Lord: The Science and the Life of Albert Einstein》 Abraham Pais 1982
  2. A Brief Outline of the Development of the Theory of Relativity》Einstein 1921
  3. 《广义相对论基础》 赵峥