前言
“The testimony of the ages confirms that the motions of the planets are orbicular. It is an immediate presumption of reason, reflected in experience, that their gyrations are perfect circles. For among figures it is circles, and among bodies the heavens, that are considered the most perfect. However, when experience is seen to teach something different to those who pay careful attention, namely, that the planets deviate from a simple circular path, it gives rise to a powerful sense of wonder, which at length drives men to look into causes.” ——Johannes Kepler, Chapter 1 of the Astronomia Nova (Donahue translation, p.115)
01
在德国东南部,多瑙河畔,坐落着世界文化遗产,德国最古老的城市之一雷根斯堡 (Regensburg)。这里曾是神圣罗马帝国议会所在地,皇帝经常驾临此地,主持会议。哥特式老市政厅里有个帝国厅,前面设有华盖御座,专供皇帝使用;御座两边的座席为选帝侯们所设。一般诸侯或自由市代表,则分坐两列长条椅。游人身临其境,不难想象数百年前,诸侯们在此论政议政的场面。而就在老市政厅西北处,有一幢普通民居,是皇家天文学家约翰内斯·开普勒 (Johannes Kepler) 住过的地方。1630年,开普勒亲自前来雷根斯堡向皇家索取欠薪,但不幸病死在这幢房屋里,现辟为开普勒纪念馆。然而,弥留之际的开普勒能否想象到,他所开创的三条行星运动定律会被后人铭记,一直流传至今。
1571年12月27日,开普勒出生于符腾堡 (Württemburg) 的一个小镇魏尔德施达特 (Weil der Stadt,在斯图加特以西20多公里),其半木结构故居已辟为开普勒博物馆,市政厅前竖立着他的塑像。他自幼是个体弱多病的孩子, 家境也不富裕。但是凭借着聪明才智,他获得了蒂宾根大学 (University of Tübingen) 的奖学金,进而在那里第一次接触到哥白尼 (Copernicus) 的“日心说 (Heliocentrism) ”思想,并被深深地吸引。随后,开普勒搬到布拉格与著名的丹麦天文学家第谷·布拉赫 (Tycho Brahe) 一起工作。不幸地是,第谷于1601年去世,接着开普勒不但继承了第谷作为帝国数学家的职位,而且还获赠第谷一生精心观测的天文资料。这些当时最精确的天文资料数据,对开普勒来说,真是无价之宝。他现在要做的,就是对这些数据进行仔细分析,建立数学模型,并用这些数据来检验。可是无论是按地心学说、还是哥白尼理论,乃至第谷的理论,都不能算出与这些观测数据相符合的结果。最后,开普勒发现了症结所在,原来这些学说都假定行星的轨道是圆的,并且匀速运动。而事实上,数学基础深厚的他发现,行星的轨道却是椭圆的,行星速度也在变化。在发现了基本的解决方法后,开普勒仍须花几个月的时间进行复杂的数学运算,以确定他的理论与第谷的观察是否符合。终于在1609年,他总结第谷收集的精确数据,出版了《新天文学》 (Astronomia Nova)。在这本传奇著作里,他提出了第一和第二开普勒定律。
之后,开普勒被迫离开布拉格,搬到了奥地利林茨,期间并没有停止思考,而是于1619年发表了《世界的和谐》 (Harmonices Mundi),继往开来地提出了开普勒第三定律。紧接着在1621年,《天文学的缩影》 (Epitome Astronomiae) 问世。作为其最有影响力的著作,在这本书里他系统地讨论了所有关于日心说的天文学知识。例如,他继续制作第谷很久以前构想的鲁道夫星历表 (Rudolphine Tables)。开普勒使用这些表格成功预测了1631年11月7日有水星凌日现象。尽管他没能亲眼目睹这些事件,但后来在预言的日期,巴黎的天文学家观测到水星通过日面。
开普勒是一个极其坚强的人。他的一生是顽强地与贫穷和疾病斗争的一生。科学史家说:“第谷身后有国王,伽利略的后面有公爵,牛顿后面有政府,而开普勒只有疾病和贫困。”就是这位在贫穷与疾病中苦苦挣扎的伟人,在科学史上做出了不可磨灭的贡献。牛顿曾经说过:“如果我能比别人看得更远的话,这是因为我是站在巨人的肩膀上。”毫无疑问,开普勒就是他所提到的巨人之一。从牛顿的万有引力定律和牛顿运动定律也可以推导出开普勒定律,而这也是我写下本文的原因。
02
开普勒当时主要是研究火星的轨迹,以事后来看,这是一个幸运的选择,因为火星恰好拥有除水星外的所有行星的最高离心率 (eccentricity)。在这个章节,我粗略地介绍几种前开普勒时期的行星运动模型。在那时,没有明确的物理学标准来辨别这些模型中的哪一个更完美地对应于实际的物理宇宙。每个模型都可以用来预测未来几年天空中行星的经度和纬度。但随着时间的推移,所有这些模型都变得不那么准确。
Geocentrism
古埃及天文学家克劳迪乌斯·托勒密 (Claudius Ptolemy,公元 90 年至公元 180 年) 的以地球为中心的模型主导了欧洲天文学长达十五个世纪。托勒密相信太阳和行星围绕地球运行,并通过他称之为”本轮” (epicycle, 源自古希腊语:ἐπίκυκλος,字面是在圆之上,意思是在另一个圆圈之上运动的圆圈) 的旋转轮来解释行星的不规则运动。
如上图,在托勒密系统中,假设行星在一个称为本轮 (epicycle)的小圆圈轨道上匀速转动,而小圆圈又沿着一个称为均轮 (deferent)的较大圆圈轨道上匀速转动。这两个圆都大致平行于太阳的轨道平面,即黄道,顺时针旋转。尽管这个系统被认为是以地球为中心,但每颗行星的运动不是以地球为中心,而是以地球稍远,称为偏心 (eccentric)的一个点为中心。图中展示了托勒密天文学的基本元素,显示一颗行星在本轮上(小的虚线圆)、一个均轮(大的虚线圆)、偏心(X)和均衡点(大的黑点 •)。
在这个系统中,行星的轨道与外旋轮线(epitrochoid)相似。完整的行星路径如下图,它形成一个循环。
Heliocentrism
波兰政治家和数学家尼古拉斯·哥白尼 (Nicholas Copernicus) 于1543年发表了一个模型,其中他断言太阳位于行星系统的中心。因为随着观测技术的进步,人们慢慢发现需要很多个本轮均轮甚至小本轮才能解释观察到的现象。这使得坚持简洁的哥白尼对托勒密的系统产生了怀疑。为了简化理论,更好的符合实际观测的结果。哥白尼将不动点从地球移动到了太阳上,提倡日心说。他指出地球不是宇宙的中心,而是同五大行星一样围绕太阳这个不变的中心运行的普通行星,其自身又以地轴为中心自转。具体表现为,哥白尼以托勒密没有严格遵守匀速圆周运动为由,用第二个“本轮”取代了被称为托勒密的单个“本轮”。开普勒曾写道,哥白尼”力求在运动的一致性方面超越托勒密,但在行星路径的完美和优雅上,他却搞砸了”。这意味着,某种意义上,托勒密的模型在数学方面更简单。
值得一提的是,哥白尼和托勒密都不约而同地认为行星必须由完美的圆组成,必须符合亚里士多德形而上学的戒律。尽管在断言太阳在行星系统中的中心位置方面取得了概念上的突破,但哥白尼的模型在计算行星在天空中的位置方面并不比托勒密天文学更准确——主要是因为哥白尼事实上是使用了托勒密多年的观测数据来建立他的系统。
Tychonic system
开普勒的良师第谷·布拉赫,这位古怪的丹麦贵族和天文学家,他汇编了大量的的天文数据,开发并推广了他自己的宇宙模型——一种介于托勒密和哥白尼之间的中间道路。在他的假设中,有行星围绕太阳运行,但太阳围绕地球的“本轮”均匀旋转。下图展示了,在布拉赫看来,太阳是如何像托勒密行星的“本轮”一样运作的。
03
言归正传,我会在这个章节中,用尽可能简单的方式来推导开普勒三定律。难免地,一些成熟现代的结论会被使用,即便在开普勒的时代这些都没有被发明,这样做的目的是降低推导的理解难度。有不对的地方,欢迎指正。
在这里,我在推导开普勒第一定律之前,必须先行推导出开普勒第二定律,因为开普勒第一定律可能需要用到开普勒第二定律里的一些计算结果。
开普勒第二定律
开普勒第二定律,也称为等面积定律:在相等时间内,太阳和运动着的行星的连线所扫过的面积都是相等的。这一定律实际揭示了行星绕太阳公转的角动量守恒。
牛顿万有引力定律表明,任意两个粒子由通过连线方向的力相互吸引。该引力的的大小与它们的质量乘积成正比,与它们距离的平方成反比。由于太阳超重于行星,可以假设太阳是固定的。用方程表示,注意粗体表示向量,
\[\mathbf{F}=-G\frac{mM}{r^2}\mathbf{\hat{r}}\]这里, $\mathbf{F}$是太阳作用于行星的万有引力,$m$是行星的质量,$M$是太阳的质量,$\mathbf{r}$是行星相对于太阳的位移矢量,$\mathbf{\hat{r}}$是$\mathbf{r}$的单位矢量。牛顿第二定律表明,物体受力后所产生的加速度$\mathbf{\ddot{r}}$,和其所受的合力$\mathbf{F}$成正比,和其质量$m$成反比,以方程表示,\(\mathbf{F}=m\mathbf{\ddot{r}}\)。合并这两个方程得到
\[\mathbf{\ddot{r}}=-G\frac{M}{r^2}\mathbf{\hat{r}} \tag{1}\]考虑到位置矢量的定义$\mathbf{r}=r\mathbf{\hat{r}}$,对于时间$t$微分一次得到速度矢量,两次得到加速度矢量:
\[\mathbf{\dot{r}}=\dot{r}\mathbf{\hat{r}}+r\dot{\theta}\boldsymbol{\hat{\theta}}\] \[\mathbf{\ddot{r}}=(\ddot{r}\mathbf{\hat{r}}+\dot{r}\frac{\mathrm{d\mathbf{\hat{r}}} }{\mathrm{d} t})+(\dot{r}\dot{\theta}\boldsymbol{\hat{\theta}}+r\ddot{\theta}\boldsymbol{\hat{\theta}}+r\dot{\theta}\frac{\mathrm{d}\boldsymbol{\hat{\theta}} }{\mathrm{d} t})=(\ddot{r}-r\dot{\theta}^2)\mathbf{\hat{r}}+(r\ddot{\theta}+2\dot{r}\dot{\theta})\boldsymbol{\hat{\theta}} \tag{2}\]在这里,需要复习一下极坐标中单位矢量的导数,
\[\frac{\mathrm{d\mathbf{\hat{r}}} }{\mathrm{d} t}=\dot{\theta}\boldsymbol{\hat{\theta}}\] \[\frac{\mathrm{d\boldsymbol{\hat{\theta}}} }{\mathrm{d} t}=-\dot{\theta}\mathbf{\hat{r}}\]简单联立方程(1)和(2),可以得到矢量的运动方程:
\[(\ddot{r}-r\dot{\theta}^2)\mathbf{\hat{r}}+(r\ddot{\theta}+2\dot{r}\dot{\theta})\boldsymbol{\hat{\theta}}=-\frac{GM}{r^2}\mathbf{\hat{r}}\]接着取各个分量,可以得到两个微分方程,一个是关于径向加速度的,另一个则是关于切向加速度的:
\[\ddot{r}-r\dot{\theta}^2=-\frac{GM}{r^2} \tag{3}\] \[r\ddot{\theta}+2\dot{r}\dot{\theta}=0 \tag{4}\]然而推导开普勒第二定律只需要切向加速度方程。根据行星的角动量定义$\ell=mr^2\dot{\theta}$,再由方程(4)可知角动量对于时间的导数为0,即角动量守恒:
\[\dot{\ell}=mr(r\ddot{\theta}+2\dot{r}\dot{\theta})=0\]所以即使距离r和角速度$\dot{\theta}$可能随时间不断变化,相同时间从$t_1$到$t_2$扫过的扇形面积$\Delta A$:
\[\Delta A = \int_{t_1}^{t_2}\frac{1}{2}\cdot r\cdot r\dot{\theta}\cdot dt=\int_{t_1}^{t_2}\frac{\ell}{2m}dt=\frac{\ell}{2m}\cdot(t_2-t_1)\]易证得,行星和太阳连线扫过的区域面积只与间隔时间$t_2-t_1$。所以,开普勒第二定律成立。
开普勒第一定律
开普勒的第一定律,也称为椭圆定律、轨道定律:每一个行星都沿各自的椭圆轨道环绕太阳,而太阳则处在椭圆的一个焦点中。
首先我们假定$u=\frac{1}{r}$。这样,角速度就为:
\[\dot{\theta}=\frac{\ell}{mr^2}=\frac{\ell u^2}{m}\]做一些简单的变化可知,对时间微分和对角度微分有如下的关系:
\[\frac{\mathrm{d} }{\mathrm{d} t}=\frac{\mathrm{d} \theta}{\mathrm{d} t}\frac{\mathrm{d} }{\mathrm{d} \theta}=\dot{\theta}\frac{\mathrm{d} }{\mathrm{d} \theta}=\frac{\ell u^2}{m}\frac{\mathrm{d} }{\mathrm{d} \theta}\]根据上述关系,径向距离$r=\frac{1}{r}$对时间的导数就为:
\[\dot{r}=\frac{\ell u^2}{m}\frac{\mathrm{d} }{\mathrm{d} \theta}\frac{1}{u}=-\frac{\ell u^2}{m}\frac{1}{u^2}\frac{\mathrm{d} u}{\mathrm{d} \theta}=-\frac{\ell}{m}\frac{\mathrm{d} u}{\mathrm{d} \theta}\]再求一次导数:
\[\ddot{r}=\frac{\ell u^2}{m}\frac{\mathrm{d} \dot{r}}{\mathrm{d} \theta}=\frac{\ell u^2}{m}\frac{\mathrm{d} }{\mathrm{d} \theta}(-\frac{\ell}{m}\frac{\mathrm{d} u}{\mathrm{d} \theta})=-\frac{\ell^2u^2}{m^2}\frac{\mathrm{d}^2 u}{\mathrm{d} \theta^2}\]代入到径向运动方程(3),即$\ddot{r}-r\dot{\theta}^2=-\frac{GM}{r^2} $
\[-\frac{\ell^2u^2}{m^2}\frac{\mathrm{d}^2 u}{\mathrm{d} \theta^2}=-GMu^2\]方程两边同时除以$-\frac{\ell^2u^2}{m^2}$,我们便得到一个简单的常系数非齐次线性微分方程来描述行星轨迹:
\[\frac{\mathrm{d}^2 u}{\mathrm{d} \theta^2}+u=\frac{GMm^2}{\ell^2}\]为了解这个微分方程,先列出一个特解
\[u=\frac{GMm^2}{\ell^2}\]再求解剩余的常系数齐次线性微分方程
\[\frac{\mathrm{d}^2 u}{\mathrm{d} \theta^2}+u=0\]它的解为
\[u=C\cos({\theta-\theta_0})\]这里,C与$\theta_0$是常数。合并特解和齐次方程的解,可以得到通解:
\[u=C\cos({\theta-\theta_0})+\frac{GMm^2}{\ell^2}\]选择合适的坐标轴,使得$\theta_0=0$,并代回$u=\frac{1}{r}$,
\[\frac{1}{r}=\frac{GMm^2}{\ell^2}(1+e\cos{\theta})\]其中,$e=C\ell^2/GMm^2$是离心率。而方程是圆锥曲线的极坐标方程,坐标系原点是圆锥曲线的焦点之一。
开普勒第三定律
开普勒第三定律,也称为周期定律:各个行星绕太阳公转周期的平方和它们的椭圆轨道的半长轴的立方成正比。
开普勒第一定律阐明,行星环绕太阳的轨道是椭圆形的。椭圆的面积是$\pi ab$;这里,a与b分别为椭圆的半长轴与半短轴。在开普勒第二定律推导里,行星-太阳连线扫过区域速度$ \frac{\mathrm{d} A}{\mathrm{d} t}$为
\[\frac{\mathrm{d}A}{\mathrm{d}t}=\frac{\ell}{2m}\]所以,行星公转周期$\tau$为
\[\tau=\frac{2m\pi ab}{\ell}\]关于行星环绕太阳,由椭圆几何可知,椭圆的半长轴a,半短轴b与近拱距$r_A$(近拱点A与引力中心之间的距离,即2-3),远拱距$r_B$(远拱点B与引力中心之间的距离,即1-3)的关系分别为:
\[a=\frac{r_A+r_B}{2}\] \[b=\sqrt{r_A r_B}\]如果想知道半长轴和半短轴,必须见先求得近拱距和远拱距。依据能量守恒定理:
\[E=\frac{1}{2}m\dot{r}^2+\frac{1}{2}mr^2\dot{\theta}^2-G\frac{mM}{r}\]在近拱点A和远拱点B,径向速度都等于零,即$\dot{r}=0$, 所以
\[E=\frac{1}{2}mr^2\dot{\theta}^2-G\frac{mM}{r}=\frac{\ell^2}{2mr^2}-G\frac{mM}{r}\]稍加整理可得一个关于r的一元二次方程:
\[r^2+\frac{GmM}{E}r-\frac{\ell^2}{2mE}=0\]其中两个根分别就是椭圆轨道的近拱距$r_A$与远拱距$r_B$
\[r_A=-\frac{\frac{GmM}{E}-\sqrt{(\frac{GmM}{E})^2+\frac{2\ell^2}{mE}}}{2}\] \[r_B=-\frac{\frac{GmM}{E}+\sqrt{(\frac{GmM}{E})^2+\frac{2\ell^2}{mE}}}{2}\]所以半长轴和半短轴为
\[a=-\frac{GmM}{2E}\] \[b=\frac{\ell}{\sqrt{-2mE}}=\frac{\ell}{m}\frac{\sqrt{a}}{\sqrt{GM}}\]代入方程(5),行星公转周期$\tau$为
\[\tau^2=\frac{4\pi^2 a^{3}}{GM}\]证毕。
04
中国古代天文和历法是密切联系在一起的。元代天文学家郭守敬通过大量天文观测和研究,编制出中国古代最精良的历法《授时历》。1281年颁行,一直使用了近400年到明末,是中国使用最久的历法。《授时历》从数学上看也是把地球绕日轨道作为圆形看待的,但用内插法做了一些矫正。椭圆作为一种特殊的曲线,在我国古代没有专门的研究。后来我国出现的关于椭圆的知识基本上都是明末清初时期从西方逐渐传进来的。当时第一个给我们带来椭圆知识的人是意大利传教士利玛窦。他于1583年来中国,1594年给国人展示了一幅世界地图,这幅地图采用的方法是投影法,外表是个标准的椭圆。有明一代(1368-1644),可以说是中国天文学发展的一个低潮,而正好对应欧洲天文学蓬勃发展时期。直到明末,徐光启在汤若望等传教士的参与下,于1634年编制出《崇祯历书》,其中采用了第谷的宇宙体系。清灭明后,将此历法改名《时宪历》,一直使用到18世纪中叶。直到1760年,才有法国传教士蒋友仁(Michel Benoist,1715-1774,圆明园人工喷泉的设计者,曾主持补充康熙的《皇舆全图》)向乾隆皇帝献《坤舆全图》,并介绍了哥白尼日心说和开普勒定律。但未引起官方重视。中国人真正了解哥白尼学说和开普勒定律,则是在1859年李善兰(1811-1882)与英国伟烈亚力(Alexander Wylie,1815—1887)合译《谈天》(英国天文学家J. F.赫歇耳原著《天文学纲要》)。这时已是开普勒学说发表两个半世纪以后。中国虽然起步很晚才迈入近代天文学,但近几十年来急起直追,无论是在天文学或航天方面都取得了举世瞩目的成就。
Appendix - 极坐标下单位矢量的求导
如果令极轴方向的单位矢量为$\mathbf{\hat{x}}$,令其逆时针旋转$\pi/2$的矢量为$\mathbf{\hat{y}}$,则
\[\mathbf{\hat{r}}=\cos{\theta}\mathbf{\hat{x}}+\sin{\theta}\mathbf{\hat{y}}\] \[\boldsymbol{\hat{\theta}}=\cos{(\theta+\pi/2)}\mathbf{\hat{x}}+\sin{(\theta+\pi/2)}\mathbf{\hat{y}}=-\sin{\theta}\mathbf{\hat{x}}+\cos{\theta}\mathbf{\hat{y}}\]事实上,$\mathbf{\hat{r}}$和$\boldsymbol{\hat{\theta}}$都只是$\theta$的函数,所以易得:
\[\frac{\mathrm{d\mathbf{\hat{r}}} }{\mathrm{d} t}=\dot{\theta}\boldsymbol{\hat{\theta}}\] \[\frac{\mathrm{d\boldsymbol{\hat{\theta}}} }{\mathrm{d} t}=-\dot{\theta}\mathbf{\hat{r}}\]以及它们的偏导
\(\left\{\begin{matrix}\begin{align} & \frac{\partial \mathbf{\hat{r}}}{\partial r}=0\\ & \frac{\partial \mathbf{\hat{r}}}{\partial \theta}=-\sin{\theta}\mathbf{\hat{x}}+\cos{\theta}\mathbf{\hat{y}}=\boldsymbol{\hat{\theta}} \end{align}\end{matrix}\right.\) \(\;\;\;\;\;\;\) \(\left\{\begin{matrix}\begin{align} & \frac{\partial \boldsymbol{\hat{\theta}}}{\partial r}=0\\ & \frac{\partial \boldsymbol{\hat{\theta}}}{\partial \theta}=-\cos{\theta}\mathbf{\hat{x}}-\sin{\theta}\mathbf{\hat{y}}=-\mathbf{\hat{r}} \end{align}\end{matrix}\right.\)
Reference
- https://www.keplersdiscovery.com/index.html
- Wikipedia